Загрузка...

Qwen TTS - обучение, клонирование, кастомизация голоса

Qwen TTS - это модель для преобразования текста в речь. Qwen TTS имеет лучшее качество, высокую скорость и низкое потребление VRAM (7 ГБ на старшей модели). Качество сравнимо с платными аналогами ElevenLabs и MiniMax. В этом видео вы узнаете: как преобразовать текст в речь, как клонировать голос, как кастомизировать голос, как записать голос и даже как обучить модель Qwen TTS (fine-tune qwen tts). Все это будет работать в comfyui.

МЕНЮ
00:00 - Что такое Qwen TTS
00:40 - Обзор Qwen TTS
02:45 - Установка Qwen 3 TTS в ComfyUI
03:32 - Базовые схемы Qwen TTS
04:32 - Клонирование голоса с Qwen3 TTS
08:00 - Коллекция голосов Qwen TTS
10:46 - Disign Voice - создание своего голоса
11:45 - Multi speaker - озвучка с несколькими спикерами
20:05 - Обучение модели Qwen TTS - Fine tune model
21:36 - Wisper для транскрибации аудио - audio to text
33:56 - Выводы

Сборку ComfyUI можно скачать бесплатно тут:
https://boosty.to/stabledif/posts/c64c559f-1357-432b-b7c6-19c1f7eb8882

🔥 Мой структурированный курс по "ComfyUI" с моей поддержкой на сайте https://stabledif.ru/comfyui
🔥 Мой структурированный курс по "AUTOMATIC 1111" с моей поддержкой на сайте https://stabledif.ru

🔑 Все ссылки и файлы доступны на Boosty:
https://boosty.to/stabledif/posts/0c37a7ee-cc89-4710-a239-9a8cb97790a1

✔️Телеграм-канал: https://t.me/stabledif_lesson
✔️ Telegram ЧАТ: https://t.me/stable_dif
✔️VK Prompts: https://vk.com/stabledif

Видео Qwen TTS - обучение, клонирование, кастомизация голоса канала StableDif
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять