Распознавание и синтез речи. Классические методы распознавания речи – М. Ф. Аль-Шедиват
В данной лекции вы узнаете про классические методы распознавания и параметрического синтеза речи.
Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны как генеративные (основанные на смесях Гауссиан [GMM]), так и дискриминативные (основанные на глубоких нейронных сетях [DNN] со стандартной кросс-энтропийной [CE] функцией потерь) подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью.
В области синтеза речи лектор вкратце затрагивает лишь один из множества подходов к решению данной задачи, основанный на рекуррентных нейронных сетях [RNN].
Видео Распознавание и синтез речи. Классические методы распознавания речи – М. Ф. Аль-Шедиват канала Компьютерные науки
Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны как генеративные (основанные на смесях Гауссиан [GMM]), так и дискриминативные (основанные на глубоких нейронных сетях [DNN] со стандартной кросс-энтропийной [CE] функцией потерь) подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью.
В области синтеза речи лектор вкратце затрагивает лишь один из множества подходов к решению данной задачи, основанный на рекуррентных нейронных сетях [RNN].
Видео Распознавание и синтез речи. Классические методы распознавания речи – М. Ф. Аль-Шедиват канала Компьютерные науки
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
Что такое операционная система и как она работает23. Распознавание речи (speech2text)Синтез речи с помощью глубокого обученияНейронная сеть. Часть 5. Простые эксперименты.Медленная и простая английская разговорная практика — для начинающихКак обмануть нейросеть?Модуль распознования речи Voice Recognition Module v3 1 и подключение его к ArduinoПрезентация книги «Красная таблетка. Посмотри правде в глаза!»Интернет Вещей: теория и практикаПрактическое введение в нейронные сети и глубокое обучение. Часть 31100 Основные английские фразы для разговораУГРОЗА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА01. ИИ без булшита – Александр КрайновSpace Engineers: Роторная пушка. Генерируем датасет для обучения нейросети в Python.Распознавание речиВ. Бабушкин - Uplift моделирование.Deep Learning на пальцах 11 - Аудио и распознавание речи (Юрий Бабуров)Распознавание речи: как сделать Speech-to-Text своими руками / Иван Бондаренко (МФТИ)Автоматическая генерация контента с помощью Python