Платформа Yandex Cloud дополнилась новым сервисом для синтеза речи Brand Voice Call Center / ServerNews

Платформа Yandex Cloud дополнилась новым сервисом для синтеза речи Brand Voice Call Center

07.03.2023 [16:50], Андрей Крупин

Облачная платформа Yandex Cloud представила новый сервис для синтеза речи Brand Voice Call Center.

Brand Voice Call Center разработан специально для автоматизации колл-центров и других задач бизнеса, предполагающих повсеместное использование телефонных звонков (телемаркетинг, приём звонков первой линии, опросы). В основу решения положены технологии машинного обучения и системы искусственного интеллекта на базе нейронных сетей, позволяющие сервису генерировать аудио с уникальным голосом по одной фразе.

Алгоритм обрабатывает аудиошаблон и на его основе синтезирует сотни таких же фраз, но при этом по скрипту может менять в них отдельные слова. Синтезированная речь в Brand Voice Call Center звучит естественно и передаёт все детали речи живого человека из шаблона: эмоции, интонации, изменения громкости. В качестве шаблонов компании могут использовать фрагменты телефонных записей реальных операторов своих колл-центров. Утверждается, что это первый подобный сервис на русском языке, выпущенный для коммерческого использования.

Для обучения Brand Voice Call Center специалисты Yandex Cloud использовали датасет с тысячами часов записей различных дикторов на русском языке из открытого доступа. Подобный опыт позволяет работать практически с любым голосом без предварительной подготовки. Чтобы речь звучала более естественно, для обучения моделей в сервисе использовали трансформерную архитектуру. В отличие от других нейронных сетей, трансформеры позволяют обучать ML-модели параллельно на современных видеокартах (GPU) и концентрироваться на важных частях текста, что повышает качество синтеза.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Материалы по теме:

Источник:

Постоянный URL: https://servernews.ru/1083024