CNews Cloud: Облачные сервисы

Yandex.Cloud запустила сервис для создания фирменных голосов компаний

Облака

Облачная платформа Yandex.Cloud представила новый сервис для создания фирменных голосов Yandex SpeechKit Brand Voice. Теперь компании смогут создать свой собственный уникальный голос не только для реализации сложных диалоговых сценариев с клиентами и разработки голосовых помощников вроде «Алисы», но и для автоматизации работы колл-центров, проведения опросов, телемаркетинга и контроля качества.

Yandex SpeechKit Brand Voice разработан на базе речевых ML-моделей, которые обучаются с использованием записей голоса реального человека. В итоге с помощью искусственного интеллекта создается практически полная цифровая копия голоса. Синтезированный уникальный голос компании могут внедрить в интерактивное голосовое меню (IVR), автоответчики, чаты, применить для проведения телемаркетинговых кампаний. Использование фирменного голоса позволяет отстроиться от конкурентов и телефонных спамеров, а также повысить лояльность клиентов за счет целостности публичного бренда.

Yandex SpeechKit Brand Voice представлен в двух версиях: Adaptive и Full. Первая версия Adaptive — это доступное и быстрое решение преимущественно для исходящих звонков. Версия Full, в свою очередь, нацелена на создание умных голосовых помощников, таких как Алиса, способных помогать клиентам с любыми вопросами.

В основе версии Brand Voice Adaptive лежит синтез переменных — как утверждают в «Яндексе», не имеющая аналогов в мире разработка Yandex.Cloud. Она уникальна тем, что может синтезировать цифровую копию голоса конкретного человека по заданным заранее шаблонам всего за несколько часов, а затем персонализировать речь: добавлять нужное обращение, данные конкретного заказа, сумму и так далее. При этом синтезированный голос звучит так же естественно, как если бы фразу произносил реальный человек.

Уникальный голос в Brand Voice Adaptive создается за 1 месяц и стоит 150 тыс. руб. в месяц. Технология лучше всего показывает себя там, где заранее определены сценарии: прием входящих звонков на первой линии или исходящие звонки клиентам.

Версия Brand Voice Full — это полная цифровая копия голоса реального человека без ограничений. С помощью Brand Voice Full можно создать полноценного голосового ассистента, который сможет отвечать на любые вопросы клиентов компании. Она обучается на базе 50 часов записей реального человека, а после способна воспроизводить его голосом любой текст.

Время внедрения голоса составляет примерно 6 месяцев, а стоимость разработки модели определяется индивидуально, в зависимости от сложности задач клиента.