Компонент Синтез речи (Yandex Cloud SpeechKit)

Описание

Осуществляет синтез речи по тексту и воспроизведение текущему абоненту.
Сервис предоставляется облаком Yandex Cloud SpeechKit по протоколу HTTP (APIv1 REST). Не имеет технических ограничений по производительности.

Порядок регистрации учетной записи Yandex-облака и стоимость сервиса см. на Яндексе.

Настройка токенов производится в разделе настройки домена, поле 'yandex_cloud'.

Позволяет воспроизводить результат, а также просто записывать его в аудио-файл.

В режиме воспроизведения файл сначала синтезируется и выкачивается полностью, затем начинается воспроизведение.
Скорость синтеза речи ориентировочно в 10 раз быстрее реального времени ее воспроизведения.

Table 1. Системные характеристики

Индекс

222

Краткое название

tts_yandex

Типы сценариев

IVR

Стартовый модуль

r_sip_ivr_script_component_tts_yandex

Режим

Асинхронный

Иконка

222

Характер разветвления

Разветвляющий, прерывающий

Свойства

Table 2. Свойства
Спецификация Описание

Название: Аккаунт Яндекс
Код: accountKey
Усл. видимости: нет
По умолчанию: default

Указание на аккаунт Яндекса, опции которого берутся для подключения к яндексу.
В список попадает значение 'default', устанавливающее к использованию корневые поля 'speech' и 'storage' в объекте 'settings.yandex_cloud'.
Дополнительно в список попадают ключи объекта 'settings.yandex_cloud.accounts', за каждым из которых также находится объект с отдельно настроенными параметрами доступа.

Название: Режим
Код: mode
Усл. видимости: нет
По умолчанию: Воспроизведение

Режим работы компонента после получения ответа от сервиса TTS Yandex Cloud SpeechKit.
Возможные варианты:

  • Воспроизведение (play, 0) – Воспроизведение синтезированной речи абоненту с последующим удалением файла.

  • Генерация файла (file, 1) – Сохранение аудио-файла в локальный временный каталог и возврат пути к файлу в переменную.

Название: Текст
Код: text
Усл. видимости: нет
По умолчанию: — 

Текст, подлежащий синтезу и последующему воспроизведению. Ограничение на длину строки: 5000 символов.

Название: Язык
Код: lang
Усл. видимости: нет
По умолчанию: Русский

Параметр сервиса TTS Yandex Cloud SpeechKit: язык синтеза.
Возможные варианты:

  • ru-RU (0) – Русский

  • en-US (1) – Английский

  • de-DE (2) – Немецкий

  • he-IL (6) – Иврит

  • kk-KZ (8) – Казахский

  • uz-UZ (15) – Узбекский

Название: Голос
Код: voice
Усл. видимости: нет
По умолчанию: Alyss (ж)

Параметр сервиса TTS Yandex Cloud SpeechKit: голос синтезируемой речи.
Возможные варианты:

  • Alyss (ж) (0)

  • Jane (ж) (1)

  • Oksana (ж) (2)

  • Omazh (ж) (3)

  • Zahar (м) (4)

  • Ermil (м) (5)

  • Alena (ж) (6)

  • Filipp (м) (7)

  • Другой (other, 100) – Указание произвольного голоса через аргумент.

Название: Другой голос
Код: voiceOther
Усл. видимости: нет
По умолчанию: — 

Аргумент, содержащий название голоса для сервиса TTS Yandex Cloud SpeechKit. Поддерживаемые голоса

Название: Эмоция
Код: emotion
Усл. видимости: нет
По умолчанию: Good

Параметр сервиса TTS Yandex Cloud SpeechKit: эмоциональный эффект синтезируемой речи, амплуа.
Возможные варианты:

  • Good (0)

  • Evil (1)

  • Neutral (2)

Название: Темп речи (0.1 – 3.0)
Код: speed
Усл. видимости: нет
По умолчанию: 1.0

Параметр сервиса TTS Yandex Cloud SpeechKit: темп синтезируемой речи.
Дробное значение от 0.1 до 3.0 с размерностью 0.1

Название: Прерывать по DTMF
Код: checkDTMF
Усл. видимости: нет
По умолчанию: Нет

Выключатель детектора DTMF. Открывает настройки режимов сохранения символов и прерывания операции.

Название: Буфер для DTMF
Код: dtmfBuffer
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения получаемых DTMF-символов.

Название: Очистить буфер DTMF
Код: clearDtmfBuffer
Усл. видимости: да
По умолчанию: Да

Выключатель предварительной очистки буфера DTMF.

Название: Количество символов
Код: maxSymbolCount
Усл. видимости: да
По умолчанию: — 

Аргумент, содержащий ограничение на количество вводимых символов.
После получения во время исполнения компонента указанного количества символов DTMF завершается операции воспроизведения.

Название: Символы прерывания
Код: interruptSymbols
Усл. видимости: да
По умолчанию: — 

Строка, содержащая последовательности символов прерывания через запятую.
После обнаружения на конце буфера DTMF последовательности символов, совпадающей с одной из указанных последовательностей прерывания, завершается операция воспроизведения.
Например, *, 7, 123, 9395.

Название: Таймаут ожидания ответа, с
Код: responseTimeoutSec
Усл. видимости: нет
По умолчанию: — 

Таймаут ожидания ответа от сервиса TTS Yandex Cloud SpeechKit после отправки ему запроса.
По истечении таймаута управление передается следующему компоненту по ветке Время.

Название: Код ответа в переменную
Код: varHttpCode
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения кода HTTP-ответа сервиса распознавания.

Название: Путь к файлу в переменную
Код: varFile
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения пути к аудио-файлу с синтезированной речью в локальном временном каталоге.
Для длительного сохранения файла требуется дальнейшее перемещение файла сценарием в место стационарного хранения.

Название: Переход
Код: transfer
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае успешного завершения операции.

Название: Переход, время
Код: transferTimeout
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае истечения времени ожидания HTTP-ответа от сервиса.

Название: Переход, ошибка
Код: transferError
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае возникновения ошибки.

См. также

  • Роль ivr

  • Роль mg