Компонент Распознавание речи (Yandex Cloud SpeechKit)

Описание

Осуществляет распознавание речи абонента в текстовый вид.
Сервис предоставляется облаком Yandex Cloud SpeechKit по протоколу HTTP. Не имеет технических ограничений по производительности.

Порядок регистрации учетной записи Yandex-облака и стоимость сервиса см. на Яндексе.

Настройка токенов производится в разделе настройки домена, поле 'yandex_cloud'..

Позволяет прерывать по тишине после произнесенной фразы.

Table 1. Системные характеристики

Индекс

223

Краткое название

asr_yandex

Типы сценариев

IVR

Стартовый модуль

r_sip_ivr_script_component_asr_yandex

Режим

Асинхронный

Иконка

223

Характер разветвления

Разветвляющий, прерывающий

Свойства

Table 2. Свойства
Спецификация Описание

Название: Аккаунт Яндекс
Код: accountKey
Усл. видимости: нет
По умолчанию: default

Указание на аккаунт Яндекса, опции которого берутся для подключения к яндексу.
В список попадает значение 'default', устанавливающее к использованию корневые поля 'speech' и 'storage' в объекте 'settings.yandex_cloud'.
Дополнительно в список попадают ключи объекта 'settings.yandex_cloud.accounts', за каждым из которых также находится объект с отдельно настроенными параметрами доступа.

Название: Тема
Код: topic
Усл. видимости: нет
По умолчанию: general

Параметр сервиса распознавания Yandex Cloud SpeechKit: тема распознавания.
Возможные варианты:

  • general (0)

  • maps (1)

  • dates (2)

  • names (3)

  • numbers (4)

  • Другая (custom, 100) – Указание произвольной темы через аргумент.

Название: Пользовательская тема
Код: topicCustom
Усл. видимости: да
По умолчанию: — 

Аргумент, содержащий пользовательскую тему для сервиса распознавания Yandex Cloud SpeechKit.

Название: Язык
Код: lang
Усл. видимости: нет
По умолчанию: Русский

Параметр сервиса распознавания Yandex Cloud SpeechKit: язык распознавания.
Возможные варианты:

  • Авто (100) – Автоматическое определение языка

  • ru-RU (0) – Русский

  • en-US (1) – Английский

  • de-DE (2) – Немецкий

  • es-ES (3) – Испанский

  • fi-FI (4) – Финский

  • fr-FR (5) – Французский

  • he-HE (6) – Иврит

  • it-IT (7) – Итальянский

  • kk-KZ (8) – Казахский

  • nl-NL (9) – Голландский

  • pl-PL (10) – Польский

  • pt-PT (11) – Португальский

  • pt-BR (12) – Бразильский португальский

  • sv-SE (13) – Шведский

  • tr-TR (14) – Турецкий

  • uz-UZ (15) – Узбекский (латиница)

Название: Фильтр ненормативной лексики
Код: profanityFilter
Усл. видимости: нет
По умолчанию: Выключить

Параметр сервиса распознавания Yandex Cloud SpeechKit: выключатель фильтра ненормативной лексики.

Название: Таймаут записи, с
Код: recordTimeoutSec
Усл. видимости: нет
По умолчанию: 30

Максимально допустимое время записи с момента завершения предварительного воспроизведения, в секундах.

Название: Прерывать по DTMF
Код: checkDTMF
Усл. видимости: нет
По умолчанию: нет

Выключатель детектора DTMF. Открывает настройки режимов сохранения символов и прерывания операции.

Название: Буфер для DTMF
Код: dtmfBuffer
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения получаемых DTMF-символов.

Название: Очистить буфер DTMF
Код: clearDtmfBuffer
Усл. видимости: да
По умолчанию: Да

Выключатель предварительной очистки буфера DTMF.

Название: Количество символов
Код: maxSymbolCount
Усл. видимости: да
По умолчанию: — 

Аргумент, содержащий ограничение на количество вводимых символов.
После получения во время исполнения компонента указанного количества символов DTMF производится автоматическое завершение записи и отправка последней порции голосовых данных сервису распознавания.

Название: Символы прерывания
Код: interruptSymbols
Усл. видимости: да
По умолчанию: — 

Строка, содержащая последовательности символов прерывания через запятую.
После обнаружения на конце буфера DTMF последовательности символов, совпадающей с одной из указанных последовательностей прерывания, производится автоматическое завершение записи и отправка последней порции данных сервису распознавания.
Например, *, 7, 123, 9395.

Название: Прерывать при обнаружении тишины
Код: abortOnSilence
Усл. видимости: нет
По умолчанию: Да

Выключатель детектора голоса (VAD) для автоматического завершения записи и отправки последней порции голосовых данных сервису распознавания.
Критерием для остановки является наличие голоса в течение не менее чем 300 мс и последующее его отсутствие в течение указанного интервала.

Название: Интервал тишины, с
Код: silenceTimeoutSec
Усл. видимости: да
По умолчанию: 2

Интервал для детектора голоса (VAD), по истечении которого производится автоматическая остановка записи и отправка последней порции голосовых данных сервису распознавания.
Применяется при включении параметра 'Прерывать при обнаружении тишины'.

Название: Порог VAD, дБ
Код: vadThreshold
Усл. видимости: да
По умолчанию: 30

Аргумент, содержащий порог VAD, при пересечении которого в большую сторону фиксируется наличие голоса, в децибеллах.
Любой шум с уровнем ниже порога рассматривается как тишина.

Название: Таймаут ожидания ответа, с
Код: responseTimeoutSec
Усл. видимости: нет
По умолчанию: 5

Таймаут ожидания ответа от сервиса распознавания Yandex Cloud SpeechKit после отправки ему последней порции голосовых данных.
По истечении таймаута управление передается следующему компоненту по ветке Время.

Название: Результат в переменную
Код: varText
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения текстового результата распознавания.

Название: Код ответа в переменную
Код: varHttpCode
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения кода HTTP-ответа сервиса распознавания.

Название: Тело ответа в переменную
Код: varHttpBody
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения полного содержания HTTP-ответа сервиса распознавания.

Название: Сохранить файл записи
Код: saveRec
Усл. видимости: нет
По умолчанию: Нет

Выключатель сохранения файла записи, отправленного сервису распознавания.

Название: Путь к файлу в переменную
Код: varRecordPath
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения пути к файлу записи.
Файл размещается во временном каталоге сценария и будет удален после завершения работы сценария.
Для длительного сохранения файла требуется дальнейшее перемещение файла сценарием в место стационарного хранения.

Запись осуществляется на сервере с ролью mg, обслуживающим текущий звонок, а затем переносится на сервер с ролью ivr, обслуживающей текущий сценарий. Перенос всегда происходит внутри сайта.

Название: Предварительное воспроизведение
Код: prePlayFile
Усл. видимости: нет
По умолчанию: — 

Звуковой файл предварительного воспроизведения абоненту, во время которого также активирован голосовой детектор.
При отсутствии голоса от абонента (с учетом шумового порога VAD-детектора), отправка данных на сервис распознавания не производится.

Может быть выбран в одном из режимов:

  • статический файл, приложенный к сценарию (загружается из приложения Редактор сценариев или через API);

  • сформированный аргументами путь, который должен включать одну из файловых категорий.

Название: Переход
Код: transfer
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается упраление в случае успешного завершения операции.

Название: Переход, время
Код: transferTimeout
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае истечения времени ожидания HTTP-ответа от сервиса распознавания.

Название: Переход, ошибка
Код: transferError
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае возникновения ошибки.

См. также

  • Роль ivr

  • Роль mg