Компонент Распознавание речи (Sber SaluteSpeech)

Описание

Осуществляет распознавание речи абонента в текстовый вид.
Используется on-premise сервис Sber SaluteSpeech, канал GRPC.

Настройка точек подключения производится в разделе настройки домена, поле 'sber_salute'.

Позволяет запускать предварительное воспроизведение файла, прерываемое голосом абонента.

Позволяет прерывать по тишине после произнесенной фразы. Позволяет быстро отсекать одну фразу средствами сервиса распознавания, а также настраивать ожидание нескольких фраз.

Table 1. Системные характеристики

Индекс

223

Краткое название

asr_sber

Типы сценариев

IVR

Стартовый модуль

r_sip_ivr_script_component_asr_sber

Режим

Асинхронный

Иконка

223

Характер разветвления

Разветвляющий, прерывающий

Свойства

Table 2. Свойства
Спецификация Описание

Название: Аккаунт Сбер Салют
Код: accountKey
Усл. видимости: нет
По умолчанию: default

Указание на аккаунт, определяющего точки подключения к сервису Sber SaluteSpeech.
В список попадает значение 'default', устанавливающее к использованию корневые поля 'speech' в объекте 'settings.sber_salute'.
Дополнительно в список попадают ключи объекта 'settings.sber_salute.accounts', за каждым из которых также находится объект с отдельно настроенными параметрами доступа.

Название: Набор грамматик
Код: model
Усл. видимости: нет
По умолчанию: callcenter

Параметр сервиса распознавания Sber SaluteSpeech: название набора грамматик.

Название: Язык
Код: lang
Усл. видимости: нет
По умолчанию: ru-RU

Параметр сервиса распознавания Sber SaluteSpeech: язык распознавания.
Возможные варианты:

  • ru-RU (0) – Русский язык

  • en-US (1) – Английский язык

  • kk-KZ (2) – Казахский язык

Название: Фильтр ненормативной лексики
Код: profanityFilter
Усл. видимости: нет
По умолчанию: Выключить

Параметр сервиса распознавания Sber SaluteSpeech: выключатель фильтра ненормативной лексики.

Название: Несколько предложений
Код: multiUtterance
Усл. видимости: нет
По умолчанию: Выключить

Параметр сервиса распознавания Sber SaluteSpeech: ожидание нескольких предложений.

Если выключено, то ответ приходит быстро вместе с обнаружением окончания первого предложения.
Если включено, то собираются и склеиваются все результаты. Окончание распознавания определяется параметрами 'Таймаут записи, с' и ''Интервал тишины, с'".

"Название: Длина предложения максимальная, с
Код: maxSpeechTimeoutSec
Усл. видимости: нет
По умолчанию: 20

Параметр сервиса распознавания Sber SaluteSpeech: максимальная длительность предложения.

Название: В кириллицу
Код: forceCyrillic
Усл. видимости: нет
По умолчанию: Выключить

Параметр сервиса распознавания Sber SaluteSpeech: Принудительное преобразование результата в кириллицу.

Название: Таймаут записи, с
Код: recordTimeoutSec
Усл. видимости: нет
По умолчанию: 30

Максимально допустимое время записи с момента завершения предварительного воспроизведения, в секундах.

Название: Прерывать по DTMF
Код: checkDTMF
Усл. видимости: нет
По умолчанию: нет

Выключатель детектора DTMF. Открывает настройки режимов сохранения символов и прерывания операции.

Название: Буфер для DTMF
Код: dtmfBuffer
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения получаемых DTMF-символов.

Название: Очистить буфер DTMF
Код: clearDtmfBuffer
Усл. видимости: да
По умолчанию: Да

Выключатель предварительной очистки буфера DTMF.

Название: Количество символов
Код: maxSymbolCount
Усл. видимости: да
По умолчанию: — 

Аргумент, содержащий ограничение на количество вводимых символов.
После получения во время исполнения компонента указанного количества символов DTMF производится автоматическое завершение записи и отправка последней порции голосовых данных сервису распознавания.

Название: Символы прерывания
Код: interruptSymbols
Усл. видимости: да
По умолчанию: — 

Строка, содержащая последовательности символов прерывания через запятую.
После обнаружения на конце буфера DTMF последовательности символов, совпадающей с одной из указанных последовательностей прерывания, производится автоматическое завершение записи и отправка последней порции данных сервису распознавания.
Например, *, 7, 123, 9395.

Название: Прерывать при обнаружении тишины
Код: abortOnSilence
Усл. видимости: нет
По умолчанию: Да

Выключатель детектора голоса (VAD) для автоматического завершения записи и отправки последней порции голосовых данных сервису распознавания.
Критерием для остановки является наличие голоса в течение не менее чем 300 мс и последующее его отсутствие в течение указанного интервала.

Название: Интервал тишины, с
Код: silenceTimeoutSec
Усл. видимости: да
По умолчанию: 2

Интервал для детектора голоса (VAD), по истечении которого производится автоматическая остановка записи и отправка последней порции голосовых данных сервису распознавания.
Применяется при включении параметра 'Прерывать при обнаружении тишины'.

Название: Порог VAD, -дБ
Код: vadThreshold
Усл. видимости: да
По умолчанию: 30

Аргумент, устанавливающий порог VAD.
Указанное значение применяется с отрицательным знаком (в децибеллах) для определения порога отсечения тишины относительно возможного максимума.
Поток анализируется фреймами по 20 мс. Каждый звуковой фрейм на основании порога отсечения рассматривается либо как голос, либо как тишина.
Обнаружение голоса происходит тогда, когда 2 фрейма подряд являются голосовыми. Обнаружение тишины происходит после того, как 15 фреймов подряд являются тишиной.
При значении 30 детектор лучше определяет тишину, при значении 40 детектор лучше определяет появление голоса.

Название: Таймаут ожидания ответа, с
Код: responseTimeoutSec
Усл. видимости: нет
По умолчанию: 5

Таймаут ожидания ответа от сервиса распознавания Sber SaluteSpeech после отправки ему последней порции голосовых данных.
По истечении таймаута управление передается следующему компоненту по ветке Время.

Название: Результат в переменную
Код: varText
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения текстового результата распознавания.

Название: Нормализованный результат в переменную
Код: varNormText
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения нормализованного текстового результата распознавания.

Название: Код ответа в переменную
Код: varCode
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения кода ответа сервиса распознавания (код эмулируется по аналогии с HTTP: 200, 408, 500).

Название: Тело ответа в переменную
Код: varBody
Усл. видимости: нет
По умолчанию: — 

Переменная для сохранения полного содержания ответа сервиса распознавания.
Если одно высказывание - объект, если несколько высказываний - массив объектов.

Название: Сохранить файл записи
Код: saveRec
Усл. видимости: нет
По умолчанию: Нет

Выключатель сохранения файла записи, отправленного сервису распознавания.

Название: Путь к файлу в переменную
Код: varRecordPath
Усл. видимости: да
По умолчанию: — 

Переменная для сохранения пути к файлу записи.
Файл размещается во временном каталоге сценария и будет удален после завершения работы сценария.
Для длительного сохранения файла требуется дальнейшее перемещение файла сценарием в место стационарного хранения.

Запись осуществляется на сервере с ролью mg, обслуживающим текущий звонок, а затем переносится на сервер с ролью ivr, обслуживающей текущий сценарий. Перенос всегда происходит внутри сайта.

Название: Предварительное воспроизведение
Код: prePlayFile
Усл. видимости: нет
По умолчанию: — 

Звуковой файл предварительного воспроизведения абоненту, во время которого также активирован голосовой детектор.
При отсутствии голоса от абонента (с учетом шумового порога VAD-детектора), отправка данных на сервис распознавания не производится.

Может быть выбран в одном из режимов:

  • статический файл, приложенный к сценарию (загружается из приложения Редактор сценариев или через API);

  • сформированный аргументами путь, который должен включать одну из файловых категорий.

Название: Переход
Код: transfer
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается упраление в случае успешного завершения операции.

Название: Переход, время
Код: transferTimeout
Усл. видимости: нет
По умолчанию: — 

Компонент, которому передается управление в случае истечения времени ожидания HTTP-ответа от сервиса распознавания.

Название: Переход, ошибка
Код: transferError
Усл. видимости: нет
По умолчанию: —