1С:Распознавание речи
Модуль «1C:EDI» — это специализированное решение, предназначенное для электронного обмена документами между программами 1С и торговыми сетями. Взаимодействие происходит через EDI-провайдера Сислинк и строго соответствует установленным требованиям электронного документооборота с применением EDI-технологий (например, прием электронных заказов, отправка уведомлений об отгрузках и др.).
Кому подходит «1C:EDI»«1С:Распознавание речи» — это облачный сервис, который автоматически преобразует устную речь в текст. Функции распознавания доступны напрямую из встроенного языка «1С:Предприятие», что позволяет партнерам, разработчикам и программистам интегрировать эту технологию в свои решения.
С помощью «1С:Распознавания речи» вы можете быстро надиктовывать длинные тексты, электронные письма, описания задач и комментарии. Это особенно удобно, если набирать текст на клавиатуре неудобно или руки заняты, например, при работе на мобильных устройствах.
Также сервис позволяет автоматически преобразовывать в текст аудиозаписи телефонных разговоров и совещаний (при условии хорошего качества записи). Для повышения точности рекомендуется записывать отдельные звуковые дорожки для каждого участника.
Технологию можно использовать и для создания систем голосового управления: пользователь может открывать нужные формы, строить отчеты, выполнять поиск или заполнять реквизиты с помощью голосовых команд.
«1С:Распознавание речи» также подходит для автоматизации телефонных опросов, голосового самообслуживания, аналитики клиентских обращений, а еще — для разработки доступных интерфейсов для людей с ограниченными возможностями.
Сервис поддерживает работу с дополнительной грамматикой: вы можете заранее загрузить в систему часто используемые термины, фамилии, названия товаров или компаний для более точного распознавания.
Работать с «1С:Распознавание речи» можно двумя способами: с помощью облачного сервиса или локально, используя скачанную модель. Локальный вариант обеспечивает полную конфиденциальность, поскольку аудиоданные не передаются вовне — это важно для тех, кто работает с чувствительной информацией. При облачном использовании не требуется дополнительная нагрузка на ваше оборудование и можно легко обрабатывать большой объём аудиоданных.
Для знакомства с технологиями распознавания речи создано демо-приложение на платформе «1С:Предприятие 8». С его помощью можно протестировать преобразование потокового аудио или аудиофайлов как через облако, так и локально. Инструменты из этого демо можно использовать для внедрения распознавания речи в собственные 1С-решения.
Возможности
-
Потоковое распознавание позволяет передавать аудиоданные в режиме реального времени и практически сразу получать фрагменты текста по мере их обработки. Такой режим особенно удобен для диктовки или голосового управления программой.
При использовании облачного сервиса длительность одного сеанса потокового распознавания ограничена двумя часами. Если же вы используете локальное решение, тайм-лимитов на продолжительность сеанса нет.
-
Файловое распознавание работает по-другому: вы отправляете готовый аудиофайл (например, запись совещания) и получаете идентификатор задачи. После обработки, которая может занять некоторое время в зависимости от длины аудиозаписи и нагрузки сервиса, результат будет доступен для скачивания.
При файловом распознавании поддерживаются многоканальные записи — каждый канал обрабатывается и тарифицируется отдельно. Принимаются файлы в формате WAV signed 16 bit little-endian и Opus (в контейнере ogg), с частотой дискретизации от 8 до 48 кГц. Максимальный размер файла — до 1 ГБ и продолжительность до 4 часов. Готовый результат сохраняется на сервере в течение 7 дней.
-
Разделение текста по спикерам — итоговая расшифровка содержит пометки, какой участник что говорил. Это особенно полезно для обработки собеседований, опросов, совещаний, контроля качества звонков и других ситуаций с несколькими говорящими.
В настоящее время распознавание речи поддерживается для русского и английского языков. В будущем планируется расширить список доступных языков.
Работает в программах:
-
1С:Документооборот 3.0 (диктовка текста электронных писем, задач, отчетов и резолюций, голосовой подбор адресатов писем)
Облачный продукт «1С:Распознавание речи» доступен средствами встроенного языка платформы «1С:Предприятие 8» с версии 8.3.23 и может быть встроен в любое пользовательское приложение 1С.
Программа 1С, в которую встраиваются механизмы распознавания, должна быть на официальной поддержке.
При локальном распознавании речи рекомендуется учитывать минимальные требования к ресурсам оборудования:
- x64: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше,
- x32: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 4 Гбайт и выше. Качество распознавания речи на платформе x32 снижено.