Поддерживаемые решения
Сервис распознавания речи встроен в различные прикладные решения. В каждом из них реализованы свои сценарии использования. Разработчикам, для добавления прикладных решений в данный в список, просьба обращаться на ailab@1c.ru
Демонстрационное приложение Попробуйте распознавание речи в бесплатном демоприложении 1С. Используйте это приложение, чтобы ознакомиться с возможностями сервиса, а также для встраивания распознавания речи в собственные прикладные решения.
Возможности распознавания речи, с которыми можно ознакомиться:
- Потоковое распознавание речи. Вы можете надиктовать произвольный текст, например, письмо, заметку или поручение. Сейчас распознаются русский или английский языки. Список доступных языков будет расширяться с развитием сервиса распознавания речи. Длительность одного сеанса при потоковом распознавании речи с помощью облачного сервиса имеет ограничение в 2 часа.

-
Автоматическая замена знаков препинаний, спецсимволов и перевода строк при диктовке. Просто назовите нужный знак в том месте, где вы его хотите установить.
-
Распознавание аудиофайлов. Загрузите в сервис файл с записью голоса, например, запись телефонного звонка или совещания. В ответ вы получите текстовую расшифровку.
-
Для разных собеседников рекомендуется записывать отдельный файл или звуковую дорожку, в этом случае расшифровку записи можно будет представить в виде диалога. Для каждой реплики диалога указана метка времени от начала разговора. Если на нее нажать, то можно прослушать соответствующий фрагмент аудиозаписи.
- Поддержка дополнительных грамматик при распознавании речи. Перед началом распознавания можно передать сервису список специфичных терминов (фамилий сотрудников, названий номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать. Вы можете задать общие грамматики для всей базы 1С, а также дать возможность пользователям использовать индивидуальные дополнительные грамматики.

Настройки приложения для распознавания речи:
-
Авторизация в сервисе распознавания речи с помощью интернет-поддержки
-
Авторизация в сервисе распознавания речи по логину / паролю
-
Получение данных о балансе сервиса
-
Получение списка имеющихся в сервисе моделей распознавания речи. Скачивание моделей, доступных для локального распознавания речи
-
Настройка ограничения пользователей по использованию моделей распознавания речи
-
Настройка ограничения по использованию дополнительных грамматик

Как воспользоваться
- Скачайте и установите демоприложение 1C
- В настройках приложения (раздел Администрирование — Настройки работы с речью) подключитесь к сервису, используя авторизацию интернет-поддержки.

- Для авторизованного пользователя в форме настроек отображается текущий баланс сервиса распознавания речи. Если для пользователя доступен бесплатный тестовый пакет, то рекомендуем его подключить. Перед началом распознавания речи с помощью облачного сервиса проверьте, что остаток баланса положительный. Баланс в сервисе можно также пополнить покупкой платных пакетов.

- Для распознавания речи на локальном оборудовании там же в настройках скачайте модель распознавания. После загрузки и установки модели можно отключиться от сервиса, и распознавание будет работать локально.

- При необходимости задайте дополнительные грамматики — слова, которые сервису может быть сложно распознать. Каждое слово или фразу в дополнительной грамматике вводите с новой строки.

- В форме потокового распознавания нажмите кнопку с микрофоном и начинайте диктовать текст. Произносите слова четко и чуть медленнее, чем вы обычно разговариваете. В режиме реального времени ваша речь будет превращаться в текст. Нажмите эту же кнопку еще раз для окончания ввода.

-
В обработке распознавания аудиофайлов выберите один или несколько файлов. Поддерживаются файлы в формате: WAV signed 16 bit little-endian и Opus в контейнере ogg с частотой дискретизации: 8 — 48 кГц. Максимальный размер аудиофайла — 1Гб длительностью до 4 часов.
Файлы встанут в очередь на распознавание, и результат будет предоставлен через некоторое время в зависимости от длительности аудиофайла и загрузки сервиса.
-
Если аудиофайл содержит отдельные каналы для разных собеседников, то результат распознавания можно представить в виде диалога.
- Вы можете изменить параметры распознавания речи для текущего сеанса. Например, выбрать нужный язык или добавить в дополнительные грамматики сложные для распознавания слова и словосочетания, чтобы сервис их уверенно определял. При необходимости результаты распознавания можно ограничить только выражениями, входящими в дополнительную грамматику.

- В текущем сеансе пользователь может авторизоваться в сервисе распознавания речи под отдельным логином и паролем, если администратор не запретил данную возможность.

- Если по результатам распознавания речи у вас появились замечания или полезные идеи, пожалуйста, отправьте разработчикам сервиса жалобу на качество.

Разработчики 1С могут использовать демоприложение для встраивания возможностей распознавания речи в собственные прикладные решения. По возникшим вопросам или предложениям, пожалуйста, пишите на ailab@1c.ru
1С:Документооборот 3.0 Первое тиражное приложение 1С, в котором встроено распознавание речи. Теперь вы можете диктовать текст электронных писем и голосом подбирать для них адресатов, удобно заполнять содержание, особые наименования и описания для задач, вводить голосом отчёты и резолюции об исполнении.
В 1С:Документооборот 3.0 с использованием механизма распознавания речи реализованы следующие возможности:
- Заполнять содержание задач теперь удобно с помощью распознавание речи. Вы можете надиктовать текст целиком или любой его фрагмент, начиная от позиции курсора. Произносите слова четко и чуть медленнее, чем вы обычно разговариваете. В режиме реального времени ваша речь будет превращаться в текст.

- Ввод текста голосом можно использовать для заполнения резолюций и комментариев при согласовании или ознакомлении, для написания отчетов о выполнении задач, а также для указания особых наименований и описаний в задачах.

-
Текст электронного письма можно просто прочитать вслух. После окончания диктовки останется только исправить неточности распознавания.
-
Реализован подбор голосом адресатов для письма. Произнесите фамилию и имя получателя письма — как только программа найдет их в списке ваших контактов, то добавит в адресаты.

-
Автоматическая замена знаков препинаний, спецсимволов и перевода строк при диктовке. Просто назовите нужный знак в том месте, где вы его хотите добавить.
-
Поддержка дополнительных грамматик при распознавании речи. Перед началом распознавания можно передать сервису список специфичных терминов (фамилий сотрудников, названий номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
-
Пользователь при работе с распознаванием речи может изменять доступные ему настройки — например, выбрать язык.

-
Голосовой ввод поддерживается на русском или английском языке. С развитием сервиса распознавания речи список доступных языков будет расширяться.
-
Распознавание речи может выполняться локально с нагрузкой на оборудование пользователя или с помощью облачного сервиса. Использование локального или облачного распознавания речи может выбрать администратор базы с помощью настроек.
-
По результатам распознавания речи пользователь может отправить сообщение разработчикам сервиса. Обратная связь поможет сделать сервис более удобным и полезным.
Возможность распознавания речи доступна в файловом и клиент-серверном варианте работы, в тонком, толстом и веб-клиенте (на всех поддерживаемых браузерах кроме Firefox и Safari).
Как настроить и начать пользоваться
-
Проверьте, что в программе подключена интернет-поддержка пользователей.
-
Для распознавания речи на локальном оборудовании в настройках распознавания речи (раздел Настройка — Настройка программы — Общие настройки программы — Настройка работы с речью) загрузите модель распознавания.

- Для распознавания речи с помощью облачного сервиса подключитесь к нему в настройках (раздел Настройка — Настройка программы — Общие настройки программы — Настройка работы с речью).

- Если для пользователя доступен бесплатный тестовый пакет, то рекомендуем его подключить.

- Перед началом распознавания речи с помощью облачного сервиса проверьте, что остаток баланса положительный. Баланс в сервисе можно пополнить покупкой платных пакетов.

- При необходимости задайте дополнительные грамматики — слова и фразы, которые сервису может быть сложно распознавать.

-
В формах приложения, где встроено распознавание речи, нажмите кнопку с микрофоном и начинайте диктовать текст. В режиме реального времени ваша речь будет превращаться в текст и отображаться на форме.
Например, в форме электронного письма с помощью распознавания речи можно заполнить текст письма, а также подобрать его получателей.

- Если по результатам распознавания речи у вас появились замечания или полезные идеи, пожалуйста, отправьте разработчикам сервиса жалобу на качество.

Возможности использования распознавания речи в 1С:Документооборот 3 планируется расширять. О своих впечатлениях и пожеланиях по интеграции с сервисом распознавания речи в этой программе, пожалуйста, пишите на ailab@1c.ru