Поддерживаемые решения

Сервис распознавания речи встроен в различные прикладные решения. В каждом из них реализованы свои сценарии использования.
Разработчикам, для добавления прикладных решений в данный в список, просьба обращаться на ailab@1c.ru

Демонстрационное приложение
Попробуйте распознавание речи в бесплатном демоприложении 1С. Используйте это приложение, чтобы ознакомиться с возможностями сервиса, а также для встраивания распознавания речи в собственные прикладные решения.

Возможности распознавания речи, с которыми можно ознакомиться:

  • Потоковое распознавание речи. Вы можете надиктовать произвольный текст, например, письмо, заметку или поручение. Сейчас распознаются русский или английский языки. Список доступных языков будет расширяться с развитием сервиса распознавания речи. Длительность одного сеанса при потоковом распознавании речи с помощью облачного сервиса имеет ограничение в 2 часа.
  • Автоматическая замена знаков препинаний, спецсимволов и перевода строк при диктовке. Просто назовите нужный знак в том месте, где вы его хотите установить.

  • Распознавание аудиофайлов. Загрузите в сервис файл с записью голоса, например, запись телефонного звонка или совещания. В ответ вы получите текстовую расшифровку.

Для разных собеседников рекомендуется записывать отдельный файл или звуковую дорожку, в этом случае расшифровку записи можно будет представить в виде диалога. Для каждой реплики диалога указана метка времени от начала разговора. Если на нее нажать, то можно прослушать соответствующий фрагмент аудиозаписи.

  • Поддержка дополнительных грамматик при распознавании речи. Перед началом распознавания можно передать сервису список специфичных терминов (фамилий сотрудников, названий номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать. Вы можете задать общие грамматики для всей базы 1С, а также дать возможность пользователям использовать индивидуальные дополнительные грамматики.

Настройки приложения для распознавания речи:

  • Авторизация в сервисе распознавания речи с помощью интернет-поддержки

  • Авторизация в сервисе распознавания речи по логину / паролю

  • Получение данных о балансе сервиса

  • Получение списка имеющихся в сервисе моделей распознавания речи. Скачивание моделей, доступных для локального распознавания речи

  • Настройка ограничения пользователей по использованию моделей распознавания речи

  • Настройка ограничения по использованию дополнительных грамматик

Как воспользоваться

  • Скачайте и установите демоприложение 1C
  • В настройках приложения (раздел Администрирование — Настройки работы с речью) подключитесь к сервису, используя авторизацию интернет-поддержки.
  • Для авторизованного пользователя в форме настроек отображается текущий баланс сервиса распознавания речи. Если для пользователя доступен бесплатный тестовый пакет, то рекомендуем его подключить. Перед началом распознавания речи с помощью облачного сервиса проверьте, что остаток баланса положительный. Баланс в сервисе можно также пополнить покупкой платных пакетов.
  • Для распознавания речи на локальном оборудовании там же в настройках скачайте модель распознавания. После загрузки и установки модели можно отключиться от сервиса, и распознавание будет работать локально.
  • При необходимости задайте дополнительные грамматики — слова, которые сервису может быть сложно распознать. Каждое слово или фразу в дополнительной грамматике вводите с новой строки.
  • В форме потокового распознавания нажмите кнопку с микрофоном и начинайте диктовать текст. Произносите слова четко и чуть медленнее, чем вы обычно разговариваете. В режиме реального времени ваша речь будет превращаться в текст. Нажмите эту же кнопку еще раз для окончания ввода.
  • В обработке распознавания аудиофайлов выберите один или несколько файлов. Поддерживаются файлы в формате: WAV signed 16 bit little-endian и Opus в контейнере ogg с частотой дискретизации: 8 — 48 кГц. Максимальный размер аудиофайла — 1Гб длительностью до 4 часов.

    Файлы встанут в очередь на распознавание, и результат будет предоставлен через некоторое время в зависимости от длительности аудиофайла и загрузки сервиса.

Если аудиофайл содержит отдельные каналы для разных собеседников, то результат распознавания можно представить в виде диалога.

  • Вы можете изменить параметры распознавания речи для текущего сеанса. Например, выбрать нужный язык или добавить в дополнительные грамматики сложные для распознавания слова и словосочетания, чтобы сервис их уверенно определял. При необходимости результаты распознавания можно ограничить только выражениями, входящими в дополнительную грамматику.
  • В текущем сеансе пользователь может авторизоваться в сервисе распознавания речи под отдельным логином и паролем, если администратор не запретил данную возможность.
  • Если по результатам распознавания речи у вас появились замечания или полезные идеи, пожалуйста, отправьте разработчикам сервиса жалобу на качество.

Разработчики 1С могут использовать демоприложение для встраивания возможностей распознавания речи в собственные прикладные решения. По возникшим вопросам или предложениям, пожалуйста, пишите на ailab@1c.ru

Разработчик: 1С Сервис поддерживается с версии: 1.0.1


1С:Документооборот 3.0
Первое тиражное приложение 1С, в котором встроено распознавание речи. Теперь вы можете диктовать текст электронных писем и голосом подбирать для них адресатов, удобно заполнять содержание, особые наименования и описания для задач, вводить голосом отчёты и резолюции об исполнении.

В 1С:Документооборот 3.0 с использованием механизма распознавания речи реализованы следующие возможности:

  • Заполнять содержание задач теперь удобно с помощью распознавание речи. Вы можете надиктовать текст целиком или любой его фрагмент, начиная от позиции курсора. Произносите слова четко и чуть медленнее, чем вы обычно разговариваете. В режиме реального времени ваша речь будет превращаться в текст.
  • Ввод текста голосом можно использовать для заполнения резолюций и комментариев при согласовании или ознакомлении, для написания отчетов о выполнении задач, а также для указания особых наименований и описаний в задачах.
  • Текст электронного письма можно просто прочитать вслух. После окончания диктовки останется только исправить неточности распознавания.

  • Реализован подбор голосом адресатов для письма. Произнесите фамилию и имя получателя письма — как только программа найдет их в списке ваших контактов, то добавит в адресаты.

  • Автоматическая замена знаков препинаний, спецсимволов и перевода строк при диктовке. Просто назовите нужный знак в том месте, где вы его хотите добавить.

  • Поддержка дополнительных грамматик при распознавании речи. Перед началом распознавания можно передать сервису список специфичных терминов (фамилий сотрудников, названий номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.

  • Пользователь при работе с распознаванием речи может изменять доступные ему настройки — например, выбрать язык.

  • Голосовой ввод поддерживается на русском или английском языке. С развитием сервиса распознавания речи список доступных языков будет расширяться.

  • Распознавание речи может выполняться локально с нагрузкой на оборудование пользователя или с помощью облачного сервиса. Использование локального или облачного распознавания речи может выбрать администратор базы с помощью настроек.

  • По результатам распознавания речи пользователь может отправить сообщение разработчикам сервиса. Обратная связь поможет сделать сервис более удобным и полезным.

Возможность распознавания речи доступна в файловом и клиент-серверном варианте работы, в тонком, толстом и веб-клиенте (на всех поддерживаемых браузерах кроме Firefox и Safari).

Как настроить и начать пользоваться

  • Проверьте, что в программе подключена интернет-поддержка пользователей.

  • Для распознавания речи на локальном оборудовании в настройках распознавания речи (раздел Настройка — Настройка программы — Общие настройки программы — Настройка работы с речью) загрузите модель распознавания.

  • Для распознавания речи с помощью облачного сервиса подключитесь к нему в настройках (раздел Настройка — Настройка программы — Общие настройки программы — Настройка работы с речью).
  • Если для пользователя доступен бесплатный тестовый пакет, то рекомендуем его подключить.
  • Перед началом распознавания речи с помощью облачного сервиса проверьте, что остаток баланса положительный. Баланс в сервисе можно пополнить покупкой платных пакетов.
  • При необходимости задайте дополнительные грамматики — слова и фразы, которые сервису может быть сложно распознавать.
  • В формах приложения, где встроено распознавание речи, нажмите кнопку с микрофоном и начинайте диктовать текст. В режиме реального времени ваша речь будет превращаться в текст и отображаться на форме.

    Например, в форме электронного письма с помощью распознавания речи можно заполнить текст письма, а также подобрать его получателей.

  • Если по результатам распознавания речи у вас появились замечания или полезные идеи, пожалуйста, отправьте разработчикам сервиса жалобу на качество.

Возможности использования распознавания речи в 1С:Документооборот 3 планируется расширять. О своих впечатлениях и пожеланиях по интеграции с сервисом распознавания речи в этой программе, пожалуйста, пишите на ailab@1c.ru

Разработчик: 1С Сервис поддерживается с версии: 3.0.9.18