Главная блога

В поисках смыслов — новая версия Neuro ASR

Мы рады представить вам новейшую версию нашей технологии распознавания речи — Neuro ASR.

Что же это такое?

Neuro ASR — это сервис распознавания речи, созданный компанией, которая строит свой бизнес в сфере умных голосовых роботов, где неотъемлемой частью является сервис ASR, что делает его уникальным на фоне аналогов.
Наша разработка хорошо зарекомендовала себя в ежедневной работе на многомиллионном трафике крупнейших операторов связи.

Разработанная командой инженеров Neuro.net, эта технология стала одним из ключевых компонентов наших умных голосовых решений на базе искусственного интеллекта.

Как это работает?

Работа Neuro ASR происходит в несколько ключевых этапов:

В чем же новшества?

Иногда для выхода на качественно новый уровень необходимы кардинальные изменения.
Исторически, Neuro ASR работал на базе сверточной акустической модели CitriNet – однако, следуя технологическим трендам, мы отказались от этой архитектуры в пользу нового индустриального лидера, основанного из двух компонентов: симбиоза сверточной модели и механизма внимания.

Переход дал нам большую пропускную способность, лучшее качество распознавания речи, предсказывание не только букв, но и слов – то есть, с более глубоким пониманием контекста предложения.

Разработка Neuro ASR не стоит на месте и находится в процессе постоянного улучшения.
Это отражается в регулярных релизах раз в квартал, где мы занимаемся сервисом не только в плоскости акустических моделей, но и активно развиваем кодовую базу для повышения качества распознавания и пропускной способности.

Каждая новая версия проходит несколько этапов тестирования – последним этапом является использование новой версии на коммерческом проекте, где мы тщательно отслеживаем не только внутренние метрики сервиса ASR, но и бизнес-метрики платформы голосового робота.

Кроме того, каждый новый релиз проходит сравнительный анализ с другими поставщиками сервиса ASR, где наш продукт на тестовых датасетах показывает лучшее качество.

Новая версия Neuro ASR отличается более высокой, близкой к человеческому уху, точностью распознавания и улучшенной скоростью работы.

Благодаря алгоритмам машинного обучения и нейронным сетям, Neuro ASR способен распознавать речь с еще большим качеством даже в шумных средах – в том числе в этом нам помогает модуль VAD (Voice Activity Detection), который помогает нашему ASR не пропускать слова и ошибочно не добавлять лишнее из шумов.
Предлагаем протестировать наши технологии ASR и TTS самостоятельно в демо-стенде – voice.neuro.net

Почему это важно?

Эта технология имеет огромное значение для развития умных голосовых роботов, систем автоматизации и иных приложений, где взаимодействие с помощью голоса является ключевым элементом.

Улучшение качества распознавания речи делает наши продукты более точными и практичными для широкого круга пользователей, от повседневных потребителей до корпоративных клиентов.

Neuro ASR, в синергии с нашими умными голосовыми продуктами, позволяет кратно сокращать издержки на колл-центры, снижать нагрузку на операторов и сотрудников в целом.
Благодаря дополнительным надстройкам можно так же улучшить в целом автоматизацию процессов – например, заводить и классифицировать входящие обращения сразу же в CRM-системы.

А что же еще?

Neuro.net активно создает экосистему связанных продуктов, основанных на технологиях нейросетей, что позволяет значительно дополнить выгоду от использования нашего Neuro ASR.

В процессе распознавания, голос пользователя/абонента дополнительно обрабатывается — обогащается и размечается за счет наших собственных разработок и надстроек, таких как:

NER (Named Entity Recognition) — алгоритм распознавания именованных сущностей в тексте, таких как имена людей, названия организаций, даты, местоположения, суммы денег и другие типы специфических объектов.
Age Model – модель классификации возраста говорящего.
Gender Model – модель классификации пола говорящего.
AMD (Answer Machine Detection) – надстройка для определения автоответчиков.
— И остальные модели классификаций

Именно благодаря такой экосистеме и используемым технологиям мы можем давать еще больше качественной информации клиентам, чем просто распознавание голоса, которое в наш век перестает кого-то удивлять.

Неудивительно, что Neuro ASR и продукты компании Neuro.net становится выбором для тех, кто стремится к высочайшему качеству и скорости в обработке речевого сигнала.

Выберите язык