NLU (Natural Language Understanding)*
Формализация распознанного текста, понимание основного намерения или вопроса пользователя.
* Понимание смысла, намерений, параметров из текста
Невозможно запрограммировать все разнообразие фраз и комбинаций инструментами классической разработки.
Каждая команда может быть сформулирована множеством фраз (включить обогрев, повысить температуру в салоне, и т.д).
Пользователь будет общаться на естественном языке, не изучая специальные протоколы взаимодействия с системой.
Логика команд представлена в виде графа и описана при помощи языка NLua, покрывающего сотни вариантов фраз несколькими строчками кода. Этот язык программирования содержит большое количество библиотек и отличается простотой синтаксиса и развертывания.
Бизнес-логика подключается к CAN- шине и гарантирует безопасное выполнение команд благодаря технологии NLua.
LOGIC (Business logic)
Действия на распознанные команды/вопросы, генерация текстового ответа.
Голосовые помощники, представленные на рынке, подходят только для управления системами мультимедиа.
TTS (Text to speech)
Озвучивание ответа/текста.
Подходящих open-source решений практически нет на русском языке.
Разрабатываем собственный TTS компонент, поддерживающий русский язык с возможностью расширения и сопровождения.
Пользователи имеют различный стиль произношения, дикцию и манеру общения, а также обладают разными речевыми особенностями.
Глубинные нейронные сети, обученные на больших датасетах, правильно идентифицируют голосовые команды.
ASR (Automatic Speech recognition)*
Корректное распознавание произнесенной фразы в реальных условиях с различными фоновыми шумами.
* Автоматическое преобразование произнесенной фразы в текст
* Понимание смысла, намерений, параметров из текста
Собственная технология NLU* позволяет поддерживать диалог. Система понимает сложные фразы в режиме реального времени и может их уточнять. Это отличает Evois Platform от универсальных голосовых помощников.