«Яндекс» запустил голосового помощника с чувством юмора

Интернет Веб-сервисы Техника
мобильная версия
, Текст: Валерия Шмырова

«Яндекс» запустил голосового помощника Алису, которого компания считает лучшим в мире по распознаванию русской речи, а также первой в мире программой такого рода, с которой можно просто «поболтать». При создании Алисы упор делался на понимание естественной разговорной речи, помощник даже умеет шутить.


Запуск Алисы

Компания «Яндекс» запустила собственного голосового помощника, получившего имя Алиса. Как утверждают разработчики, это первый в мире голосовой помощник, ответы которого на вопросы пользователя не сводятся к заранее заданному набору. В основе программы лежит нейросеть, прошедшая обучение на большом текстовом массиве. Это позволяет Алисе поддерживать обычный повседневный разговор — то есть, с ней можно просто «поболтать», сообщает «Яндекс».

Алиса получила голос актрисы Татьяны Шитовой, которая озвучивает Скарлетт Йоханссон (Scarlett Johansson) в русскоязычном дубляже. Чтобы овладеть этим голосом, нейросеть Алисы прошла обучение на записях Шитовой. Нейросеть отвечает за составление слов из отдельных звуков и подбор подходящей интонации. По словам разработчиков, это придает речи Алисы естественность. Голос Шитовой уже использовался для озвучивания компьютерной программы — им говорит операционная система Саманта из фильма «Она» Спайка Джонза (Spike Jonze).

Сфера применения

В настоящий момент Алиса может работать с такими сервисами «Яндекса» как «Поиск», «Карты», «Музыка» и «Погода» для iOS и для Android. Она способна запустить стороннее приложение — например, Instagram или «Вконтакте». «Яндекс» планирует расширить список сервисов, как своих так и чужих, к которым может обращаться Алиса, включив в круг ее задач вызов такси, помощь в выборе фильма и т. д.

Пообщаться с Алисой пользователи могут в приложении «Яндекс» и бета-версии Голосового помощника для Windows. Вскоре ожидается появление Алисы в «Яндекс.браузере» и других продуктах компании.

«Яндекс» запустил голосового помощника по имени Алиса

Напомним, что у компании Google также есть голосовой помощник Google Assistant, встроенный в мессенджер Google Allo, умную колонку Google Home, умные часы Android Wear и смартфоны Google Pixel. Запущенный в 2016 г., Google Assistant стал логическим продолжением сервиса персонализированного поиска Google Now. Также на рынке голосовых помощников пользуются популярностью Apple Siri и Amazon Alexa.

Распознавание речи

По словам разработчиков, для Алисы не представляют трудности неполные предложения пользователя или такие высказывания, где необходимо учитывать контекст. Особенностью помощника является то, что с ним можно говорить в свободной маненре — например, использовать формулировку «Где поблизости выпить кофе?» вместо «кофейня улица космонавтов». Воспользовавшись «Яндекс.справочником», помощник подберет подходящее заведение. Затем пользователь может поинтересоваться «А как туда пройти?» и получит в ответ ссылку на маршрут в «Яндекс.картах».

По словам Дениса Филиппова, руководителя направления речевых технологий «Яндекса», при создании Алисы разработчики стремились к тому, чтобы она «говорила с людьми на их языке, а не приучала к своему, как это делали компьютерные интерфейсы в прошлом». В настоящий момент Алиса является лучшим голосовым помощником с точки зрения распознавания русской речи, если оценивать пословную вероятность ошибки (WER), отмечает Филиппов.

Разговор с Президентом России

Алиса впервые была запущена в мае, на тот момент только в тестовой версии приложения «Яндекс» для Android. В сентябре с голосовым помощником пообщался Владимир Путин, посетивший офис компании. На вопрос президента «Тебя тут не обижают?» Алиса дала ответ «Окей, учту», показавшийся ему уклончивым. На вопрос «Как ты себя чувствуешь?» голосовой помощник ответил, что занят рассматриванием фотографий котиков.

Разработчики объяснили Путину, что Алиса была создана для поддержания живого разговора, поэтому она выдает неожиданные ответы и умеет шутить. Манера разговора зависит от материала, на котором обучается нейросеть. После знакомства с русской литературой она начала выдавать мрачные сентенции, а после подключения к соцсети Twitter перешла на подростковый стиль.

Технология SpeechKit

При создании Алисы была использована собственная разработка «Яндекса» — технология синтеза и распознавания речи SpeechKit, представленная в 2013 г. SpeechKit также лежит в основе голосового поиска в сервисах «Яндекса». Технология умеет распознавать русскую и турецкую речь. Точность распознавания речи при осуществлении запросов на общие темы составляет 84%, при запросах по адресу и названию объекта — 94%.

В 2014 г. «Яндекс» выпустил облачный комплект разработчика SpeechKit Cloud SDK, который позволяет встраивать технологию в сторонние сервисы. Синтезом речи SpeechKit пользуется виртуальный центр обслуживания звонков «Мегафона», а также системы голосового управления автомобилем «Камаза», «Тойоты» и «Хонды».