Разделы

Интернет Веб-сервисы Техника Российское ПО

«Яндекс» создал «убийцу» Shazam для мессенджера Telegram

«Яндекс.Музыка» испытывает новую технологию распознавания музыки, которая позволит более точно отвечать на вопрос пользователей: «Как называется песня, которую я сейчас слушаю». В ее основе – самообучающаяся нейросеть.

В мессенджере Telegram заработал бот «Яндекс.Музыки», способный распознавать мелодию, которую слышит пользователь. Как и при использовании популярных сервисов Shazam или Soundhound, достаточно включить микрофон устройства при запущенном боте, и через несколько секунд на экране появятся название трека и ссылка на него на «Яндекс.Музыке».

Раньше «Яндекс» уже использовал собственную технологию распознавания в мобильном приложении «Яндекс.Музыки». Она основана на сравнении спектрограмм присланного пользователем отрывка и записей из имеющейся базы музыкальных произведений. Сам «Яндекс» отмечал, что у нее были ограничения: на точность распознавания сильно влиял окружающий шум при записи отрывка.

Сравнение сигнатур на спектрограммах

Бот, как сообщается в корпоративном блоге «Яндекса», не копирует старую технологию. В его основе лежит другой подход. Если раньше проводилось сравнение сигнатур треков по набору правил, которые как раз и не могли описать возможные искажения звука, то сейчас задача распознавания возложена на нейросеть. Она действует не по жестким правилам, а на основе самостоятельно принятых решений. Для повышения точности распознавания в нейросеть загружается большое количество образцов музыки с разнообразными искажениями, на которых она самообучается.

В настоящее время, по сообщению компании, бот работает в тестовом режиме и способен распознавать несколько миллионов треков из базы «Яндекс.Музыки». В дальнейшем планируется расширение его «кругозора» за пределы «Яндекс.Музыки». Кроме того, компания планирует создать использовать эту технологию и в других своих продуктах, не ограничиваясь ботом в Telegram.

Павел Притула