Разделы

Интернет Веб-сервисы

Будущее интернета: нужен "умный" визуальный поиск

Визуальный поиск становится столь же важной составляющей "всемирной паутины", как и традиционный текстовый. Однако существующие на сегодня решения не всегда могут достойно ответить на запросы пользователей. Какие технологии дадут реальную эффективность? Рассмотрим реалии рынка.

Более половины объема головного мозга используется для распознавания визуальных образов. Сложнее всего при этом определить контекст видимого изображения, то есть ответить на вопрос "Что это?" Ведь для этого ведь нужно сопоставить полученное изображение с миллионом образов, накопленных в процессе развития и обучения.

Компьютер с подобными задачами справляется значительно лучше. Тем не менее, с 70-х годов прошлого века, когда ученые начали увлекаться системами технического зрения, впечатляющего прорыва так и не произошло. Сложность задачи явно недооценили - проблема качественного поиска по изображениям остается нерешенной до сих пор.

Традиции

В настоящий момент к вопросу поиска по изображениям традиционные поисковые системы подходят с теми же алгоритмами, что и к поиску по тексту, индексируя только те картинки, которые содержат в своем описании ключевые слова и фразы. Семантический робот – сердце любой поисковой системы – "считывает" текстовое описание изображение (название файла, ссылку с картинки, а также сопроводительный текст на странице вокруг картинки), строит индекс соответствия искомому изображению и располагает вновь найденный объект выше или ниже в результатах поиска в зависимости от степени соответствия поисковому запросу.

Однако проблема заключается в том, что более 99% всех размещенных в интернете изображений не имеют текстовых меток, а за наименование файлов "отвечает" чип в фотоаппарате. Стоит ли говорить, что описать каждое вновь появляющееся в интернете изображение вручную не представляется возможным.

Количество новых изображений, добавляемых в Facebook ежедневно, млн

Kuznech, 2012

В результате поисковые роботы ежедневно проходят мимо миллиардов новых изображений, потребитель не может найти интересные и нужные ему картинки, авторы изображений теряют потенциальную аудиторию, а социальные сети, фотохостинги и фотостоки недополучают доходы от рекламы или продажи прав на использование изображений.

Идеи

Если немного помечтать, то можно предположить, что целый ряд индустрий изменится до неузнаваемости, когда появится работающий адекватный, массовый визуальный поиск. База данных Google содержит информацию всего о паре десятков миллиардов изображений, остальные триллионы представляют собой "темную материю" интернета – она занимает дисковое пространство, но доступна только автору и двум-трем его друзьям.

Кто-то скажет, что все эти триллионы изображений ему не нужны, потому что они не представляют никакой ценности. Да, они не нужны, но среди них есть тысячи, которые соответствуют текущим интересам или запросам конкретного человека. Причем запросам не текстовым, а визуальным. Например, разглядывая фотографию современного города, подпирающего небо башнями небоскребов, хочется узнать больше про это место. Десятки тысяч людей уже были там, оставив свои воспоминания на фотохостингах и в социальных сетях, но сейчас приходится заново размещать фотографию, например, на виртуальной стене и спрашивать друзей "кто-нибудь узнает это место?"

Потребители

Очевидно, что круг для применения технологии визуального поиска очень широк: начиная от промышленных задач из области медицины, геологии, безопасности и защиты авторских прав и заканчивая простыми запросами обычных интернет-пользователей. Приведем в пример несколько ситуаций.

В хорошем магазине в торговом центре опытный продавец задаст клиенту пару уточняющих вопросов и предложит несколько вариантов. Интернет-торговля до сих пор не приносит психотерапевтического удовольствия от размеренности в выборе товара - ведь сайты оперируют ограниченным набором категорий и параметров. В свою очередь, визуальный поиск позволяет в качестве шаблона использовать любое изображение, что порой значительно упрощает процесс поиска "такого же, но без крыльев".

В поисковых системах поиск изображения для иллюстрации заметки в социальной сети, блоге или на аватарку устойчиво входит в тройку самых популярных запросов по изображениям. Очевидно, что эффективная система визуального поиска облегчит и упростит его.

Технооснова

Все вышеперечисленное – пока мечты. Чтобы они превратились в реальность, необходима работающая технология, способная быстро – за доли секунды – находить похожие изображения и ранжировать их, как это делает классическая поисковая система с текстовой информацией. При этом не нужны никакие сверхразработки – весь математический аппарат для технического зрения был разработан еще в 80-х годах прошлого века, а технологии обработки огромных массивов информации доступны по лицензии с открытым кодом.

Кроме того, следует научиться индексировать десятки миллиардов изображений – снимая с них "цифровой отпечаток" для дальнейшей идентификации и удаляя оригинал после этого (чтобы не дублировать весь интернет у себя и не нарушать права автора изображения). Эти технологии также отработаны в рамках существующих поисковых систем.