Михаил Санников 17 декабря 2008

Google: Будущее поисковых систем

Архив

Время чтения: 11 минут

Марисса Мейер,
Вице-президент Google по поисковым продуктам и взаимодействию с пользователем

Я поисковая наркоманка. Любопытна от природы – постоянно стараюсь найти что-нибудь новое и интересное. Плюс ко всему я работаю над поисковыми технологиями в Google более девяти лет. Поэтому я никого не удивлю, если скажу, что «ищу» постоянно. Тем не менее, я считаю, что ежедневно до поисковой строки браузера добирается лишь 20% моих вопросов. Возьмём, к примеру, прошлую субботу. Я намеренно фиксировала возникающие по ходу дня вопросы, которые бы хотела уточнить, но по разным причинам не смогла этого сделать:

Настоящие ли слова «fab», «goy» и «eely», или же партнёры по скрабблу меня обманули? До которого часа по субботам открыты магазины сети J.C. Penney? За какую школу играет команда Banana Slugs? Какой талисман у команды San Jose State? Какое количество электроэнергии вырабатывает гидроэлектростанция? В какое время будут показывать фильм Tropic Thunder? Какая фамилия у известного ирландского флейтиста, которого зовут Джеймс? Какой третий по величине город России после Москвы и Санкт-Петербурга? Что старше, секвойя или кипарис? Какой из живых организмов самый старый и сколько ему лет? Кто исполняет «Queen of hearts»? «LF» в Сан-Франциско находится на Площади Согласия или на Улице Согласия? Как танцуют чарльстон? В какой день недели показывают шоу Лоренса Велка? Какие слова в песне «In the mood»? Что сильнее расширяет сосуды – варфарин или аспирин? Каким образом число «гугол» получило такое название?

И это только те, что я запомнила. Глядя на этот список, очевидными становятся два факта. Во-первых, я действительно испытываю необходимость искать всегда и везде. Во-вторых, сегодняшние поисковым системам есть куда расти. Существует множество путей и способов, позволяющих удовлетворять растущие запросы пользователей. Давайте попытаемся взглянуть на мои оставшиеся без ответов субботние вопросы и предположить, каким образом поисковые системы изменятся в ближайшие десять лет.

Сценарии поиска

Для начала давайте разберёмся, почему я не могу осуществить все эти запросы прямо сейчас. Потому что поисковики, как бы ни старались, пока не достаточно доступны. Поисковику сегодня надлежит быть гораздо более мобильным – он должен быть быстр и лёгок в использовании, будучи запущенным с сотового телефона (вообще с любой карманной электроники), внутри автомобиля или даже верхней одежды (пусть мы пока и не имеем таких устройств). К примеру, когда возник вопрос о самых старых живых организмах – мы как раз катались на лодке. Всей нашей компании было любопытно, и всем был интересен ответ, но никто не стал искать его с помощью неудобных и медленных телефонов/коммуникаторов. Ситуация бы изменилась, владей мы устройствами с по-настоящему широкими коммуникационными возможностями, способными осуществлять непрерывный поиск. А как вам идея верхней одежды, оснащённой электроникой, которая способна вычленять ключевые слова из ваших разговоров в реальном времени и сразу же производить поиск в фоновом режиме, выдавая результаты в удобной форме?

Такой взгляд на поисковые технологии, подводит нас к мыслям о ещё одном перспективном сценарии – голосовом поиске. У пользователя должна быть возможность разговаривать с поисковиком на привычном ему (пользователю) языке, при этом не важно, вербально передаются запросы или это язык жестов. Главное сейчас – перешагнуть через стереотип, что поиск всегда должен осуществляться посредством вбивания в форму ключевых слов с клавиатуры.

И почему поисковый запрос вообще должен состоять из слов?! Мне бы очень хотелось загрузить фотографию пролетевшей мимо птицы для того, чтобы выяснить её название. В конце концов, фотография – это единственное, что я могу предоставить поисковику в этом случае. Почему я до сих пор не могу дать прослушать поисковику отрывок аудиозаписи (радиопередачи, речи и пр.) и получить в ответ релевантные результаты. Многие скажут: «Подобные сервисы уже существуют», но давайте посмотрим фактам в глаза, они пока далеки от идеала, и с ними не просто работать.

В следующие десять лет мы сможем наблюдать радикальные изменения именно в сценариях поиска: мобильные устройства смогут предложить нам куда более лёгкий и ненавязчивый поиск. Интернет просочится в куда более значительное количество устройств. Появятся разнообразные способы формирования запросов с помощью голоса, жестов, рисунков или музыки. Используемый нами сегодня сценарий поиска по ключевым словам эффективен ровно настолько же, насколько и ограничен. Появление в будущем новых сценариев, пожалуй, – самое главное и революционное изменение, к которому должны быть готовы поисковые системы.

Типы контента

Теперь давайте поговорим о типах поддерживаемого поисковиками контента. Десяток синеньких гиперссылок в поисковой выдаче – это, без сомнения, полезно и здорово, но что прикажете делать с текстовой информацией, когда мне нужно выяснить, как танцуют, скажем, чарльстон? Быть может видео в этом случае будет гораздо эффективнее? Так или иначе, сегодня тип найденного материала играет важную роль.

Универсальный поиск, который мы запустили в мае прошлого года, – важный первый шаг в этом направлении. Он умеет включать изображения, видео, новости, книги, картографическую информацию и многое другое в поисковую выдачу. К сожалению, пока эта самая поисковая выдача всё равно выглядит очень линейно (результаты, как и прежде, выдаются списком). Что если внешний вид страницы поисковой выдачи изменить таким образом, чтобы 10 найденных материалов (видео, картинки, карты, обычные страницы и пр.) представляли собой единый результат поиска, а не просто 10 ссылок различной полезности? Что если страница поисковой выдачи будет содержать разный контент и учитывать его объем при подсчёте релевантности результата (скажем, наиболее релевантная статья уступает первую строчку подборке из видео, аудио и эссе, несмотря на то, что каждый из этих материалов по-отдельности не сильно релевантен)? Или, например, при формировании страницы поисковой выдачи применить вёрстку колонками, которая позволит по полной использовать потенциал модных широкоформатных мониторов?

Всё это – только верхушка айсберга возможностей, которыми нас должен будет обрадовать глобальный поиск. За прошедший год мы многое сделали для увеличения релевантности «смешанной» поисковой выдачи и улучшения сопутствующих ей пользовательских интерфейсов. Вы сможете увидеть результаты нашего труда уже в ближайшие месяцы, но помните, что все эти нововведения – лишь начало длинной череды перемен, которые в течение ближайших 10 лет кардинально изменят поисковые технологии. Быть может, поисковики в будущем будут выдавать нам больше изображений и видео, быть может, они станут качественнее отбирать и сортировать результаты, а быть может, окажутся более интерактивными, чем сегодня? Пока что мы сами не знаем ответ, но зато мы точно знаем, чего с поисковыми системами никогда не произойдёт – особенно, если принять во внимание наблюдаемый сегодня бум онлайновых медиа, – поисковики никогда не перестанут развиваться.

Персонализация поиска

Поисковые движки через 10 лет будут гораздо лучше, чем сегодня. Мы знаем это потому, что компания Google сама становится лучше с каждым днём. Мы постоянно пишем новые и пересматриваем старые пожелания к алгоритмам ранжирования, улучшая их ежедневно. Сейчас уже не стоит вопрос: «Будут ли поисковики будущего лучше?», куда более важно – «за счёт чего они будут лучше».

Один ответ у нас есть: поисковые системы будущего будут лучше искать за счёт того, что будут знать всё о свих пользователях. Разумеется, вы сможете управлять своей персональной информацией, она будет использоваться с вашего разрешения, и процессы, в которых она будет участвовать, станут для вас совершенно прозрачными. Обладая даже самыми элементарными данными о пользователе, поисковые машины смогут значительно увеличить качество выдаваемых результатов. Быть может, поисковики будущего смогут узнавать где вы находитесь территориально, быть может, они будут осведомлены о ваших существующих знаниях или о том, что вы успели изучить днём ранее, а быть может, им будут целиком известны ваши предпочтения и приоритеты, потому что вы заблаговременно поделитесь с ними этой информацией. Пока мы не уверены в том, какие именно персональные данные окажутся наиболее ценными для поискового движка, но сегодня мы продолжаем вкладывать ресурсы в исследования и эксперименты из-за уверенности в том, что это будет очень актуально уже завтра.

Местоположение

Ваше местоположение – одна из наиболее полезных для поисковика деталей персональной информации. Взгляните на вопросы, которые я записала вначале. Если бы поисковый движок при формировании страницы выдачи знал, что я бывала в Янктоне (Южная Дакота) и Крофтоне (Небраска), то я получила бы гораздо более релевантные результаты, чем при поиске без учёта моих местоположений.

Социальный граф

Другой элемент персонализации поиска – его социальный контекст. Кто мои друзья, и какие у меня с ними взаимоотношения? Каким образом я могу наиболее рационально использовать их знания? Например, у меня есть друг, который работает в магазине «LF» в Лос-Аджелесе (я задавала вопрос о «LF» в Сан-Франциско). На самом деле «LF» неоднозначная аббревиатура. Верхние результаты поисковой выдачи Google говорят именно о модном магазине одежды, в котором как раз работает мой друг. Но, проследовав вниз по списку можно обнаружить ссылки на Leapfrog Enterprises, low frequency, Lebhar-Friedman, Li & Fung Investment Group, LF Driscoll Construction Management, large format и даже на футуристический концепт-кар от компании Lexus. Сегодня человек, вбивающий в строку поиска буквы «LF», вынужден сам отделять зёрна от плевел и точно идентифицировать результат запроса «неоднозначной аббревиатуры». Мы сможем переложить эти действия на поисковый движок, сделав его ещё лучше. Возможно, поисковик научится понимать, что пользователя интересует именно магазин, а не что-то другое, из самого контекста вопроса. Или, быть может, движок, проанализировав мой социальный граф и выяснив, что один из моих друзей, с которым я встречалась в прошлые выходные, работает в модном магазине «LF», и будет искать аббревиатуру именно в этом контексте? Одним словом, анализ социального графа пользователя в будушем окажется очень полезным при ранжировании результатов поиска.

В дополнение к вышеперечисленному поисковики смогут просить помощи у ваших друзей и знакомых. Я убила кучу времени пытаясь найти разницу между аспирином и варфарином. В конце концов, выяснилось, что я просто напортачила, напечатав в запросе «варфорин», а поисковик меня не поправил. Быстрыйe-mail другу-врачу вернул меня на верную дорогу. Вооружённая правильным названием и сравнительной характеристикой обоих препаратов, я моментально отыскала ответ на вопрос, как эти два медикамента влияют на расширение сосудов. В социальном графе можно почерпнуть огромное количество знаний и опыта других людей, поэтому «социально аргументированный» поиск мог бы давать гораздо более полезные результаты, чем обычный.

Поиск на родном языке

Приведённые примеры показывают, каким образом увеличение сценариев поиска, включение в выдачу разного типа контента и опора на социальные связи пользователя могут увеличить эффективность поисковых движков. А что же насчёт языка? Всем нам прекрасно известны случаи, когда ответ на вопрос представлен в Сети на незнакомом языке. Вот почему Google не устаёт вкладывать средства в развитие технологий машинного перевода. Мы хотим раскрыть весь потенциал веб-поиска для любого человека, говорящего на любом языке. Концепция проста: если где-то в Сети существует ответ на ваш вопрос, мы найдём его, переведём на ваш родной язык и доставим по назначению. Такая возможность по-настоящему изменит сценарий поведения пользователя в Сети и его взаимодействия с другими пользователями, предоставляя ему любой, недоступный ранее из-за языкового барьера, контент. Наши наработки в этом направлении постоянно находят отражение на страницах сервиса Google Translate.

Заключение

Все мы знакомы с правилом 80/20. Когда, к примеру, 20% результата достигаются за счёт 80% работы. Работа над поисковиком исповедует правило 90/10. Сегодня мы имеем 90% результата: Я нашла ответы на все мои субботние вопросы. Не идеальные и не просто мне давшиеся ответы, но зато полученные с помощью сегодняшних поисковых инструментов. Тем не менее, эти оставшиеся 10% результата совершенно точно потребуют от нас затратить 90% (на самом деле даже больше) сил для их реализации. На построение поисковика, использующего принципы, описанные в этом эссе, могут уйти десятилетия. Поиск – это наука, которая будет развиваться и совершенствоваться веками. Сегодня эту науку можно воспринимать так же, как в 16-17 веках воспринимали биологию или физику: это новое течение, заря нового научного знания, в котором мы бесперестанно открываем что-то новое. Тем не менее, пройдут сотни лет до тех пор, пока мы не изобретём «поисковые микроскопы», пока не откроем его молекулы и атомы. Точно так же, как в биологии или физике несколько сотен лет назад, крупнейшие открытия сетевого поиска пока что лишь маячат на горизонте. Вот почему работа над веб-поиском сегодня так увлекательна – это молодая, ещё толком не сформировавшаяся наука.

Хотите знать, что в нашем понимании «идеальный поисковик»?! Это ваш лучший друг и помощник, обеспечивающий моментальный доступ ко всем фактам Мира, который при этом обладает фотографической памятью всего, что вы когда-либо видели и знали. Этот поисковик сможет подбирать ответы, основываясь на ваших личных предпочтениях, существующих знаниях и самой качественной, из всех доступных, информации. Он сможет преобразовывать ответы и представлять их в наиболее эффективном и выгодном для пользователя виде. Я очень горжусь тем, что Googleв первые 10 лет своего существования кардинально изменила отношение пользователей к информации, размещённой в Сети, сделав её поиск быстрым и лёгким. Но гораздо сильнее мою кровь согревает осознание того, сколько всего интересного нам предстоит сделать для поиска в будущем.

Следующие записи цикла читайте в блоге переводчика.

Чтобы прочитать эту статью до конца,
или

Google: Будущее поисковых систем

Комментарии 0

Похожие статьи

Как системы управления жизненным циклом договоров упрощают жизнь бизнесу

Directum стал спонсором Ассоциации специалистов в сфере управления документами

Свежая поставка процессов: как АШАН перешел на КЭДО