Директор исследовательского отдела Google -> Поисковые системы интернета -> Глава Google Research

Интервью с Peter Norvig

Глава Google Research рассказывает о проектах исследовательского отдела.

By Kate Greene

Peter Norvig, директор исследовательского отдела Google, является экспертом в создании машин, которые отвечают на сложные вопросы. Будучи специалистом в языках программирования и искусственном интеллекте, он написал часто цитируемую книгу “Искусственный Интеллект: Современный Подход” (Artificial Intelligence: A Modern Approach), преподавал в Университете Калифорнии, Беркли и университете Южной Калифорнии, и был главой департамента компьютерных наук NASA. В 2001 году Norvig перешел в Google, чтобы стать директором отдела по качеству поиска. Через четыре года он стал директором исследовательского отдела, имея в подчинении более 100 исследователей, которые изучали широкий круг вопросов от сетей до машинного перевода. Technology Review поговорила с Norvig, чтобы разузнать, что нового мы можем ожидать в поисковых технологиях в ближайшие годы.

Technology Review: Чем занимается Google Research?

Peter Norvig: Основа наших исследований - поиск и реклама. Множество исследователей работают над этим. Они работают над тем, как повысить качество поиска и как улучшить релевантность рекламных объявлений. Другая область исследований - сбор большего количества источников информации, таких как текст из книг, изображения, видео, и теперь уже даже звуковая информация в целях распознавания речи. Я думаю другой фокус исследований - понять, как люди взаимодействуют с Google и друг с другом в сети вообще. Что люди делают в социальных сетях? Понимание этого вопроса может помочь нам лучше обслуживать людей.

TR: В какой области исследований занято больше всего людей?

PN: Есть два самых крупных проекта: машинный перевод и голосовой проект (распознавание речи). Сначала этими проектами занимались один-два человека, а теперь это наиболее актуальные темы.

TR: Похожим образом развивается и проект Google Labs, названный GOOG-411 (бесплатный сервис, который позволяет людям искать местные компании, произнося поисковый запрос по телефону). Расскажите нам больше об этом проекте.

PN: Я думаю это лучший сервис такого рода (основанный на телефонных разговорах бизнес-поиск), не имеющий аналогов в мире. Он на 100% автоматизирован, и этому есть простое объяснение. В общих чертах, похоже на то, что все движется к мобильности рынка, и мы подумали, что важно уметь работать с таким рынком, даже когда у вас нет под рукой клавиатуры или вам лень вводить поисковые запросы.

TR: И распознавание речи может быть полезно также и для поиска видео, не так ли? Blinkx и Everyzing - примеры таких начинаний, которые используют технологию поиска видео. Google работает над чем-то похожим?

PN: На данный момент люди мало ищут видео. А если ищут, то названия конкретных фильмов. Люди не ищут что-то вроде “Покажите мне разговор, в котором тот-то и тот-то говорят про аспекты средневековой истории”. Но вся информация именно в таком запросе, и благодаря распознаванию речи мы можем до нее дотянуться.

Мы хотели создать голосовую технологию, которая могла бы служить нам как интерфейс для телефонов и позволила бы индексировать аудио текст. Посмотрев на существующие технологии, мы решили создать свою собственную. Мы подумали, что имея доступные нам данные и вычислительные ресурсы, мы могли бы сделать еще очень много в данной области. На данный момент мы разработали новейшую и наиболее совершенную технологию, и у нас есть вычислительные мощности для ее дальнейшего совершенствования. Как только мы получим больше данных о взаимодействии с пользователями и о статистике загрузок видео, наши системы станут лучше, поскольку новые данные постоянно совершенствуют алгоритм.

TR: Поскольку большинство исследований происходят за опущенным занавесом, то внешне выглядит так, как будто поисковые технологии не изменились за последние более чем 10 лет. Что меняется в пользовательском интерфейсе Google?

PN: Мы находимся в такой ситуации, что веб-поиск не сбалансирован. Люди дают нам три слова, и в то же время мы возвращаем им множество информации: 10 ссылок с заголовками, текстовым сниппетом и другой информацией о странице. То есть мы способны дать много и сразу. Если у пользователя большой экран, он может очень быстро использовать ответ Google. Итак, это взаимодействие быстрое, но очень несбалансированное. Сейчас мы ищем возможность сделать пользователей более вовлеченными в процесс взаимодействия, чтобы они рассказали нам, чего они хотят. Люди вводят запрос “карта”, и остаются недовольны, если в выдаче не та карта, о которой они думали. Значит нужно дать людям возможность больше говорить, чем печатать. Или им придется принять то, что предлагаем мы - не то, что они вводили в поиске, а нечто похожее.

Но есть и другие виды взаимодействия с поиском, кроме основного веб-поиска. Если вы пользуетесь мобильным телефоном, вы можете видеть только одну ссылку одновременно. Это полностью меняет правила игры. Для нас такая ситуация - мощный толчок к улучшению корректности поиска. Поэтому мы исследуем и такие виды взаимодействия, и то, как применить звук для предоставления информации.

TR: А есть какие-нибудь необычные проблемы в поиске?

PN: Есть два основных момента. Первый - понимание потребности пользователей. Второй - понимание содержания документов, причем неважно, будет это веб-страница или видео. Больше всего внимания мы обращаем на то, что пользователь вводит в строке поиска, разделяем ввод на отдельные слова, считаем их количество на страницах и разделяем страницы по весу, используя множество факторов. Но мы смотрим не только на вводимые слова. Мы также рассматриваем различные варианты произношения слов, и если пользователь вводит длинный запрос, мы делим его на части. Возможно, пользователь имел ввиду одни слова, а другие совсем неважны.

TR: Похоже на элементы естественно-языкового поиска, когда люди вводят вопрос, например, вместо нескольких ключевых слов. Как Google разрабатывает естественно-языковой поиск?

PN: Я думаю, что есть целый круг вопросов, которые вы можете причислить к естественно-языковому поиску. Первой частью этого “круга” мы занимаемся уже долгое время. Например, мы понимаем синонимы и что два слова Сан Франциско должны идти подряд. Но еще есть Лас Вегас и Вегас, которые означают одно и то же, и Нью Йорк и Йорк, которые уже значат разные вещи. Эти вопросы мы уже решили. Другая составляющая естественно-языкового поиска - разделение длинного запроса на компоненты. То есть удаленный пользователь пишет законченное предложение по-английски и получает законченное предложение в ответ. Этим вопросом мы еще не занимались. Вы можете ввести “население Японии”, и мы вам это покажем. Но для большинства вопросов это не то, чего хотят люди. Они не хотят утруждаться, составляя в уме из отдельных данных нормальное предложение.

TR: Ваша специальность - искусственный интеллект. Не является ли Google в своей основе AI компанией, использующей самообучающиеся машинные алгоритмы для поиска в Web, распознавания речи и показа рекламы, соответствующей ключевым словам?

PN: Я думаю многие AI специалисты делают все возможное для решения вопросов, на которые нельзя дать определенного ответа. Какая выдача лучше всего соответствует введенному запросу? На этот вопрос нет единственно правильного ответа, он субъективен, и именно этот вопрос пытается решить Google. Поэтому я думаю, что вполне справедливо сказать, что это проблема искусственного интеллекта. Но способ подачи этого вопроса имеет множество разных подходов. Это и AI алгоритмы, и разработка программного обеспечения, и вычислительная техника, и сетевые решения - все вместе делает решение проблем быстрым и эффективным. Я бы не сказал, что искусственный интеллект - это все, это скорее часть целого.


Меню сайта

Интервью с Peter Norvig
Интервью с Peter Norvig