История одного поисковика (Часть 2)

В марте 1995 года Ларри вместе с группой выпускников Мичиганского университета приехал в Стэнфорд. На тот момент ему было уже 24 года. Ознакомить группу с университетом поручили Сергею Брину, который проучился там уже два года. Участники экскурсии впоследствии рассказывали, что Ларри и Сергей весьма не понравились друг другу - они начинали спорить по любому пустяку, каждый стремился доказать правильность своей точки зрения. Вероятно, на этой почве они и сошлись, став вскоре близкими друзьями.

[Университетский Google]

Сергей, получивший уже степень магистра, успел поучаствовать в реализации многих учебных проектов: он разрабатывал систему отслеживания нарушения авторских прав, участвовал в создании конвертора документов формата TeX в HTML (его использовали для публикации научных документов в Сети), создал сайт, на котором осуществлялась рейтинговая оценка новых кинофильмов. Но все больше его занимали проблемы сбора данных. Он вступает в рабочую группу MIDAS (Mining Data at Stanford).

В этом же направлении вел свои исследования и Ларри Пейдж. Раньше не разделявшие идеи друг друга, Сергей и Лари впоследствии сходятся во мнении, что существующие поисковые системы крайне неэффективны, и что необходимо выработать новый подход к поиску информации в интернете.

В конце 1995-го они начинают вместе работать над совместным проектом под управлением доцента кафедры информатики и вычислительной техники Раджива Мотвани. Их проект в общих чертах был готов уже к началу 1996 года и представлял собой совершенно новый алгоритм поиска информации, технологию получившую название Page Rank.

Основная идея технологии проста для понимания и состоит в следующем. Созданный парнями весной 1996 года поисковый сервер BackRub анализировал так называемые обратные ссылки (back links), то есть количество ссылок в интернете, ведущих на данный сайт.

Далее выстраивал иерархию сайтов, основываясь на полученных данных. Таким образом, реализуется основная идея, предложенная Пэйджем и Брином для эффективного поиска информации: чем чаще имя сайта цитируется в Сети, тем более актуальную и нужную информацию для пользователя он содержит.

В ответ на определенный запрос поисковик выводил ссылки, предварительно отсортированные по значимости. Сортировка эта осуществлялась не только путем анализа количества ссылок на данный сайт, но и анализа их качества - ссылка с сайта, занимающего высокое место в иерархии, имела больший удельный вес, чем ссылка с менее значимого, пропорционально их положению в общем рейтинге. Идея была описана в нескольких научных статьях, опубликованных Брином в американских академических журналах.

История одного поисковика (Часть 2)

Главное меню