PageRank — метод присвоения индексированным поисковыми системами сайтам конкретных числовых значений, отражающих их качество.

Алгоритм PageRank используется в популярной поисковой системы Google. Он был разработан основателями Google Ларри Пейджем и Сергеем Брином во время их обучения в Стэнфордском университете в 1998 году. Название алгоритма происходит не от английского слова страница (англ. Page), а от фамилии его создателя — Ларри Пейджа. Название «PageRank» является торговой маркой компании Google и есть составной частью алгоритма ее поисковой системы. Однако сам патент принадлежит Стэнфордскому университету, а не Google. Компания получила лицензионные права на его использование от Стэнфордского университета в обмен на пакет акций Google стоимостью в 1,8 млн. долларов, которые в 2005 году уже были проданы университетом за 336 миллионов долларов .

На что влияет PageRank

PageRank основан на методе вычислений, согласно которому качество текста пропорционально количеству текстов ссылающихся на него. Такой подход был предложен создателями Google с целью измерения количества и качества ссылок, указывающих на сайт. Другими словами, если другой текст схожей тематики ссылается на статью сайта, то ее рейтинг становится выше, и особенно это важно, когда такая ссылка идет из очень популярного сайта.

Методы, похожие на алгоритм PageRank, теперь введены в механизмы работы других поисковых систем. Подробности работы алгоритма тем не менее никогда не были опубликованы и являются одними из строжайших секретов Google. Более того, он постоянно обновляется для более эффективной работы данной поисковой системы.

Сейчас PageRank является лишь одним из многих элементов, которые определяют конечное положение страницы в результатах поиска и оказывает на них все меньшее и меньшее влияния.

Алгоритм работы PageRank

Следующий алгоритм является только одной из версий стандарта. Подробная информация об алгоритме не была обнародована.

Где:

  • PR — PageRank определенной страницы
  • D — коэффициент воздействия, число между 0 и 1 Для расчета обычно предполагается значение 0,85.
  • N — количество веб-сайтов
  • L — количество ссылок, которые ссылаются на сайт

Обычным техническим вопросом является реализация такого алгоритма для того, чтобы сделать его пригодным для обработки данных, описывающих сайты в Интернете. Размер матрицы требует специальных алгоритмов, работающих параллельно и распределенных одновременно на нескольких (тысячах) компьютерах.

Пример работы алгоритма ссылочного ранжирования

Будем считать, что есть четыре сайты, начальный PageRank которых равен 1,0:

  • A.ru
  • B.com
  • C.net
  • D.org

Затем:

  • Cтраница из A.ru ссылается на сайты B.com и D.org
  • Cтраница из B.com ссылается на A.ru
  • Cтраница из C.net ссылается на B.com и A.ru
  • Страница из D.org ссылается на C.net

PageRank рассчитывается в соответствии с алгоритмом и будет распределен следующим образом:

  • A.ru — 0,35
  • B.com — 0,27
  • C.net — 0,19
  • D.org — 0,19

Если появляется новый сайт — E.ru и на него будут идти ссылки со всех существующих у нас сайтов, то PageRank для будет распределен так:

  • A.ru — 0.22
  • B.com — 0,20
  • C.net — 0,15
  • D.org — 0,15
  • E.ru — 0,28

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *