Первыми, кто запатентовал систему учета внешних ссылок, стала компания Google. Алгоритм получил название PageRank. Google использует один из наиболее сложных алгоритмов. Часть алгоритма включает Google PageRank — систему ранжирования веб-страниц, разработанную основателями Google Ларри Пэйджем (Larry Page) и Сергеем Брином (Sergey Brin) во время их студенчества в Стенфордском университете. PageRank использует структуру ссылок для определения релевантности.
Считается, что ключевой фактор в определении PageRank — количество релевантных, тематически связанных сайтов, которые ссылаются на данный сайт. Заметьте также, что реально существует не один PageRank (PK): ToolBar PageRank (TPK) и Actual PageRank (APK). Важно понимать разницу, потому что PageRank на панели инструментов ТРК — это лишь приближенное значение действительного PageRank (АРК). Известно, что Google отображает данные PageRank той давности, когда был пересчет этого параметра. Значения PageRank, показываемые в Google ToolBar, пересчитываются достаточно редко (раз в 6—7 месяцев), поэтому ToolBar показывает устаревшую информацию и ориентироваться на нее сложно. То есть сама поисковая система Google учитывает изменения во внешних ссылках гораздо быстрее, чем эти изменения отображаются в Google ToolBar.
Зеленая полоса на панели инструментов Google показывает не точное значение PageRank, а лишь диапазон PageRank, в который попадает сайт, причем номер диапазона (от 0 до 10) определяется по логарифмической шкале.
Все цифры условны, однако наглядно демонстрируют, что диапазоны PageRank, показываемые в Google ToolBar, не равнозначны друг другу. Например, поднять PageRank с 1 до 2 легко, а с 6 до 7 гораздо сложнее.
Как видите, реальный PageRank (АРК) выглядит совершенно иначе, в англоязычной части Интернета обычно именуют термином "link juice" (в русскоязычном варианте можно использовать термин "вес ссылки"), что значит "способность страницы зарабатывать рейтинг для себя и других страниц, основанная на качестве и количестве входящих ссылок страницы". Веб-страницы реализуют этот принцип, когда ссылаются друг на друга. Все крупные поисковые системы используют принцип link juice в качестве главного фактора при ранжировании.
Кстати, интересно проанализировать работу иностранных линк-брокеров. Они дают информацию не только по PageRank ссылающейся страницы, но и по подсети IP-класса C, местонахождению сайта и количестве слов в тексте ссылки.
На практике PageRank используется в основном в двух целях:
- Быстрая оценка уровня авторитетности сайта. PageRank не дает точной информации о ссылающихся страницах, но и позволяет быстро и просто "прикинуть" уровень развития сайта. Можно придерживаться следующей градации: РК 4—5 — наиболее типичный РК для большинства сайтов середнячков. РК 6 — очень авторитетный сайт. РК 1 — величина, практически недостижимая для обычного веб-мастера, но иногда встречается. РК 8—10 — встречаются только у сайтов крупных компаний (Microsoft, Google и т. п.). Знание PageRank можно использовать при обмене ссылками, для того чтобы оценить качество предложенной к обмену страницы и в других подобных ситуациях.
- Оценка уровня конкуренции по поисковому запросу. Хотя PageRank и не используется непосредственно в алгоритмах ранжирования, тем не менее позволяет косвенно оценить конкурентоспособность заданного запроса. Например, если в выдаче поисковой системы стоят сайты с PageRank 6—7, то сайт с PageRank 4 имеет очень мало шансов опередить их в рейтинге.