Закон Ципфа: Google круче Яндекса

Эта статья посвящена оценки качества контента сайта поисковыми системами.

Речь пойдёт о Законе Ципфа. Есть такой замечательный Закон Ципфа. Довольно не простое определение нашёл в википедии:”Закон Ципфа — эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка упорядочить по убыванию частоты их использования =), то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n. Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д. Закон носит имя своего первооткрывателя — американского лингвиста Джорджа Ципфа (George Zipf) из Гарвардского университета.”
Далее идёт трудно понимаемая обычному человеку фраза “Объяснение закона Ципфа, основанное на корреляционных свойствах аддитивных марковских цепей было дано в работе. Закона Ципфа математически описывается распределением Парето.”

Другими словами закон Ципфа позволяет оценивать естественность текста. И создатели сервиса 1y.ru предполагают, что поисковые системы таким же образом оценивают естественность контента на сайтах.

Я решил проверить следующие сайты google.ru и yandex.ru. Google.ru получил оценку качества контента 88%.
Скриншот ниже.
hb

Какой же результат у Яндекса? Его значения плавают каждые 2-5 секунд, они могут быть и 56%, и 96%, и 84%. Последняя проверка показала 84%. Это объясняется тем, что на yandex.ru имеется новостная лента. Эх, как я не люблю эту новостную ленту ))).

jh