Поисковая оптимизация текстов — оптимальная частота употребления ключевых слов и его идеальная длина

2 Август, 2010

Хочу предупредить, что информация излагаемая в этой статье несколько устарела. Я не стал ее переписывать, чтобы потом можно было сравнить, как меняют стандарты SEO со временем. Актуальную же информацию на данную тему вы можете почерпнуть в новых материалах:

  1. Seo оптимизация текстов для коммерческого сайта — 8 основных ошибок и 6 советов для успешного продвижения
  2. Оптимизация текстов под поисковые системы (продолжение)

Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Сегодняшняя статья опять будет посвящена такой теме, как поисковая оптимизация сайтов (SEO). Ранее мы уже затронули много вопросов, связанных с таким понятием, как внутренняя оптимизация.

Сегодня я хочу продолжить разговор о внутреннем SEO, уточнив при этом некоторые моменты затронутые ранее, а так же поговорить о том, что мы еще не обсуждали. Если вы способны писать хорошие уникальные тексты, но при этом не уделяете должного внимания восприятию их поисковиками, то они не смогут пробить себе дорогу в топ поисковой выдачи по запросам, связанным с тематикой ваших замечательных статей.

Что влияет на релевантность текста поисковому запросу


И это очень печально, ибо вы таким образом не реализуете весь потенциал вашего проекта, который может оказаться очень внушительным. Надо понимать, что поисковики по большей части — это тупые и прямолинейные программы, не способные выйти за рамки своих возможностей и взглянуть на ваш проект человеческими глазами.

Они не увидят многого из всего того, что есть хорошего и нужного на вашем проекте (что вы приготовили для посетители). Они умеют только анализировать текст, учитывая при этом очень много составляющих, но они по прежнему очень далеки от человеческого восприятия.

Следовательно, нам нужно будет хотя бы на время залезть в шкуру поисковых роботов и понять, на чем они концентрируют свое внимание при ранжировании различных текстов по различным поисковым запросам (текстовое ранжирование подробно описано здесь). А для этого нужно иметь представление об алгоритмах работы поисковых систем, для этого нужно будет ознакомиться с приведенной статьей.

Обычно стараются употребить ключевые слова в заголовке странице, в некоторых внутренних заголовках, а так же равномерно и как можно естественнее распределить их по статье. Да, безусловно, выделение ключей в тексте тоже можно использовать, но при этом не стоит забывать про переоптимизацию, за которую может последовать пессимизация.

Важна так же и плотность вхождения ключей в текст, но сейчас это скорее является не желательным фактором, а, наоборот, предостерегающим — нельзя перестараться.

Определяется величина плотности вхождения ключевика в документ довольно просто. Фактически это частота использования его в тексте, которая определяется делением количества его вхождение в документе на длину документа в словах. Раньше от этого напрямую зависело положение сайта в выдаче.

Но вам, наверное, понятно, что составить весь материал только из ключей будет не возможно, ибо он будет не читаемым, да слава богу этого и не нужно делать. Почему, спросите вы? Да потому, что есть предел частоты использования ключевого слова в тексте, после которого релевантность документа по запросу, содержащему этот ключевик, уже не будет повышаться.

Т.е. нам достаточно будет добиться определенной частоты и мы, таким образом, максимально оптимизируем его. Либо перестараемся и попадем под фильтр.

Остается решить два вопроса (а может быть и три): какова же эта самая максимальная плотность вхождения ключевика, после которой уже опасно ее увеличивать, а так же выяснить.

Дело в том, что ключевые слова, выделенные тегами акцентирования и заключенные в тег TITLE, имеют больший вес для поиска, чем аналогичные ключи, просто встречающиеся в тексте. Но последнее время этим стали пользоваться вебмастера и полностью заспамили этот фактор, в связи с чем его значение снизилось и даже может привести к бану всего сайта из-за злоупотреблений стронгами.

Но ключи в TITLE по прежнему актуальные, их лучше там не повторять и не слишком много пытать запихивать в один заголовок страницы. Если ключевики будут в TITLE, то мы можем существенно уменьшить их количество в статье (а значит сделать его легко читаемым и более приспособленным для людей, а не для поисковых систем), добившись той же самой релевантности, но не рискуя попасть под фильтр.

Думаю, что с этим вопросом все понятно — чем больше ключей будет заключено в теги акцентирования и TITLE, тем больше шансов потерять все и разом. Но если их не использовать совсем, то вы тоже ничего не добьетесь. Самым главным критерием является естественность внедрения ключевиков в текст. Если они есть, но читатель о них не спотыкается, то вообще все замечательно.

Теперь осталось разобраться с тем, а какая же частота употребления ключевого слова в документе является оптимальной, которая позволяет сделать страницу максимально релевантной, не не повлечет за собой санкций. Давайте сначала вспомним формулу, которую используют большинство (наверное, даже все) поисковиков для ранжирования.

Как определить допустимую частоту употребления ключа


Мы уже говорили ранее про математическую модель в упомянутой чуть выше статье. Суть ее для данного конкретного поискового запроса выражается одной упрощенной формулой: TF*IDF. Где TF — это прямая частота вхождения данного запроса в текст документа (частота, с которой слова в нем встречаются).

IDF — обратная частота встречаемости (редкость) данного запроса во всех остальных документах интернета, проиндексированных данной поисковой системой (в коллекции).

Эта формула позволяет определить соответствие (релевантность) документа поисковому запросу. Чем выше значение произведения TF*IDF, тем более релевантным будет данный документ и тем выше он будет стоять при прочих равных условиях.

Т.е. получается, что вес документа для данного запроса (его соответствие) будет тем больше, чем чаще употребляются ключи из этого запроса в тексте, и чем реже эти ключи встречаются в других документах интернета.

Понятно, что на IDF мы влиять не можем, разве что выбрав другой запрос, под который будем оптимизировать. А вот на TF мы влиять можем и будем, ибо хотим отхватить свою долю (и не малую) трафика с выдач Яндекс и Гугла по нужным нам вопросам пользователей.

Но дело в том, что алгоритмы поиска высчитывают значение TF по довольно хитрой формуле, которая учитывает рост частоты употребления ключевика в тексте только до определенного предела, после которого рост TF практически прекращается, несмотря на то, что вы будете увеличивать частоту. Это своеобразный антиспам фильтр.

Относительно давно (примерно до 2005 года) значение TF высчитывалось по довольно простой формуле и фактически было равно плотности вхождения ключевого слова. Результаты расчета релевантности по этой формуле не совсем нравились поисковикам, ибо потворствовало спаммерам.

Потом формула TF усложнилась, появилось такое понятие как тошнота страницы и оно стало зависеть не только от частоты вхождения, но так же и от частоты употребления других слов в этом же тексте. И оптимального значения TF можно было бы достигнуть, если ключ оказывался самым часто употребляемым словом.

Так же можно было увеличивать значение TF за счет увеличения размера текста с сохранением процента вхождения. Чем больше будет полотенце со статьей при том же проценте ключей, тем выше будет стоять данный документ.

Сейчас формула TF еще более усложнилась, но в тоже время сейчас у нас нет необходимости доводить плотность до того значения, когда текст станет не читаем и поисковые системы наложат бан на наш проект за спам. Да и писать несоразмерно длинные простыни сейчас тоже нет необходимости.

При сохранении той же самой идеальной плотности (мы ее определим чуть ниже из соответствующего графика), увеличение размера статьи в словах будет улучшать ее положение в выдаче только до достижения определенной длины. После того, как у вас получилась идеальная длина, дальнейшее ее увеличение не будет влиять на релевантность (точнее говоря, будет, но очень и очень мало).

Все это можно будет увидеть наглядно, если построить график на основе этой хитрой TF (прямой частоты вхождения). Если на одной шкале этого графика будет TF, а на другой шкале — процентное соотношение частоты встречаемости ключевого слова в тексте, то мы получим в результате так называемую гиперболу:

График, конечно же, приблизительный, ибо реальную формулу TF, которую используют Яндекс или Гугл, мало кто знает. Но качественно из него можно определить оптимальный диапазон, в котором должна находиться частота. Это примерно 2-3 процента от общего числа слов.

Если учесть, что вы еще будете заключать часть из ключей в теги акцентирования и заголовок TITLE, то это и будет тот предел, после которого дальнейшее увеличение плотности может быть чревато баном. Насыщать и уродовать текст большим количеством ключевиков уже не рентабельно, ибо минусов здесь будет больше, чем плюсов.

Какая длина текста будет достаточной для продвижения

Основываясь на той же самой, предполагаемой TF, можно построить график зависимости ее значения от длины в словах. При этом можно взять частоту ключевиков постоянной для любой длины и равной, например, какому-либо значению из оптимального диапазона (от 2 до 3 процентов).

Что примечательно, мы получим график точно такой же формы, как и рассмотренный выше, только по оси абсцисс будет отлажена длина текста в тысячах слов. И из него можно будет сделать вывод об оптимальном диапазоне длины, при котором уже достигается практически максимальное значение TF.

В результате получается, что она будет лежать в диапазоне от 1000 до 2000 слов. При дальнейшем увеличении релевантность практически не будет расти, а при меньшей длине она будет довольно резко падать.

Т.о. можно сделать вывод, что для того, чтобы ваши статьи могли занимать высокие места в поисковой выдаче, нужно употреблять в тексте ключевики с частотой не ниже 2-3 %. Это первый и основной вывод, который мы сделали. Ну, и второй — это то, что сейчас вовсе не обязательно писать очень объемные статьи для того, чтобы попасть в Топ.

Достаточно будет превзойти рубеж в 1000 — 2000 слов и включить в него 2-3 % ключевиков. Вот и все — это и есть рецепт идеального текста, который будет способен конкурировать за место в топе по НЧ запросу, даже без использования внешней оптимизации (покупки ссылок на эту статью с анкорами, включающими ключи). Хотя, пошариться чуток в Миралинксе, ГГЛ, Ротапосте или ГетГудЛинке можно, ибо это поможет вашему проекту.

Еще раз вам напомню, что длину написанного вами текста, а так же частоту употребления в нем тех или иных ключевых слов, вы можете узнать с помощью специализированных программ или же с помощью онлайн сервисов, специализирующихся на их анализе. Одним из таких сервисов является ISTIO, о работе с которым я рассказывал здесь.

Все, о чем я говорил выше, не достоверно на сто процентов, но очень похоже на правду. Во всяком случае, мой личный опыт подтверждает эту теорию. Но алгоритмы работы Яндекс и Гугла постоянно претерпевают изменения и как оно будет завтра мало кто знает, кроме тех, кто близок к их разработке или разработчикам.

Можете также посмотреть видео «Какие тексты нравятся поисковой системе»:

Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru

Еще:

Рубрики :Учимся нравиться Яндексу и Google

Комментарии и отзывы

Иглотерапевт

Меня тоже интересует тема внутренней оптимизации сайта и методиках продвижения по НЧ.

Буду следить по RSS за циклом статей. Надеюсь эти статьи все же будут написаны. Неплохо было бы подкрепить все это экспериментами.

Ольга

Спасибо за инфо. Читаю с интересом.

Вот только никак не могу привыкнуть к внезапным «рекламным паузам» в самом интересном месте «фильма». Надеюсь, что в будущем вы раскрутитесь настолько, что нужда в них отпадёт.

Ваша рассылка на Subscribe (группа «Создать свой сайт») одна из лучших. Даже если поубивать там всех спамров и лохотронщиков 🙂

Удачи и интересных статей.

Константин

Добрый день. Дмитрий, а для чего вы всегда делаете внутритекстовые ссылки на другие страницы блога? Это как-то повышает вес страницы для поисковиков?

Anton

график пи**ит — за переспам сайт просядет 100%.

Дмитрий

Александр: да нет, ISTIO говорит об общем количестве слов в тексте:

Текстовая поисковая оптимизация сайта

Лилия

Эта статья все еще актуальна? По последним данным, поисковики больше не обращают внимания на количество ключевиков. Перетошнило, видимо.

Кашлакова Марина

Добрый вечер!

Оптимизировала 3 статьи как научил гость из студии. Всё человеческое — никаких переспамов. Синонимы, семантика, морфология!

Итог: после апа все статьи упали по позициям!

Хорошие советы!

Роман

Стараюсь оставлять как можно меньше ключевиков в статьях, но вот посмотрел одну из статей, которая держится очень давно на 1-2 месте в топе. Она очень густо забита ключевиком. Может, яндекс перестал вообще обращать внимание на переспам?

Подписаться не комментируя