Поисковая оптимизация текстов на сайте (SEO), улучшение ранжирования документов, оптимальная частота употребления ключевых слов и оптимальная длина текста для попадания в топ поисковой выдачи
Здравствуйте уважаемые читатели блога KtoNaNovenkogo.ru. Сегодняшняя статья опять будет посвящена такой теме, как поисковая оптимизация сайтов (SEO). Ранее мы уже затронули много вопросов, связанных с таким понятием как внутренняя поисковая оптимизация сайта, которая заключается в оптимизации текста статей под нужные поисковые запросы и организации грамотной внутренней перелинковки страниц вашего веб-проекта.

Сегодня я хочу продолжить разговор о внутренней поисковой оптимизации сайтов (SEO), уточнив при этом некоторые моменты затронутые ранее, а так же поговорить о том, что мы еще не обсуждали. Вообще, поисковая оптимизация сайта (SEO) является одним из важнейших аспектов, который может позволить вашему сайту добиться успеха и высокой посещаемости. Если вы способны писать хорошие уникальные тексты, но при этом не уделяете должного внимания внутренней поисковой оптимизации этих текстов, то они не смогут пробить себе дорогу в топ 10 поисковой выдачи по запросам, связанным с тематикой ваших замечательных статей. А следовательно эти замечательные тексты не смогут привлечь сколько нибудь значимое количество поискового трафика.
Что влияет на релевантность (соответствие) текста статьи поисковому запросу, как попасть в топ выдачи поисковой системы
И это очень печально, ибо вы, игнорируя простейшие правила оптимизации под поисковые системы, не реализуете весь потенциал вашего проекта, который может оказаться очень внушительным. Надо понимать, что поисковые системы по большей части — это тупые и прямолинейные программы, которые не способны выйти за рамки своих возможностей и взглянуть на ваш проект человеческими глазами. Поисковики не увидят многого из всего того, что есть хорошего и нужного на вашем проекте (что вы приготовили для посетители вашего сайта). Поисковые системы умеют только анализировать текст (в аспекте внутренней поисковой оптимизации), учитывая при этом очень много составляющих, но они по прежнему очень далеки от человеческого восприятия.
Следовательно, нам нужно будет хотя бы на время залезть в шкуру поисковых систем и понять на чем они концентрируют свое внимание при ранжировании различных текстов по различным поисковым запросам (текстовое ранжирование). А для этого нужно иметь представление про алгоритмы работы поисковых систем, нужно понимать каким образом поисковые системы производят индексацию документов, в каком виде хранится коллекция поисковых систем и многие другие нюансы работы поисковиков. Базовые понятия были рассмотрены нами в статье о том, как работают поисковые системы, поэтому сейчас мы, уже опираясь на полученные знания, сможем делать выводы о перспективности тех или иных способов внутренней поисковой оптимизации сайтов.
Итак, давайте сначала вернем к материалу предыдущей статьи про внутреннюю поисковую оптимизацию сайтов и вспомним, какие аспекты внутренней поисковой оптимизации мы посчитали наиболее важными при оптимизации текстов наших статей. Дело в том, что тут есть один нюанс, который мне не удалось отразить в том материале.
Я говорил ранее, что очень важно заключать ключевые слова, по которым мы хотим продвинуть в поисковых системах данную статью, в теги акцентирования (STRONG, EM и заголовки H1-H6), а так же использовать эти ключевые слова в теге TITLE, который еще называют заголовком страницы. Да, безусловно, выделение ключевых слов в тексте очень важно и его нужно делать, но при этом не стоит забывать, что самым важным для поисковых систем фактором, который напрямую будет влиять на положение вашего сайта в поисковой выдаче по тому или иному поисковому запросу (по другому это называется текстовое ранжирование), является плотность вхождения ключевого слова в документ.
Определяется величина плотности вхождения ключевика в документ довольно просто. Фактически это частота использования ключевого слова в тексте, которая определяется делением количества употреблений данного ключевика в документе (тексте) на длину документа в словах. Чем чаще вы используете данное ключевое слово в тексте, тем больше этот текст будет соответствовать поисковому запросу, включающему это ключевое слово (текст будет более релевантен поисковому запросу). И тем выше ваш сайт сможет подняться в поисковой выдаче по поисковому запросу, включающему данное ключевое слово.
Но вам, наверное, понятно, что составить весь текст только из ключевых слов будет не возможно, ибо он будет не читаемым, да слава богу, этого и не нужно делать. Почему, спросите вы? Да потому, что есть предел частоты использования ключевого слова в тексте, после которого релевантность документа по поисковому запросу, содержащему этот ключевик, уже не будет повышаться. Т.е. нам достаточно будет добиться определенной частоты употребления ключевых слов в документе и мы, таким образом, максимально оптимизируем его под поисковые запросы с этими ключевыми словами.
Остается решить два вопроса (а может быть и три): какова же эта самая максимальная плотность вхождения ключевика в документ (частота употребления ключевика в тексте), после которой уже нет смысла ее увеличивать, а так же выяснить, а зачем же тогда выделять ключевые слова тегами акцентирования и включать их в тег TITLE. Давайте начнем со второго вопроса, ибо ответить на него получится быстрее. Дело в том, что ключевые слова, выделенные в тексте тегами акцентирования и особенно ключевые слова, заключенные в тег TITLE ,имеют больший вес для поисковых систем, чем аналогичные ключевые слова просто встречающиеся в тексте.
Грубо говоря, можно представить, что ключевик заключенный в TITLE равноценен для поисковой системы двум аналогичным ключевикам просто стоящим в тексте, а пара ключевиков заключенных в теги акцентирования равноценна для поисковиков трем аналогичным ключам просто стоящим в тексте. Таким образом, заключая достаточное количество ключевых слов в теги акцентирования и используя их в теге TITLE, мы можем существенно уменьшить количество ключевиков в тексте (а значит сделать его легко читаемым и более приспособленным для людей, а не для поисковых систем), добившись той же самой релевантности (соответствия) поисковому запросу, что и при большей частоте употребления ключевых слов, но без их выделения соответствующими тегами акцентирования и TITLE.
Думаю, что с этим вопросом все понятно — чем больше ключевиков будет заключено в теги акцентирования и TITLE, тем меньше их понадобится употребить в тексте для достижения оптимальной частоты употребления данного ключевика (плотности вхождения ключевика в документ). Теперь осталось разобраться с тем, а какая же частота употребления ключевого слова в документе является оптимальной, которая позволяет сделать текст максимально релевантным поисковому запросу, включающему данное ключевое слово. Давайте сначала вспомним формулу, которую используют большинство (наверное даже все) поисковых систем для ранжирования документов в поисковой выдаче по какому либо запросу.
Как определить оптимальную частоту употребления ключевого слова (из поискового запроса, по которому продвигается статья)
Мы уже говорили ранее про математическую модель, которую используют поисковые системы для ранжирования документов в поисковой выдаче. Суть этой модели для данного конкретного поискового запроса выражается одной упрощенной формулой: TF*IDF. Где TF — это прямая частота вхождения данного поискового запроса в текст документа (частота, с которой слова из этого поискового запроса встречаются в документе). IDF — обратная частота встречаемости (другими словами, редкость встречаемости) данного поискового запроса во всех остальных документах интернета, проиндексированных данной поисковой системой (в коллекции поисковой системы).
Эта формула позволяет поисковым системам определить соответствие (релевантность) документа поисковому запросу. Чем выше значение произведения TF*IDF, тем более релевантным поисковому запросу будет данный документ и тем выше он будет в поисковой выдаче по данном запросу.
Т.е. получается, что вес документа для данного поискового запроса (его релевантность или же по другому соответствие) будет тем больше, чем чаще употребляются ключевые слова из этого поискового запроса в тексте документа, и чем реже эти ключевые слова встречаются в других документах интернета, проиндексированных данной поисковой системой (в коллекции поисковой системы).
Понятно, что на IDF мы влиять не можем, разве что только, выбрав другой поисковый запрос, под который будем оптимизировать текст. А вот на TF мы влиять можем и будем влиять, ибо хотим отхватить свою долю (и не малую) поискового трафика с поисковых выдач по нужным нам запросам (в которых будут ключевые слова под которые мы оптимизировали свои статьи).
Но дело в том, что поисковые системы (во всяком случае Яндекс) высчитывают значение TF по довольно хитрой формуле, которая учитывает рост частоты употребления ключевого слова в тексте только до определенного предела, после которого рост значения TF практически прекращается, несмотря на то, что вы будете увеличивать частоту употребления ключевого слова в тексте.
Относительно давно (примерно до 2005 года) значение TF высчитывалось по довольно простой формуле и фактически было равно плотности вхождения ключевого слова в документ. Результаты расчета релевантности документов по этой формуле не совсем нравились поисковым системам, ибо, грубо говоря, задав одно ключевое слово на странице и заключив его в TITLE, можно было бы попасть в топ поисковой выдачи.
Потом формула расчета TF усложнилась, появилось такое понятие как тошнота страницы и значение TF стало зависеть не только от частоты употребления ключевого слова в тексте, но так же и от частоты употребления других слов в тексте. И оптимального значения TF можно было бы достигнуть, если ключевое слово оказывалось самым часто употребляемым словом в тексте. Так же можно было увеличивать значение TF за счет увеличения размера текста с сохранение процента употребления в нем ключевого слова. Чем больше будет полотенце с текстом при том же проценте употребления в нем ключевых слов, тем выше в поисковой выдаче будет стоять данный документ.
Сейчас формула расчета значения TF еще более усложнилась, но в тоже время, сейчас у нас нет необходимости доводить плотность употребления ключевых слов до того значения, когда текст станет не читаем и поисковые системы наложат бан на наш проект за спам. Да и писать несоразмерно длинные тексты сейчас тоже нет необходимости.
При сохранении той же самой идеальной плотности ключевых слов в тексте (мы ее определим чуть ниже по тексту из соответствующего графика), увеличение размера текста в словах будет улучшать положение вашей статьи в поисковой выдаче только до достижения определенной длины текста. После того, как у вас получилась идеальная длина текста в словах, дальнейшее увеличение количество слов в тексте не будет влиять на релевантность этого текста поисковому запросу (точнее говоря, будет влиять, но очень и очень мало).
Все это можно будет увидеть наглядно, если построить график на основе этой хитрой формулы расчета TF (прямой частоты вхождения поискового запроса в текст документа). Если на одной шкале этого графика будет значение TF, а на другой шкале — процентное соотношение частоты встречаемости ключевого слова в тексте, то мы получим в результате так называемую гиперболу:

График, конечно же, приблизительный, ибо реальную формулу расчета TF, которую используют поисковые системы, мало кто знает. Но качественно из этого графика можно определить оптимальный диапазон, в котором должна находиться частота употребления ключевых слов в тексте. Это, примерно, 5-8 процентов ключевых слов от общего числа слов в продвигаемом тексте. Если учесть, что вы еще будет заключать часть из этих ключевых слов в теги акцентирования и заголовок TITLE, то это и будет тот предел, после которого дальнейшее увеличение плотности ключей в тексте становится бессмысленным. Насыщать и уродовать текст большим количеством ключевых слов уже не рентабельно, ибо минусов здесь будет больше, чем плюсов.
Какая длина текста будет достаточной для достижения максимальной релевантности (соответствия) поисковому запросу
Основываясь на той же самой, предполагаемой формуле расчета TF, можно построить график зависимости значения TF от длины продвигаемого текста в словах. При этом можно взять частоту употребления ключевых слов в этом тексте постоянной для любой длины текста и равной, например, какому-либо значению из оптимального диапазона частоты употребления ключевых слов (от 5 до 8 процентов от общего числа слов в тексте).
Что примечательно, мы получим график точно такой же формы, как и рассмотренный выше, только по оси абсцисс будет отложена длина текста в тысячах слов. И из этого графика можно будет сделать вывод об оптимальном диапазоне длины текста в словах, при котором уже достигается практически максимальное значение TF. В результате получается, что оптимальная длина текста будет лежать в диапазоне от 1000 до 2000 слов. При дальнейшем увеличении длины текста, его релевантность поисковому запросу практически не будет расти. При меньшей длине текста его релевантность будет довольно резко падать с уменьшение количества слов в тексте.
Т.о. можно сделать вывод, что для того, чтобы ваши статьи могли занимать высокие места в поисковой выдаче, вам нужно употреблять в тексте ключевые слова с частотой не ниже 5 -8 % от общего числа слов в документе. Это первый и основной вывод, который мы сделали. Ну, и второй вывод, это то, что сейчас вовсе не обязательно писать очень объемные тексты для того, чтобы подняться в поисковой выдаче по тому или иному запросу.
Достаточно будет написать текст не менее чем в 1000 — 2000 слов и включить в него 5 -8 % ключевых слов. Вот и все — это и есть рецепт идеального текста, который будет способен конкурировать за место в топе поисковой выдачи по низкочастотному запросу, даже без использования внешней поисковой оптимизации (покупки ссылок на эту статью с анкорами, включающими ключевые слова).
Еще раз вам напомню, что длину написанного вами текста, а так же частоту употребления в нем тех или иных ключевых слов вы можете узнать с помощью специализированных программ или же с помощью онлайн сервисов, специализирующихся на анализе текстов. Одним из таких сервисов является сервисе ISTIO, о работе с которым я рассказывал здесь — Онлайн сервис для анализа текстов.
Все о чем я говорил выше не достоверно на сто процентов, но очень похоже на правду. Во всяком случае, мой личный опыт подтверждает эту теорию. Но алгоритмы работы поисковых систем постоянно претерпевают изменения и как оно будет завтра мало кто знает, кроме тех, кто близок к разработке или разработчикам алгоритмов поисковых систем.
Можете также посмотреть видео «Какие тексты нравятся поисковой системе»:
У Евгения Попова вышел новый видекурс Все Технические Моменты Онлайн Бизнеса в Видеоформате, который стоит того, чтобы с ним ознакомиться.
Вы так же можете ознакомиться с другими статьями на тему продвижения сайта:
- Продвижение сайтов SEO
- Что такое SEO (сео) продвижение и оптимизация сайта
- База трастовых сайтов (бесплатно - за одну обратную ссылку)
- Яндекс Директ - альтернатива поисковому продвижению (SEO)
- Как добавить сайт в поиск Яндекса, Гугла, и др.
- Как добавить сайт в каталоги Яндекс, DMOZ и др.
- ТИЦ сайта, Виц и ПР - в чем отличие и где проверить
- GoGetLinks (гогетлинкс) - покупка ссылок "навсегда"
- Miralinks (миралинкс) - размещение статей "навсегда"
- RotaPost (ротапост) - покупка ссылок с разных типов ресурсов
- Сниппет или как работают поисковые системы
- Поисковик Google.ru - отличия от Google.com и Яндекса
- Яндекс (Yandex.ru) - особенности продвижения
- Гугл (Google) - отличительные особенности продвижения и оптимизации
- Продвижение сайта самостоятельно
- Как раскрутить сайт самому
- Семантическое ядро и подбор ключевых слов в wordstat.yandex.ru
- Ключевые слова в тексте и заголовках
- Как использовать статистику поисковых запросов Яндекса и Google
- Site-Auditor (сайт-аудитор) — определение позиций сайта в поисковых системах
- Релевантность и ранжирование - как не попасть в опалу к Яндексу и Гуглу
- Онлайн анализ сайта
- Копирайтер и SEO копирайтинг для своего сайта
- Анкоры ссылок - что это такое и какими они должны быть
- Копипаст (copypast) и как от него защититься
- Какие поведенческие факторы имеет ваш сайт
- Уникальный контент для сайта - главное условие успешного продвижения
- Технические аспекты продвижения сайтов
- Продвижение в социальных медиа (SMO)
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
-
- Внутренняя поисковая оптимизация сайта (SEO): подбор и выделение ключевых слов, проверка тошноты страницы, оптимальный Title, дублирование контента, перелинковка
- Онлайн сервисы — подбор ключевых слов, анализ текста и орфографии, ускорение и проверка индексации, анализ и методы поискового продвижения сайта
- Семантическое ядро, подбор ключевых слов в запросах статистики Яндекс Вордстат (Wordstat.Yandex.ru)
- Как писать статьи в WordPress, поисковая оптимизация Вордпресс (заголовки страниц TITLE, выделение ключевых слов тегами STRONG, EM и заголовками уровня H1-H6) — Часть 1
- Посещаемость сайта, как увеличить поисковый трафик, анализ плотности ключевых слов в статьях
- Значение контента и его оптимизация под поисковые системы, тематика сайта, что дают тематические ссылки, внутренние факторы продвижения сайта
- Поисковое продвижение сайта в Google.com — Определение региона для сайта (Google.ru, Google.ua), работа поисковой системы, основной и дополнительный индексы поисковика Google


Спасибо, статья как раз в тему. А можно ли переборщить с тошнотой текста?
Думаю предложение «Дело в том, что ключевые слова, выделенные в тексте тегами акцентирования и особенно ключевые слова, заключенные в тег TITLE ,имеют больший вес для поисковых систем, чем аналогичные ключевые слова просто встречающиеся в тексте» побило рекорд статьи по «ключевым словам»
Сергей: наверное можно.
Overmort: специально не старался так часто ключевые слова использовать, как то самом собой получается. Когда провел анализ текста, вроде бы все нормально в процентном соотношении получилось, однако в одном предложении столько ключей будет лишним, конечно же.
Статья Полезная, правда только для Новичков.
Не так давно проводился эксперемент манипуляций с абстрактными ключевиками, кажется Сосновским. Правда, целью эксперемента было выявление попадания в ТОП текстов с ключевиками входящими в разных вариациях в keywords, description и в сам контент.
Но я копнул глубже. И вот тут и есть настоящие загадки и поле деятельности для исследований Настоящих Профи.
Что интересно. При одинаковой Тошноте и Релевантности, — Яшка и Google совершенно разными алгоритмами выводили в ТОП.
Если сразу после эксперемента Яшка ставит в ТОП 1
с тенденцией по ключевикам с Минимальной Водностью (правда Водность везде зашкаливает)и Максимальной Частотностью в Тексте и Ядре (что вполне логично и прогнозируемо). То после последнего Апа, — кардинально все меняет. А прогнозировать логику Googla, — вообще трудно. Выводит в ТОП 1 усредненные величины.
Дмитрий, было бы здорово, если бы Вы написали Цикл Статей по подобой тематике, с присущими Вам углубленными изысканиями. Думаю, Аплодисменты аудитории были бы Гарантированы!
Меня тоже интересует тема внутренней оптимизации сайта и методиках продвижения по НЧ.
Буду следить по RSS за циклом статей. Надеюсь эти статьи все же будут написаны. Неплохо было бы подкрепить все это экспериментами.
Спасибо за инфо. Читаю с интересом.
Вот только никак не могу привыкнуть к внезапным «рекламным паузам» в самом интересном месте «фильма». Надеюсь, что в будущем вы раскрутитесь настолько, что нужда в них отпадёт.
Ваша рассылка на Subscribe (группа «Создать свой сайт») одна из лучших. Даже если поубивать там всех спамров и лохотронщиков
Удачи и интересных статей.
Добрый день. Дмитрий, а для чего вы всегда делаете внутритекстовые ссылки на другие страницы блога? Это как-то повышает вес страницы для поисковиков?
написать текст не менее чем в 1000 — 2000 слов и включить в него 5 -8 % ключевых слов
Именно слов, а не знаков>?
Ольга: пожалуйста, за рекламу, прошения просим — она хлеб и хороший стимул к развитию проекта.
Константин: в первую очередь на другие страницы блога ссылаюсь просто по теме статьи (для того, чтобы читатель мог, при желании, получить больше информации по данной тема), но так же я это делаю и для увеличения глубины просмотра блога посетителями. Этот показатель довольно важен как для меня, так, я думаю, и для поисковых систем. Ибо сайты, на которых слишком маленькая глубина просмотра могут определенным образом понижаться в глазах поисковиков. ИМХО.
Павел: именно слов, в символах это значительно большие цифры будут.
график пи**ит — за переспам сайт просядет 100%.
— написать текст не менее чем в 1000 – 2000 слов и включить в него 5 -8 % ключевых слов
Именно слов, а не знаков>?
= Павел: именно слов, в символах это значительно большие цифры будут.
ISTIO не сообщает, сколько всего слов. Как быть?
Александр: да нет, ISTIO говорит об общем количестве слов в тексте:
Дмитрий, а вот как быть, если страница — по сути прайс. Там, во-первых, не получится текст в 1000 символов, во-вторых вообще сложно получается с подбором кей-вордов. А можно ли, чтобы затошнить текст, но так, чтоб читателей не затошнило от него добавить кей-ворды шрифтом того же цвета, что и фон сайта?
Елена говорит, что:
Это называется клоакинг и за это очень жестоко наказывают.
Дмитрий, сервис проверки плотности ключевиков не учитывает кейворды которые появятся в html документе. Например совпадение ключевых слов с названием сайта, категорий, предыдущих записей, тегов и проче прочее. Отсюда вопрос, ПС системы учитывают все слова которые встречаются на странице или только слова из текста статьи?
Дмитрий:
Хорошая статья, Дмитрий. Но не ясно, какой параметр частоты ключевых слов в ISTIO надо учитывать — параметр «Доля в Ядре» (предпоследний столбец) или параметр «Доля в тексте»(последний столбец)?
Присоединяюсь к вопросу Vova. Что значит столбец «Доля в ядре» и «Доля в тексте»?
а текст ссылок с ключевыми словами считается? или мы ведем речь только про текст самой страницы, без ссылок, кнопок и прочего? и атрибуты альт тоже, кстати, их считать в эти 5-8 %?
Эта статья все еще актуальна? По последним данным, поисковики больше не обращают внимания на количество ключевиков. Перетошнило, видимо.
Приветствую.
А к примеру, мои страницы в основном содержат переписанные видеоинтервью в текст. Общая длина статей от 3000—6000символов, кличевых запросов обычно не больше 5, по некоторым онлайн сервисами по типу адвего.ру тошнота статей не привышает 5%, процент ключевых слов по тексту на каждое слово в основном 0.9-0.6.
Что вы скажите по этому поводу. Процент например 5 слов в плюсе 5-6% на статью с 5000 символами это нормально или очень плохо? Либо же можно разделить статью к примеру 5000/2=2500 символов и на каждую статью сделать по 2 ключевых запроса?