Блог / SEO

Кластеризация семантического ядра: виды, методы и инструменты

Автор: Мария Саловарова 25.03.2019

Кластеризация запросов

Краткое содержание статьи:

Для успешного SEO-продвижения сайта важно учитывать большое количество разных параметров. Сегодня мы затронем тему, связанную с поисковыми запросами, а именно их кластеризацию. После подбора запросов, особенно если их несколько тысяч, можно потеряться в этом бесконечном списке ключевых фраз. На помощь приходит кластеризация. Без правильного подхода к данной теме есть риск потратить время впустую и не добиться результата. Так что же это такое и в чем заключается суть?

1. Что такое кластеризация?

Кластеризация запросов – это группировка сочетающихся ключевых фраз в кластеры (группы), которые будут соответствовать определенным страницам сайта, где их продвижение будет наиболее эффективным. Для этого мы собираем фразы, разделяем их на кластеры и принимаем решение, какой странице тот или иной кластер запросов подходит. При составлении кластеров важно учитывать, что одному кластеру должна соответствовать только одна страница сайта, а в самом кластере должны быть только правильно подобранные фразы.

1.1. Почему нужна кластеризация?

Простой пример: у вас есть какое-то количество запросов, например:

  • игровой стол start line
  • игровые столы
  • настольный теннис
  • настольный теннис старт лайн
  • старт лайн теннис
  • стол старт лайн
  • теннисный стол
  • теннисный стол start line

Вам необходимо понять, нужно ли продвигать все эти фразы на одну и ту же страницу, или на разные.

Попробуем порассуждать логически, без использования сервисов и программ. Итак, когда человек ищет «игровые столы», он не всегда ищет теннисный стол и не всегда марку Start Line. Возможно, он хочет увидеть варианты, которые ему предлагают магазины, их ассортимент, цены, т.е. он хочет оценить посадочную страницу, удовлетворяющую его потребность в многообразии игровых столов, среди которых он сможет выбрать себе подходящий.

А теперь рассмотрим фразы «игровой стол start line», «стол старт лайн». Здесь уже задана конкретная марка, но все еще не определен вид игрового стола. Мы можем догадываться, что пользователь знаком с фирмой Start Line, считает ее надежной, и поэтому ищет любой игровой стол именно этого бренда. Эти фразы образовывают кластер.

Давайте обратим внимание на ключевые фразы, выделенные оранжевым. В них указан вид игрового стола и марка, которая необходима пользователю. Получается, что это еще один кластер.

Рассмотрим последние две фразы – «настольный теннис» и «теннисный стол». Логически, мы понимаем, что это один и тот же вид спортивного оборудования, поэтому создаем еще один кластер. Итого у нас получилось 4 группы фраз:

игровые столы игровой стол start line настольный теннис старт лайн настольный теннис
стол старт лайн старт лайн теннис теннисный стол
теннисный стол start line

Таких групп в рамках семантического ядра может быть большое количество, с любым числом запросов на один кластер. Для достижения наилучшего результата нужно искать максимально большое количество запросов.

А что если наши выводы неверны, и мы образовали какие-то кластеры неверно? Давайте посмотрим ТОП-10 Яндекса с помощью сервиса arsenkin.ru по данным фразам:

ключевые фразы

Теперь мы видим, что у всех ключевиков с брендом Start Line в большей или меньшей степени есть пересечения. Почему так? Например, разберем «игровой стол start line», «стол старт лайн». Оказывается, у конкурентов данные фразы продвигаются на страницы с теннисными столами данной марки, а у Start Line других видов игровых столов просто не бывает.

Более того, ключевые слова «настольный теннис» и «теннисный стол» вообще не имеют никаких пересечений. Если посмотреть ссылки по «настольный теннис», то мы увидим федерации настольного тенниса, ассоциации, порталы, но никак не интернет-магазины – как в случае с фразой «теннисный стол».

Именно во избежание таких ошибок применяется кластеризация и её последующий анализ. Как это происходит расскажем дальше.

2. Кластеризация: виды и методы

Кластеризация запросов

В кластеризации важны три параметра. Первый – это насколько масштабно проанализирован кластер, т.е. содержит ли он все возможные фразы. Второй – отражают ли они одну и ту же потребность пользователя. Третий – их совместимость в кластере между собой. При этом фразы могут быть кластеризованы тремя видами:

  1. Кластеризация по топ-10 – самый распространённый вид, основанный на результатах поисковой выдачи. Краткий алгоритм работы: для каждой ключевой фразы собирается определённое количество адресов из топ-10. Далее фразы сравниваются между собой на совпадения общих адресов. Ключевики, у которых есть общий набор адресов, объединяются в кластер.
  2. Кластеризация по словоформе – похожие слова с одними и теми же корнями определяются в одну группу. Минусом является то, что данный вид кластеризации не учитывает смысл фразы при распределении их на группы, т.е. есть шанс, что «купить доску пола» и «как сделать полку из доски пола» окажутся в одной группе.
  3. Кластеризация вопрос/не вопрос – редко используемый вид, основан на том, является ли фраза вопросом или нет. Подходит для сервисов или разделов с вопросами и ответами.

2.1. Кластеризация по топ-10

Самый распространенный вид – распределение по топ-10. Процесс работы при работе с инструментами происходит следующим образом: задается минимальный порог или уровень количества совпадений URL-адресов в результатах поиска. Изменить его можно в настройках используемого вами инструмента для кластеризации. Этот порог влияет на количество кластеров и ключевиков в них. Если он более высокий – то будет больше кластеров с меньшим количеством фраз. Если использовать уровень кластеризации 1 или 2, тогда кластеры будут иметь большое количество ключевых фраз. Рекомендуем опираться на результаты экспериментов Алексея Чекушина, где минимальный рабочий порог для hard кластеризации – три URL, для soft – четыре URL, либо смотреть рекомендации самого инструмента, который вы используете.

Существует несколько методов кластеризации:

  • Soft (мягкая) – самый частотный запрос сравнивается с последующими по количеству общих URL в ТОП-10. Если количество общих URL превышает или равно заданному порогу, то запрос будет добавлен в кластер. В результате все ключевые слова в кластере будут связаны с главной частотной фразой, но они не обязательно будут связаны друг с другом (т.е. не обязательно, что в результатах поисковой выдачи по ним будут совпадающие URL-адреса).

    Применяется для интернет-магазинов с простой структурой или для сайтов информационной тематики. Особенность данного способа – данных больше, но они менее точны, т.е. встречаются ошибки в распределении совместного продвижения запросов на странице.

  • Moderate или Middle (умеренная) – считается компромиссом между Soft и Hard. Берется один самый частотный запрос, а все остальные сравниваются с ним по количеству общих URL-ов (как soft и hard). В то же время инструмент сравнивает все ключевые слова друг с другом. Если количество общих URL превышает или равно заданному порогу, то запрос добавляют в группу. По итогу в кластере все запросы будут попарно связаны друг с другом, но в разных парах URL могут отличаться.

  • Hard (жесткая) – самый частотный запрос сравнивается с последующими по количеству общих URL в топ-10 (как soft), дополнительно сравниваются все запросы между собой и все URL в полученных парах. Если количество общих URL превышает или равно заданному порогу, то запрос будет добавлен в кластер. Ключевые слова в кластере связаны друг с другом, URL в совпадающих словах обязательно одинаковые.

    Метод применим в конкурентных тематиках, в сложных коммерческих услугах – например займы, страхование и т. д. – в данном случае из-за большого количества синонимов и большого количества самих запросов по той или иной теме. Этот метод кластеризации предоставляет меньше данных, но они более точны.

  Soft Moderate Hard
самый частотный запрос сравнивается с последующими по количеству общих URL в ТОП-10 Да Да Да
ключевые слова в кластере связаны с главной частотной фразой Да Да Да
ключевые слова в кластере связаны друг с другом Необязательно Да, но URL могут быть разными Да

Есть и другие виды кластеризации:

  • Ручная группировка. Подходит только для небольших интернет-магазинов с маленьким семантическим ядром. Но даже при небольшом семантическом ядре есть большая вероятность ошибиться в распределении запросов. Как показывает практика, неопытные специалисты в ручном режиме могут достигать лишь 20% точности. Поэтому рекомендуем анализировать выдачу поисковых систем по результатам созданных кластеров.
  • Кластеризация по интенту, предложенная Сергеем Кокшаровым, где собирают фокус-группу (потенциальных клиентов), формируют список ключевых слов, далее они случайным образом распределяются по её участникам, задается правильный вопрос и люди сами раскидывают слова по посадочным страницам. Данный вид кластеризации – самый трудоемкий и дорогой.

3. Инструменты

3.1. Онлайн-сервисы автоматической группировки

Rush Analytics – платный онлайн-сервис, дающий при регистрации 200 лимитов. Лимиты в 999 штук стоят 999 руб./мес., есть и другие тарифы. Есть кластеризация по Wordstat, где требуется только список запросов и их частотность; по маркерным запросам – подходит, если вам известны запросы, которые отвечают конкретным страницам вашего сайта; и третий вид – Wordstat + Ручные маркеры.

Just-Magic – платный онлайн-сервис, где выгодно покупать подписки (от 1000 руб/мес.), а не просто использовать стандартный тарифный план. При регистрации дается 100 лимитов. Позволяет сгруппировать ключевые слова на основании топов Яндекса или Google. Метод кластеризации – hard. Soft реализована в другом инструменте «Маркеры-онлайн».

Топвизор – платный онлайн-сервис. Можно просто пополнять баланс, а можно подписаться на тарифный план и получать скидку, к примеру тариф S со скидкой 10% – стоимость 999 руб/мес. Работает по трем видам: Soft, Moderate и Hard с порогом пересечения от 1 до 9. Фразы группируются на основе выдачи Яндекс и Google.

Megaindex – платный онлайн-сервис, дающий бесплатно 1000 запросов. Чтобы была доступна кластеризация для 5000 фраз, нужно заплатить 1490 руб/мес, если нужно больше – цена увеличивается. Есть возможность выбора совпадений URL от 3 до 10. Есть функционал для расширения запросов на основе анализа конкурентов из ТОП-10.

Semparser – платный онлайн-сервис. Бесплатно можно проверить 50 запросов. Чем больше вы покупаете их количество, тем меньше платите за 1 запрос: при покупке до 500 запросов – 0,60 руб. за единицу, а при покупке от 50 000 запросов – 0,18 руб. Группировка происходит по Яндексу и Google по заданному вами региону. Степень группировки от 0 до 10.

Serpstat – платный онлайн-сервис. Приобретая тариф Plan B за 69,00 $/мес. у вас будет возможность отправить на группировку 4000 фраз. Дает возможность выбрать поисковую систему и регион. Есть три типа связи между ключевиками: Weak, Medium и Strong и два типа кластеризации: Soft и Hard.

S:toolz – платный онлайн-сервис. Цена за обработку одного запроса 0,1 руб. При регистрации дается бесплатно обработать 500 запросов. Задается город и адрес вашего сайта. Уровень кластеризации от 2 до 10. Сам сервис группировку слов не отображает, ее можно только скачать в файле XLS.

SE Ranking – платный онлайн-сервис. Для работы над кластеризацией в бесплатном trial-аккаунте необходимо пополнять баланс – за каждую фразу 0,2 руб. Можно приобрести тариф от 1500 руб, где вам будет предоставлена скидка. Задается поисковая система и регион. Уровень от 1 до 9. Методы Soft и Hard.

Coolakov – условно бесплатный сервис, позволяющий распределять 1000 запросов единоразово. Объем от 1000 до 100 000 запросов стоит 0,2 руб/запрос. Порог кластеризации можно выбрать от 1 до 10.


Для многих платных сервисов вы можете найти промокоды, благодаря которым увеличиваются лимиты.

3.2. Онлайн-сервисы ручной кластеризации

KeyAssistant – бесплатный онлайн-сервис для ручной загрузки и распределения фраз, в том числе нескольких тысяч. Можно опираться на подсказки по группам ключевиков от сервиса (они подсвечиваются). Для удбства есть быстрые клавиши. Итог можно скачать в формате CSV.

Kg.ppc.panel – бесплатный онлайн-сервис для ручной кластеризации. Позволяет загрузить фразы, отфильтровать минус-слова и сгруппировать в группы. Иногда сервис ломается и не дает выгрузить проделанную работу.

Помимо представленных сервисов для ручной группировки ключевиков вы можете использовать Microsoft Excel, LibreOffice, OpenOffice и Документы Google.

3.3. Программы для автоматической кластеризации

KeyAssort – платная программа с демо-версией (из которой нельзя выгрузить результат). Стоимость программы – 1900 руб. Работает на Windows XP, Vista, 7, 8, 10. Есть Яндекс и Google, а также выбор региона. Помимо перечисленного можно настроить: миграцию запросов, расширение семантики, параметры, которые не надо учитывать и пр.

Mindserp – платная программа за 3000 рублей. Есть возможность запросить демо-доступ на 2 дня. В настройках можно выбрать регион, поисковую систему и пр. Уровень кластеризации можно задать вручную. Также вы можете настраивать: кол-во повторов, маску поиска Google и прочие параметры.

Majento Кластеризатор – бесплатная программа, копия онлайн-сервиса от Majento с дополнительными функциями. Данные собираются из Яндекса с использованием лимитов Яндекс.XML. Есть указание региона. Методы Soft и Hard, можно указать порог от 1 до 10. Доступна функция ручной группировки фраз для внесения изменений в полученную кластеризацию. Результаты экспортируются в CSV.

3.4. Что лучше?

А теперь самое интересное: специалист в области SEO и кластеризации А. Ожгибесов провел исследование качества сервисов по поисковой выдаче и пришел к следующим результатам (чем выше оценка, тем лучше кластеризатор и его метод):

Кластеризатор Оценка Продолжение таблицы
Rush Soft - 3 281 Mindserp Hard - 4 151
Топвизор Soft - 3 269 KeyAssort Hard - 6 145
KeyAssort Soft - 3 265 Rush Soft - 5 144
KeyAssort Hard - 3 264 Mindserp Soft - 6 142
KeyAssort Soft - 4 262 Rush Hard - 5 138
Rush Hard - 3 250 Just-Magic Hard - 5 130
KeyAssort Soft - 5 249 Топвизор Soft - 6 126
Just-Magic Hard - 3 246 Топвизор Hard - 5 125
Mindserp Soft - 3 244 KeyAssort Hard - 7 118
Топвизор Soft - 4 236 Megaindex Hard - 4 118
Топвизор Hard - 3 229 Semparser - 5 105
KeyAssort Soft - 6 225 Mindserp Hard - 5 104
KeyAssort Hard - 4 223 Rush Soft - 6 92
Mindserp Soft - 4 220 Megaindex Hard - 5 88
Rush Soft - 4 220 Mindserp Soft - 7 88
Semparser - 3 216 Just-Magic Hard - 6 86
Mindserp Hard - 3 202 Топвизор Hard - 6 83
Rush Hard - 4 199 Топвизор Soft - 7 81
KeyAssort Hard - 5 198 Mindserp Hard - 6 74
Just-Magic Hard - 4 194 Rush Soft - 7 66
Megaindex Hard - 3 187 Semparser - 6 62
Mindserp Soft - 5 187 Megaindex Hard - 6 61
Топвизор Soft - 5 178 Топвизор Hard - 7 58
KeyAssort Soft - 7 177 Mindserp Hard - 7 52
Топвизор Hard - 4 175 Megaindex Hard - 7 46
Semparser - 4 154 Semparser - 7 35

Лучшим оказался сервис Rush Analytics с использованием метода Soft с порогом 3:

Сервисы кластеризации

4. Процесс кластеризации семантического ядра

На основе всего вышеизложенного подведем итоги, как происходит данный процесс:

  • Собираете максимально большое количество ключевых фраз с их частотностью с помощью различных источников.
  • Фильтруете фразы, т.е. удаляете все минус-слова.
  • Кластеризуете с помощью программ (устанавливаете регион, поисковую систему и порог) или вручную.
  • Вручную проверяете каждую группу на логику наличия ключевых слов в кластере, если возникают сомнения, то проверяете выдачу поисковой системы.
  • Определяете страницу для SEO-продвижения. Некоторые программы при кластеризации указывают подходящую страницу.

4.1. Плюсы и минусы

Какие достоинства несет в себе кластеризация?

  • При использовании инструментов значительно сокращается время работы на группировку запросов по группам.
  • Еще на этапе разработки можно заранее продумать, как организовать структуру сайта, определить какие страницы потребуются в будущем и начать планировать контент.
  • С использованием инструментов уменьшается количество ошибок в сравнении с ручной кластеризацией.
  • С помощью правильно проведенной кластеризации посетитель будет находить именно ту продукцию или услуги, которые он искал.

Какие недостатки?

  • Готовая кластеризация, сделанная по топу, может отличаться спустя время из-за смены сайтов в поисковой выдаче.
  • При большом количестве семантики процесс кластеризации происходит долго и требует дополнительной проверки.
  • При использовании автоматических инструментов образуется список запросов, которые не кластеризованы, т.е. они не отнесены ни к какой-либо группе. И в данном случае требуется их ручная проработка.
  • Зачастую в кластеры попадают фразы, которые хоть и близки по тематике, но на деле означают разные предметы, например, «горшок для цветов», «кашпо для цветов».
Автор: Мария Саловарова