Кластеризация семантического ядра: виды, методы и инструменты
Краткое содержание статьи:
Для успешного SEO-продвижения сайта важно учитывать большое количество разных параметров. Сегодня мы затронем тему, связанную с поисковыми запросами, а именно их кластеризацию. После подбора запросов, особенно если их несколько тысяч, можно потеряться в этом бесконечном списке ключевых фраз. На помощь приходит кластеризация. Без правильного подхода к данной теме есть риск потратить время впустую и не добиться результата. Так что же это такое и в чем заключается суть?
1. Что такое кластеризация?
Кластеризация запросов – это группировка сочетающихся ключевых фраз в кластеры (группы), которые будут соответствовать определенным страницам сайта, где их продвижение будет наиболее эффективным. Для этого мы собираем фразы, разделяем их на кластеры и принимаем решение, какой странице тот или иной кластер запросов подходит. При составлении кластеров важно учитывать, что одному кластеру должна соответствовать только одна страница сайта, а в самом кластере должны быть только правильно подобранные фразы.
1.1. Почему нужна кластеризация?
Простой пример: у вас есть какое-то количество запросов, например:
- игровой стол start line
- игровые столы
- настольный теннис
- настольный теннис старт лайн
- старт лайн теннис
- стол старт лайн
- теннисный стол
- теннисный стол start line
Вам необходимо понять, нужно ли продвигать все эти фразы на одну и ту же страницу, или на разные.
Попробуем порассуждать логически, без использования сервисов и программ. Итак, когда человек ищет «игровые столы», он не всегда ищет теннисный стол и не всегда марку Start Line. Возможно, он хочет увидеть варианты, которые ему предлагают магазины, их ассортимент, цены, т.е. он хочет оценить посадочную страницу, удовлетворяющую его потребность в многообразии игровых столов, среди которых он сможет выбрать себе подходящий.
А теперь рассмотрим фразы «игровой стол start line», «стол старт лайн». Здесь уже задана конкретная марка, но все еще не определен вид игрового стола. Мы можем догадываться, что пользователь знаком с фирмой Start Line, считает ее надежной, и поэтому ищет любой игровой стол именно этого бренда. Эти фразы образовывают кластер.
Давайте обратим внимание на ключевые фразы, выделенные оранжевым. В них указан вид игрового стола и марка, которая необходима пользователю. Получается, что это еще один кластер.
Рассмотрим последние две фразы – «настольный теннис» и «теннисный стол». Логически, мы понимаем, что это один и тот же вид спортивного оборудования, поэтому создаем еще один кластер. Итого у нас получилось 4 группы фраз:
игровые столы | игровой стол start line | настольный теннис старт лайн | настольный теннис |
стол старт лайн | старт лайн теннис | теннисный стол | |
теннисный стол start line |
Таких групп в рамках семантического ядра может быть большое количество, с любым числом запросов на один кластер. Для достижения наилучшего результата нужно искать максимально большое количество запросов.
А что если наши выводы неверны, и мы образовали какие-то кластеры неверно? Давайте посмотрим ТОП-10 Яндекса с помощью сервиса arsenkin.ru по данным фразам:
Теперь мы видим, что у всех ключевиков с брендом Start Line в большей или меньшей степени есть пересечения. Почему так? Например, разберем «игровой стол start line», «стол старт лайн». Оказывается, у конкурентов данные фразы продвигаются на страницы с теннисными столами данной марки, а у Start Line других видов игровых столов просто не бывает.
Более того, ключевые слова «настольный теннис» и «теннисный стол» вообще не имеют никаких пересечений. Если посмотреть ссылки по «настольный теннис», то мы увидим федерации настольного тенниса, ассоциации, порталы, но никак не интернет-магазины – как в случае с фразой «теннисный стол».
Именно во избежание таких ошибок применяется кластеризация и её последующий анализ. Как это происходит расскажем дальше.
2. Кластеризация: виды и методы
В кластеризации важны три параметра. Первый – это насколько масштабно проанализирован кластер, т.е. содержит ли он все возможные фразы. Второй – отражают ли они одну и ту же потребность пользователя. Третий – их совместимость в кластере между собой. При этом фразы могут быть кластеризованы тремя видами:
- Кластеризация по топ-10 – самый распространённый вид, основанный на результатах поисковой выдачи. Краткий алгоритм работы: для каждой ключевой фразы собирается определённое количество адресов из топ-10. Далее фразы сравниваются между собой на совпадения общих адресов. Ключевики, у которых есть общий набор адресов, объединяются в кластер.
- Кластеризация по словоформе – похожие слова с одними и теми же корнями определяются в одну группу. Минусом является то, что данный вид кластеризации не учитывает смысл фразы при распределении их на группы, т.е. есть шанс, что «купить доску пола» и «как сделать полку из доски пола» окажутся в одной группе.
- Кластеризация вопрос/не вопрос – редко используемый вид, основан на том, является ли фраза вопросом или нет. Подходит для сервисов или разделов с вопросами и ответами.
2.1. Кластеризация по топ-10
Самый распространенный вид – распределение по топ-10. Процесс работы при работе с инструментами происходит следующим образом: задается минимальный порог или уровень количества совпадений URL-адресов в результатах поиска. Изменить его можно в настройках используемого вами инструмента для кластеризации. Этот порог влияет на количество кластеров и ключевиков в них. Если он более высокий – то будет больше кластеров с меньшим количеством фраз. Если использовать уровень кластеризации 1 или 2, тогда кластеры будут иметь большое количество ключевых фраз. Рекомендуем опираться на результаты экспериментов Алексея Чекушина, где минимальный рабочий порог для hard кластеризации – три URL, для soft – четыре URL, либо смотреть рекомендации самого инструмента, который вы используете.
Существует несколько методов кластеризации:
-
Soft (мягкая) – самый частотный запрос сравнивается с последующими по количеству общих URL в ТОП-10. Если количество общих URL превышает или равно заданному порогу, то запрос будет добавлен в кластер. В результате все ключевые слова в кластере будут связаны с главной частотной фразой, но они не обязательно будут связаны друг с другом (т.е. не обязательно, что в результатах поисковой выдачи по ним будут совпадающие URL-адреса).
Применяется для интернет-магазинов с простой структурой или для сайтов информационной тематики. Особенность данного способа – данных больше, но они менее точны, т.е. встречаются ошибки в распределении совместного продвижения запросов на странице.
-
Moderate или Middle (умеренная) – считается компромиссом между Soft и Hard. Берется один самый частотный запрос, а все остальные сравниваются с ним по количеству общих URL-ов (как soft и hard). В то же время инструмент сравнивает все ключевые слова друг с другом. Если количество общих URL превышает или равно заданному порогу, то запрос добавляют в группу. По итогу в кластере все запросы будут попарно связаны друг с другом, но в разных парах URL могут отличаться.
-
Hard (жесткая) – самый частотный запрос сравнивается с последующими по количеству общих URL в топ-10 (как soft), дополнительно сравниваются все запросы между собой и все URL в полученных парах. Если количество общих URL превышает или равно заданному порогу, то запрос будет добавлен в кластер. Ключевые слова в кластере связаны друг с другом, URL в совпадающих словах обязательно одинаковые.
Метод применим в конкурентных тематиках, в сложных коммерческих услугах – например займы, страхование и т. д. – в данном случае из-за большого количества синонимов и большого количества самих запросов по той или иной теме. Этот метод кластеризации предоставляет меньше данных, но они более точны.
Soft | Moderate | Hard | |
самый частотный запрос сравнивается с последующими по количеству общих URL в ТОП-10 | Да | Да | Да |
ключевые слова в кластере связаны с главной частотной фразой | Да | Да | Да |
ключевые слова в кластере связаны друг с другом | Необязательно | Да, но URL могут быть разными | Да |
Есть и другие виды кластеризации:
- Ручная группировка. Подходит только для небольших интернет-магазинов с маленьким семантическим ядром. Но даже при небольшом семантическом ядре есть большая вероятность ошибиться в распределении запросов. Как показывает практика, неопытные специалисты в ручном режиме могут достигать лишь 20% точности. Поэтому рекомендуем анализировать выдачу поисковых систем по результатам созданных кластеров.
- Кластеризация по интенту, предложенная Сергеем Кокшаровым, где собирают фокус-группу (потенциальных клиентов), формируют список ключевых слов, далее они случайным образом распределяются по её участникам, задается правильный вопрос и люди сами раскидывают слова по посадочным страницам. Данный вид кластеризации – самый трудоемкий и дорогой.
3. Инструменты
3.1. Онлайн-сервисы автоматической группировки
Rush Analytics – платный онлайн-сервис, дающий при регистрации 200 лимитов. Лимиты в 999 штук стоят 999 руб./мес., есть и другие тарифы. Есть кластеризация по Wordstat, где требуется только список запросов и их частотность; по маркерным запросам – подходит, если вам известны запросы, которые отвечают конкретным страницам вашего сайта; и третий вид – Wordstat + Ручные маркеры.
Just-Magic – платный онлайн-сервис, где выгодно покупать подписки (от 1000 руб/мес.), а не просто использовать стандартный тарифный план. При регистрации дается 100 лимитов. Позволяет сгруппировать ключевые слова на основании топов Яндекса или Google. Метод кластеризации – hard. Soft реализована в другом инструменте «Маркеры-онлайн».
Топвизор – платный онлайн-сервис. Можно просто пополнять баланс, а можно подписаться на тарифный план и получать скидку, к примеру тариф S со скидкой 10% – стоимость 999 руб/мес. Работает по трем видам: Soft, Moderate и Hard с порогом пересечения от 1 до 9. Фразы группируются на основе выдачи Яндекс и Google.
Megaindex – платный онлайн-сервис, дающий бесплатно 1000 запросов. Чтобы была доступна кластеризация для 5000 фраз, нужно заплатить 1490 руб/мес, если нужно больше – цена увеличивается. Есть возможность выбора совпадений URL от 3 до 10. Есть функционал для расширения запросов на основе анализа конкурентов из ТОП-10.
Semparser – платный онлайн-сервис. Бесплатно можно проверить 50 запросов. Чем больше вы покупаете их количество, тем меньше платите за 1 запрос: при покупке до 500 запросов – 0,60 руб. за единицу, а при покупке от 50 000 запросов – 0,18 руб. Группировка происходит по Яндексу и Google по заданному вами региону. Степень группировки от 0 до 10.
Serpstat – платный онлайн-сервис. Приобретая тариф Plan B за 69,00 $/мес. у вас будет возможность отправить на группировку 4000 фраз. Дает возможность выбрать поисковую систему и регион. Есть три типа связи между ключевиками: Weak, Medium и Strong и два типа кластеризации: Soft и Hard.
S:toolz – платный онлайн-сервис. Цена за обработку одного запроса 0,1 руб. При регистрации дается бесплатно обработать 500 запросов. Задается город и адрес вашего сайта. Уровень кластеризации от 2 до 10. Сам сервис группировку слов не отображает, ее можно только скачать в файле XLS.
SE Ranking – платный онлайн-сервис. Для работы над кластеризацией в бесплатном trial-аккаунте необходимо пополнять баланс – за каждую фразу 0,2 руб. Можно приобрести тариф от 1500 руб, где вам будет предоставлена скидка. Задается поисковая система и регион. Уровень от 1 до 9. Методы Soft и Hard.
Coolakov – условно бесплатный сервис, позволяющий распределять 1000 запросов единоразово. Объем от 1000 до 100 000 запросов стоит 0,2 руб/запрос. Порог кластеризации можно выбрать от 1 до 10.
Для многих платных сервисов вы можете найти промокоды, благодаря которым увеличиваются лимиты.
3.2. Онлайн-сервисы ручной кластеризации
KeyAssistant – бесплатный онлайн-сервис для ручной загрузки и распределения фраз, в том числе нескольких тысяч. Можно опираться на подсказки по группам ключевиков от сервиса (они подсвечиваются). Для удбства есть быстрые клавиши. Итог можно скачать в формате CSV.
Kg.ppc.panel – бесплатный онлайн-сервис для ручной кластеризации. Позволяет загрузить фразы, отфильтровать минус-слова и сгруппировать в группы. Иногда сервис ломается и не дает выгрузить проделанную работу.
Помимо представленных сервисов для ручной группировки ключевиков вы можете использовать Microsoft Excel, LibreOffice, OpenOffice и Документы Google.
3.3. Программы для автоматической кластеризации
KeyAssort – платная программа с демо-версией (из которой нельзя выгрузить результат). Стоимость программы – 1900 руб. Работает на Windows XP, Vista, 7, 8, 10. Есть Яндекс и Google, а также выбор региона. Помимо перечисленного можно настроить: миграцию запросов, расширение семантики, параметры, которые не надо учитывать и пр.
Mindserp – платная программа за 3000 рублей. Есть возможность запросить демо-доступ на 2 дня. В настройках можно выбрать регион, поисковую систему и пр. Уровень кластеризации можно задать вручную. Также вы можете настраивать: кол-во повторов, маску поиска Google и прочие параметры.
Majento Кластеризатор – бесплатная программа, копия онлайн-сервиса от Majento с дополнительными функциями. Данные собираются из Яндекса с использованием лимитов Яндекс.XML. Есть указание региона. Методы Soft и Hard, можно указать порог от 1 до 10. Доступна функция ручной группировки фраз для внесения изменений в полученную кластеризацию. Результаты экспортируются в CSV.
3.4. Что лучше?
А теперь самое интересное: специалист в области SEO и кластеризации А. Ожгибесов провел исследование качества сервисов по поисковой выдаче и пришел к следующим результатам (чем выше оценка, тем лучше кластеризатор и его метод):
Кластеризатор | Оценка | Продолжение таблицы | |
Rush Soft - 3 | 281 | Mindserp Hard - 4 | 151 |
Топвизор Soft - 3 | 269 | KeyAssort Hard - 6 | 145 |
KeyAssort Soft - 3 | 265 | Rush Soft - 5 | 144 |
KeyAssort Hard - 3 | 264 | Mindserp Soft - 6 | 142 |
KeyAssort Soft - 4 | 262 | Rush Hard - 5 | 138 |
Rush Hard - 3 | 250 | Just-Magic Hard - 5 | 130 |
KeyAssort Soft - 5 | 249 | Топвизор Soft - 6 | 126 |
Just-Magic Hard - 3 | 246 | Топвизор Hard - 5 | 125 |
Mindserp Soft - 3 | 244 | KeyAssort Hard - 7 | 118 |
Топвизор Soft - 4 | 236 | Megaindex Hard - 4 | 118 |
Топвизор Hard - 3 | 229 | Semparser - 5 | 105 |
KeyAssort Soft - 6 | 225 | Mindserp Hard - 5 | 104 |
KeyAssort Hard - 4 | 223 | Rush Soft - 6 | 92 |
Mindserp Soft - 4 | 220 | Megaindex Hard - 5 | 88 |
Rush Soft - 4 | 220 | Mindserp Soft - 7 | 88 |
Semparser - 3 | 216 | Just-Magic Hard - 6 | 86 |
Mindserp Hard - 3 | 202 | Топвизор Hard - 6 | 83 |
Rush Hard - 4 | 199 | Топвизор Soft - 7 | 81 |
KeyAssort Hard - 5 | 198 | Mindserp Hard - 6 | 74 |
Just-Magic Hard - 4 | 194 | Rush Soft - 7 | 66 |
Megaindex Hard - 3 | 187 | Semparser - 6 | 62 |
Mindserp Soft - 5 | 187 | Megaindex Hard - 6 | 61 |
Топвизор Soft - 5 | 178 | Топвизор Hard - 7 | 58 |
KeyAssort Soft - 7 | 177 | Mindserp Hard - 7 | 52 |
Топвизор Hard - 4 | 175 | Megaindex Hard - 7 | 46 |
Semparser - 4 | 154 | Semparser - 7 | 35 |
Лучшим оказался сервис Rush Analytics с использованием метода Soft с порогом 3:
4. Процесс кластеризации семантического ядра
На основе всего вышеизложенного подведем итоги, как происходит данный процесс:
- Собираете максимально большое количество ключевых фраз с их частотностью с помощью различных источников.
- Фильтруете фразы, т.е. удаляете все минус-слова.
- Кластеризуете с помощью программ (устанавливаете регион, поисковую систему и порог) или вручную.
- Вручную проверяете каждую группу на логику наличия ключевых слов в кластере, если возникают сомнения, то проверяете выдачу поисковой системы.
- Определяете страницу для SEO-продвижения. Некоторые программы при кластеризации указывают подходящую страницу.
4.1. Плюсы и минусы
Какие достоинства несет в себе кластеризация?
- При использовании инструментов значительно сокращается время работы на группировку запросов по группам.
- Еще на этапе разработки можно заранее продумать, как организовать структуру сайта, определить какие страницы потребуются в будущем и начать планировать контент.
- С использованием инструментов уменьшается количество ошибок в сравнении с ручной кластеризацией.
- С помощью правильно проведенной кластеризации посетитель будет находить именно ту продукцию или услуги, которые он искал.
Какие недостатки?
- Готовая кластеризация, сделанная по топу, может отличаться спустя время из-за смены сайтов в поисковой выдаче.
- При большом количестве семантики процесс кластеризации происходит долго и требует дополнительной проверки.
- При использовании автоматических инструментов образуется список запросов, которые не кластеризованы, т.е. они не отнесены ни к какой-либо группе. И в данном случае требуется их ручная проработка.
- Зачастую в кластеры попадают фразы, которые хоть и близки по тематике, но на деле означают разные предметы, например, «горшок для цветов», «кашпо для цветов».