Кластеризация запросов (группировка) - это разделение семантического ядра на небольшие логические группы (кластеры), которые можно продвигать на одной странице.
Кластеризация семантического ядра — главный источник головной боли и нервного тика при работе с семантикой у начинающих оптимизаторов и предпринимателей, самостоятельно продвигающих свой сайт.
Сегодня мы разберем:
- Что скрывается за страшным словом «кластеризация».
- Какой поисковый интент у «поискового интента».
- Как выйти победителем при первой в своей жизни кластеризации.
А главное, как выбрать удобный способ кластеризации запросов без ущерба для точности сортировки и кошелька оптимизатора.
Если вы не путаете «SEO» и «СЕО», но еще не знаете про разницу между Soft и Hard группировкой, то попали по адресу. Погнали!
Определяем поисковый интент
Итак, семантическое ядро вы уже составили. После сбора семантики и очистки ядра от нецелевых вхождений можно приступать к кластеризации.
Первый этап сортировки поисковых запросов начинается с определения интента.
Поисковый интент — это цель, намерение пользователя, которое вкладывается в запрос при поиске.
Поисковый интент используется Google и «Яндексом» для формирования релевантной выдачи, когда сайты сортируются в поиске с учетом смысловой содержательности поискового запроса и намерения пользователя. Интент может быть коммерческим, когда намерение пользователя — найти товар или заказать услуги, или информационным, где основная цель — узнать информацию о продукте.
Для корректного ранжирования на посадочной странице все ключевые слова должны принадлежать одному интенту. При этом, в зависимости от сезонности и спроса на товары, поисковый запрос может приобретать в разное время коммерческий или информационный интент.
Сортировать ключевые слова в зависимости от интента можно по фактору коммерческости — показателя, определяющего уровень преобладания продающего намерения над информационным при поиске. Поисковые запросы с высоким уровнем коммерческости следует размещать на коммерческих страницах, с низким — в информационных, при смешанном показателе придется искать баланс.
Разберем тонкости проверки на примере условно-бесплатного Arsenkin Tools Commerce. Сервис позволяет бесплатно проверять до 100 ключевых слов в день, также можно приобрести подписку за 549 рублей на 1 месяц и проверять до 2 500 запросов. Для проверки достаточно вставить семантическое ядро, выбрать регион и запустить анализ.
Результаты анализа выводятся в формате таблицы с отображением процента коммерческости.
Коммерческость поискового запроса — это доминирование коммерческого интента у пользователя, вводящего запрос в браузерной строке.
Запросы с коммерческостью менее 35 % имеют информационный интент и подходят для публикации в блоге, FAQ или гайдах, от 60 % — в каталоге товаров и коммерческих страницах. Поисковые запросы с коммерческостью в 35–60 % имеют смешанный интент — использовать их требуется аккуратно, иначе есть риск размыть релевантность страницы.
Для сортировки результаты копируем в таблицу Excel или «Google Таблицы», после чего выделяем столбец с процентным показателем комммерческости и сортируем.
Таким образом таблица отсортируется. Вверху будут поисковые запросы с информационным интентом, а в нижней части — с коммерческим.
Выбираем подходящий метод кластеризации
Методика кластеризации поисковых запросов подбирается с учетом объема собранной семантики и количества страниц на сайте. Чаще всего применяется комбинированный метод, где используется несколько вариантов кластеризации, что позволяет добиться наиболее точного результата. Мы же разберем каждый метод по отдельности.
Логическая кластеризация
Точечный инструмент для группировки небольших семантических ядер. Кластеризация ключевых слов проводится вручную: оптимизатор определяет цель поиска и смысловую релевантность для каждого поискового запроса. Муторно, но действенно.
Точность и качество логической группировки зависит от объема семантического ядра. Чем больше требуется отсортировать поисковых запросов, тем выше риск допустить ошибки: сбиться с логики кластеризации, пропустить слова или неправильно определить интент.
Кластеризация по семантической схожести
Для кластеризации семантического ядра используются сложные формулы и обучаемые нейросети. Смысл группировки сводится к объединению в кластеры семантически близких поисковых запросов. При этом ключевые слова могут не иметь лексикографического сходства, но всегда похожи по семантике.
Пример. Группа в семантическом ядре формируется, если у всех поисковых запросов есть пересечение с ключевым словом. Например, “lada check engine”, “купить коврики lada”, и ”как почистить коврики lada” попадут в одну группу, при этом 2 последних поисковых запроса сформируют еще один отдельный кластер.
Проводить кластеризацию по семантической схожести для молодого сайта нет смысла: такая задача поручается нейросетям при наличии большого семантического ядра. При этом такая группировка не учитывает коммерческость, ведь после кластеризации придется еще сортировать ключи в зависимости от поискового интента.
Кластеризация по топам
Наиболее правильный и популярный способ группировки семантики. Смысл кластеризации заключается в объединении поисковых запросов в кластеры согласно семантической базе сайтов, находящихся в топе выдачи «Яндекс» и Google.
Из популярных программ для кластеризации стоит выделить KeyClusterer, AllSubmitter, а также Key Collector. В отличие от онлайн-сервисов с оплатой по подписке, десктопное ПО приобретается единоразово по лицензии, а скорость кластеризации зависит от производительности компьютера.
Логика метода заключается в поиске пересечений ключевых слов на страницах сайтов, находящихся в топе поисковых систем. Обычно проводится кластеризация по топ-3 или топ-10, реже учитываются список из 50 сайтов в рейтинге.
Для увеличения точности группировки перед кластеризацией задается порог пересечений: ключевые слова объединяются в кластер только если будут найдены, например, на сразу двух, пяти или десяти сайтах.
Логическая группировка | Кластеризация по топам | Группировка по семантической схожести | |
Кому подойдет | Молодым сайтам, визиткам и лендингам | Многостраничным ресурсам и e-commerce | Маркетплейсам, онлайн-библиотекам |
Когда подойдет | При небольшом семантическом ядре | Для работы с ядром среднестатистического сайта | Для группировки крупных семантических ядер |
Преимущества | Точный результат, возможность учесть несколько переменных при кластеризации | Быстрый и недорогой способ обработать большое семантическое ядро | Возможность сегментировать большие массивы неструктурированных данных |
Недостатки | Сложность группировки и высокий риск ошибок при долгой сортировке | Часто требуется повторная ручная кластеризация, чтобы сделать лучше, чем у конкурентов | Сложность реализации и необходимость повторной обработки семантики |
Можно ли выполнить начинающему оптимизатору | Да, вручную | Да, через сервисы или софт | Нет, нужен сложный и дорогой софт |
На практике лучше совмещать несколько методов кластеризации. Например, группировать объемное ядро по топам, а сложные ключи со смешанным интентом сортировать вручную.
Подбираем алгоритм кластеризации семантического ядра по топам
Для корректной кластеризации даже для небольшого сайта рекомендуется сначала провести группировку семантики по топам поисковой выдачи и лишь затем сегментировать спорные ключевые слова вручную. Кластеризация на основании анализа поисковой выдачи может проводиться тремя способами-уровнями: Soft, Middle, Hard. Рассмотрим каждый из них.
Soft-кластеризация
При мягкой кластеризации все поисковые запросы сравниваются с основным, тематико-задающим ключом, имеющим, как правило, наибольшую частотность. В кластер добавляются все ключевые слова, привязанные к URL в поисковой выдаче, которые пересекаются с главным поисковым запросом. Ключевое слово попадает в кластер семантического ядра, если количество одинаковых URL выше выбранного порога кластеризации. При этом второстепенные ключевые слова могут даже не пересечься между собой, из-за чего в кластер добавляется много поисковых запросов, но страдает точность группировки.
Метод предназначен для молодых проектов или неконкурентных тематик, где точность сортировки ключевых слов не столь важна.
Soft-кластеризация подойдет небольшим информационным сайтам или интернет-магазинам с маленьким ассортиментом товаров.
Soft-кластеризация может использоваться для сегментирования семантического ядра сайтов-визиток.
Hard-кластеризация
Это жесткий, но точный метод сегментации ключевых слов в семантическом ядре, который подходит для высококонкурентных и сложных тематик. При таком подходе отсеивается много поисковых запросов, однако удается создать кластер с максимально релевантными ключевыми словами к тематике посадочной страницы.
При Hard-кластеризации кластер создается только в случае пересечения всех ключевых фраз среди URL-адресов, входящих в топ-10 поисковой выдачи. Помимо пересечения главного ключевого слова также проводится сравнение вспомогательных поисковых запросов: кластер образуется только при выполнении обоих этих условий.
Порог кластеризации определяет число совпадений не только главного поискового запроса, но и всех входящих в кластер запросов. При этом чем выше порог кластеризации, тем меньше ключевых слов попадает в кластер семантического ядра.
Middle-кластеризация
Middle-кластеризация — компромисс между слабой точностью Soft-метода и жесткостью к отбору Hard-группировки. Выбирается главный тематико-задающий поисковый запрос, к которому привязываются остальные ключевые слова, прошедшие порог кластеризации по количеству URL в выдаче Google или «Яндекс». При этом кластеризатор сравнивает все зависимые с главным запросом ключевые слова друг с другом.
Так поисковые запросы связываются между собой внутри кластера семантического ядра, но могут отличаться в разных парах проверяемых URL. У всех ключевых слов в кластере нет задачи пройти пересечение по URL-адресам в топе, сопутствующие поисковые запросы попадают в группу вместе с тематикозадающим запросом.
Middle-кластеризация подходит для информационных ресурсов с большим семантическим ядром или интернет-магазинам в слабоконкурентных нишах. Такой подход обеспечивает большую точность, чем при Soft-кластеризации, и не позволяет отсеивать большинство ключевых слов, как при Hard-группировке.
Сервисы и приложения для кластеризации семантического ядра
Для кластеризации семантики по анализу поисковых топов можно использовать десктопное ПО или онлайн-сервисы. Различие — в скорости, функциональности и цене. Рассмотрим, какой вариант кластеризации предпочтительнее исходя из задач оптимизатора.
Программы для кластеризации семантики
Desktop-программы предлагают большую функциональность, чем онлайн-сервисы, что позволяет тонко выбрать параметры группировки поисковых запросов или настроить интерфейс софта. У офлайн-программ для кластеризации есть ряд преимуществ и недостатков:
Плюсы | Минусы |
Можно гибко настроить параметры кластеризации и редактировать семантическое ядро внутри программы | Кластеризация выполняется на компьютере пользователя: для работы с большим семантическим ядром требуется стабильный интернет и производительное железо |
Возможность полностью автоматизировать работу с семантикой. Например, в Key Collector ядро можно спарсить, очистить и сразу кластеризовать | Все функциональные программы для кластеризации платные. Цена наиболее популярного Key Collector — 2 200 рублей |
Desktop-программы поддерживают больше форматов для импорта и экспорта, а также позволяют создать шаблон с настройками для дальнейшей работы с семантикой | Интерфейс desktop-программ сложнее, чем у онлайн-сервисов. Для удобной работы требуется пройти обучение и посмотреть гайды |
Наиболее популярным софтом для кластеризации считаются AllSubmitter, KeyClusterer и Key Collector.
Пример кластеризации запросов в Key Collector
Рассмотрим пример группировки семантического ядра на основе анализа поисковой выдаче на примере Key Collector — пожалуй, обязательного инструмента для SEO-специалистов.
Прежде чем приступить к кластеризации, в программу требуется загрузить все семантическое ядро. Если данные собирались в Key Collector, нужно открыть сохраненный файл программы, если со сторонней программы — нужен импорт. Для импорта файлом или добавления вручную скопированных поисковых запросов переходим в раздел «Главная», где выбираем «Добавить фразы». Далее вставляем скопированную семантику или указываем адрес к файлу на компьютере:
Для группировки важно собрать по всем фразам частотность — это можно сделать здесь же в программе
Отмечаем галочкой все поисковые запросы и переходим в раздел «Данные», где нажимаем «Анализ групп». Теперь выбираем параметр «По поисковой выдаче (улучшенная)», отмечаем поисковые системы и количество URL в выдаче для анализа. Далее нужно выбрать силу SERP для кластеризации — для семантики, где преобладают двух- или трехсловные поисковые запросы, будет достаточно порога в 3 пересечения.
На скриншоте показан пример Soft-кластеризации методом «объединения» запросов. Для проведения Hard-кластеризации режим группировки в настройках нужно заменить на «пересечение». При обновлении семантического ядра процедуру кластеризации придется повторить.
Онлайн-сервисы для кластеризации
Более простой подход к кластеризации производится с помощью онлайн-сервисов. Это позволяет обработать семантику быстрее и не требует обучения, как для профильного софта. Здесь также есть свои преимущества и недостатки:
Плюсы | Минусы |
Кластеризация проходит в максимально удобном формате — в пару кликов | Сервисы не позволяют обрабатывать большие семантические ядра |
Оптимизатору не требуется вникать в технические нюансы. Интерфейс крайне дружественен пользователям | У онлайн-сервисов много ограничений: по количеству проверок, числу ключевых слов в ядре |
Для разовых или нерегулярных работ онлайн-сервисы — наиболее удобный инструмент для кластеризации | В долгосрочной перспективе приобретение профильного ПО оказывается выгоднее и практичнее |
Наиболее популярные сервисы для кластеризации — Coolakov, Semantist и SeoQuick.
Пример онлайн кластеризации запросов в SeoQuick
Для примера рассмотрим SeoQuick — это наиболее доступный и функциональный сервис. Он позволяет сделать за день 4 кластеризации с семантическим ядром до 5 000 ключевых слов.
Затем открываем «Расширенные функции». Также можно импортировать файлы txt, xls, xlsx, csv.
В дополнительных настройках можно задать список стоп-слов, обязательных поисковых запросов или приказать учитывать словосочетания как одно цельное ключевое слово.
Разбираем основные ошибки при кластеризации семантического ядра
Кластеризация считается самым сложным этапом при работе с семантическим ядром, на котором часто возникают ошибки. Рассмотрим топ популярных ошибок и дадим рекомендации по их упреждению.
Распространенная проблема | Почему данная ошибка так популярна | Как не допустить ошибки при кластеризации |
Запрос с разным интентом в одном семантическом кластере | Отсутствие четкого понимания интента и отказ от сегментирования ключевых слов по коммерческости | Обязательно сортировать семантику по коммерческости при кластеризации |
Несоответствие ключевых слов тематике посадочной страницы | Нарушена логика группировки при ручной кластеризации или сегментирование объемного ядра Soft-кластеризатором | Провести чистку семантики, увеличить точность кластеризации, выбрав Middle- или Hard-метод сортировки. Отсортировать проблемные кластеры вручную после кластеризации |
Слишком много ключевых слов в одном кластере | Попытка структурировать большое семантическое ядро Soft-кластеризацией | Повысить точность кластеризации для объемной семантики поможет middle или hard группировка |
Ошибки в ключевых словах | Ручная кластеризация или неправильный перенос собранных ключевых слов после сбора семантики | Предупредить ошибки в ключевых словах помогает автоматический парсинг и экспорт собранной семантики в кластеризатор. Для удаления уже имеющихся ошибок перед кластеризацией нужно провести чистку ядра |
Много дублей, мусорных вхождений и запросов с нулевой частотностью | Запуск кластеризации сразу после парсинга семантики, без чистки ядра | Провести чистку семантического ядра перед кластеризацией |
Кластеризация — обязательный этап поисковой оптимизации после расширения структуры сайта и обновления семантического ядра. Посмотрите, как это работает на практике, на примере кейса для Rusplitka.ru.
Грамотная кластеризация специалистов агентства Kokoc Group позволила сегментировать семантику после крупного обновления товарного ассортимента, помогла улучшить ранжирование сайта в поиске и увеличить количество уникальных визитов.
Это дало бонус при ранжировании и положительно повлияло на поведенческие факторы.
Если вам требуется помощь с кластеризацией большого семантического ядра или комплексное SEO-продвижение сайта, обращайтесь к специалистам Kokoc Group.
Комментарии 3