сейка.ru
§ 03.03 · Семантика и контент

Кластеризация запросов: как группировать по SERP правильно

Soft и hard порог, инструменты, ручная доводка, типичные ошибки. Кластеризация — это инженерия, не магия.

Сейчас покажу, почему «кластеризация по словам» не работает в 2026, а кластеризация по SERP — работает.

Кластеризация запросов — самый важный технический этап сбора семантического ядра. От её качества зависит, окажутся ли запросы под одной посадочной страницей или разойдутся по нескольким разным. Ошибки на этом шаге дают «никакие» страницы, которые ранжируются на 30-50 позициях по большому набору запросов и не выходят выше, потому что не имеют чёткого интента.

Сейка разберёт, как правильно кластеризовать в 2026 году и почему старый метод по словам уже не работает.

Почему «по словам» не работает

Старый метод кластеризации — группировка запросов по лексической близости. «Купить пуховик» и «пуховик купить» — один кластер. «Дешёвый пуховик» и «недорогой пуховик» — один кластер. Это работало в эпоху, когда ранжирование шло в основном по совпадению слов на странице и в запросе.

Сейчас этот метод не работает по двум причинам.

Первая: YATI понимает синонимы. «Купить пуховик» и «приобрести пуховик» — лексически разные конструкции, но интент один. Кластеризация по словам их разведёт в разные кластеры (потому что слова разные). SERP-кластеризация сведёт их вместе (потому что Яндекс показывает одни и те же страницы под оба варианта).

Вторая, ещё более важная: близкие по словам запросы могут давать разный интент. «Лучший пуховик» и «купить пуховик» — лексически близкие фразы. SERP под них разный: первый показывает обзоры и сравнения, второй — карточки товаров. Это два разных кластера, две разных посадочных страницы. Лексика тут вообще не помогает — наоборот, обманывает.

Метод «через SERP»

Стандарт русской кластеризации с середины 2010-х годов и до сих пор. Логика простая: схожесть выдачи — лучший сигнал того, считает ли поисковик два запроса принципиально одним.

Алгоритм работает так. Для каждого запроса в ядре парсится топ-10 Яндекса (или Google, или обоих) в нужном регионе. Это даёт для каждого запроса список из десяти URL — те страницы, которые ранжируются в выдаче. Дальше строится матрица «запрос × URL»: для каждой пары запросов в ядре считается, сколько одинаковых URL у них в топ-10. После этого запросы группируются: если пересечение URL больше или равно заданному порогу, запросы относятся к одному кластеру.

Порог пересечения — это и есть «soft / hard», два подхода к кластеризации.

Hard (жёсткая) кластеризация — порог 5-6 URL. Запросы должны очень сильно пересекаться по SERP, чтобы попасть в один кластер. Получается больше кластеров, в каждом меньше запросов, но соответствие одному интенту высокое. Стандарт для коммерческих ядер.

Soft (мягкая) кластеризация — порог 3-4 URL. Получается меньше кластеров, в каждый влезает больше запросов. Риск — собрать в один кластер запросы с близкими, но разными интентами. Подходит для контентных сайтов, где допустимо «всё про X» на одной странице.

Большинство SEO-специалистов берут hard с порогом 5. Для очень узких ниш иногда увеличивают до 6. Soft применяют редко и осознанно.

Сейка подсказывает

Универсальный порог не существует — это всегда настройка под конкретное ядро. Посмотрите так: если hard-кластеризация даёт вам 800 кластеров на ядре в 5000 запросов, значит либо ваше ядро очень разнообразное (норма для широкой ниши), либо вы режете слишком тонко (стоит попробовать soft). Если хард даёт 50 кластеров на 5000 запросов — наоборот, кластеры слишком крупные, нужно ужесточать.

Инструменты

Все основные инструменты кластеризации используют одну и ту же логику (парсинг SERP плюс матрица), но различаются качеством парсинга, скоростью, фильтрами и удобством работы.

Topvisor — самый популярный в Рунете. Хорошая кластеризация, удобный интерфейс, можно работать с большими ядрами (десятки тысяч запросов без подвисаний). Парсит и Яндекс, и Google. Цена средняя.

Rush Analytics — сильный инструмент с обширной кластеризацией. Хорош для коммерческих ядер, поддерживает региональность с точностью до города. Часто используется агентствами как основной инструмент.

Key Collector — десктопный софт от русского разработчика, известный своей мощностью и гибкостью. Сложнее в освоении, чем облачные сервисы, но позволяет тонко настраивать парсинг и обработку. Подходит для проектов с особыми требованиями. Использует свои источники данных и сторонние API.

Just-Magic — облачный сервис с акцентом на простоту. Подходит для нетехнических SEO-специалистов: меньше настроек, но рабочий результат «из коробки». Для маленьких ядер — нормально.

Бесплатные самописные решения — есть скрипты на Python с парсингом выдачи через прокси и алгоритмом DBSCAN. Они работают, но требуют технического сопровождения. Для проектов с ядром больше 10 тысяч запросов Сейка не рекомендует — поддержка обходится дороже коммерческого сервиса.

Ручная доводка

Автоматика не понимает интент — только пересечение URL. Поэтому после автокластеризации обязательно нужен ручной шаг.

На что смотреть при проверке. Кластеры из одного-двух запросов — часто слипаются с близкими, если посмотреть SERP вручную; иногда это реально уникальные интенты, особенно в длинном хвосте. Аномально большие кластеры из пятидесяти и больше запросов — часто внутри несколько интентов, нужно разрезать руками. Кластеры с разными типами страниц в SERP — если в топ-10 половина карточек товаров, половина статей, это мульти-интент, и кластер нужно расщеплять. Брендовые запросы в коммерческих кластерах — часто стоит выделить отдельный кластер для брендов. Региональные модификаторы — «пуховики москва» и «пуховики спб» требуют решения: либо это два отдельных кластера (для мультирегионального сайта), либо один с динамическими лендингами.

Сколько занимает ручная доводка. Для ядра в 5000 запросов — обычно один-два рабочих дня. Для 50000 запросов — неделя. Это правильно потраченное время, потому что плохо доведённая кластеризация даст много «никаких» страниц.

Соответствие интенту

Каждый кластер должен иметь один интент. Если в кластере смесь разных интентов, это сигнал расщепить.

Простая проверка для каждого кластера: возьмите топ-3 запроса по частотности, посмотрите их SERP в инкогнито. Если у этих запросов одинаковые ведущие сайты в выдаче и одинаковый тип страниц (все карточки, или все статьи, или все категории) — кластер чистый. Если типы разные — нужно резать.

Осторожно

Самая частая ошибка кластеризации — собрать в один кластер «купить пуховик» (карточка или категория магазина) и «как выбрать пуховик» (статья-гайд). Они близки по словам, но это разные интенты, разные форматы страниц, разные SERP. На одной странице оба запроса не зайдут ни в коем случае. Их обязательно нужно расщеплять.

Привязка к посадочным

Когда кластеры доведены, нужно решить, какая страница вашего сайта закрывает каждый кластер.

Логика простая. Если страница уже есть на сайте и подходит по интенту — присваиваете ей кластер. Если страницы нет — это сигнал к созданию новой страницы. Если кластер маленький и тематически смыкается с большим существующим кластером, иногда можно добавить его как H2-раздел внутри уже существующей страницы.

Финальный результат работы — таблица карты релевантности:

КластерГлавный запросЧастотностьПосадочнаяСтатус
Пуховики женскиепуховики женские25 000/category/zhenskie-puhoviki/существует
Пуховики женские короткиепуховики женские короткие5 000/category/zhenskie-puhoviki/?filter=shortсуществует
Пуховики для беременныхпуховики для беременных2 000НОВАЯсоздать

Это уже готовое техническое задание для разработчика (создать недостающие страницы) и контентной команды (написать тексты).

Кластеризация для Яндекса vs Google

Логика кластеризации одна и та же, но результаты разные, потому что SERP в двух поисковиках разная.

Если ваш проект работает на обе системы примерно поровну, имеет смысл кластеризовать по обоим и искать «согласованные» кластеры — те, что одинаковые в Яндексе и в Google. Это безопасные кандидаты на единую страницу под обе системы.

Если кластер расходится (в Яндексе запросы вместе, в Google — врозь), приоритизируйте ту систему, где у вас больше трафика. Или, если бюджет позволяет, делайте две страницы — одну под Яндекс, другую под Google.

Если проект Yandex-first, кластеризуйте по Яндексу и не оглядывайтесь на Google. Если когда-то понадобится Google-трафик, адаптируете локально под нужные запросы.

Кластеризация и LLM

С 2024 года в SEO-сообществе появился тренд кластеризации с помощью LLM — GPT-4, YandexGPT, Claude. Идея заманчивая: LLM лучше понимает интент, чем алгоритмическая SERP-кластеризация, потому что она «думает о смысле».

На практике пока хуже. LLM «галлюцинирует» интент — то есть может уверенно отнести запросы к одному кластеру, не имея для этого реальных оснований из SERP. Не знает регионального аспекта выдачи. Не учитывает сезонность.

LLM полезна как дополнение к SERP-кластеризации: для генерации синонимов на этапе сбора, для группировки длинного хвоста, для проверки крайних случаев, когда автомат и человек дают разные ответы. Полностью полагаться на LLM при кластеризации пока нет.

Что не делать

Не кластеризуйте только по словам. Это старый метод, который не работает с YATI 2020+ годов.

Не используйте порог soft на коммерческом ядре. Получите смешанные кластеры и плохо ранжирующиеся страницы с размытым интентом.

Не пропускайте ручную доводку после автокластеризации. Автоматика — это 80% работы, оставшиеся 20% решают качество ядра.

Не делайте кластеризацию один раз и навсегда. SERP меняется со временем, и раз в шесть-двенадцать месяцев кластеры нужно пересматривать, особенно по самым важным запросам.

Короче говоря

Кластеризация — это инженерия, не магия, и работает только через SERP. Hard (порог 5-6 URL) подходит большинству коммерческих ядер. Soft — для контентных сайтов. Инструменты: Topvisor, Rush Analytics, Key Collector, Just-Magic. Автоматика — 80% работы, ручная доводка обязательна. Один кластер равен одному интенту; если интент смешанный, кластер режется. Каждому кластеру — одна посадочная страница; архитектура сайта выводится из ядра. LLM пока не заменяет SERP-кластеризацию, но помогает на отдельных этапах.

Дальше — LSI и тематичность, про то, как Яндекс понимает темы.

Источники

документация Topvisor и Rush Analytics, статьи Шакина и Девака о методах кластеризации, русскоязычные доклады с конференций Optimization 2022-2025.

Бесплатный AI SEO анализ

Сделайте аудит сайта прямо сейчас

Спросите Сейку напрямую — конкретный ответ по вашему сайту обычно быстрее, чем читать всю серию.

Убедитесь, что вы согласны с нашими Условиями использования и Политикой обработки персональных данных.