сейка.ru
§ 03.01 · Семантика и контент

Семантическое ядро end-to-end: от Wordstat до посадочных

Полный путь сбора семантики для русского сайта — Wordstat, парсинг подсказок, очистка, кластеризация, привязка к страницам.

Сейчас по шагам — от пустой таблицы до структуры сайта. Без «скачайте Key Collector и поехали».

Семантическое ядро (часто сокращают до СЯ) — это основа любого SEO-проекта в Рунете. Если ядра нет, у вас не SEO, а серия удачных совпадений. Если ядро плохое — у вас SEO, которое стабильно не доезжает до результата, потому что бьёт мимо реальных запросов аудитории. Сейка разберёт, как собирать ядро правильно, особенно для Яндекса, где морфология и интент усложняют процесс по сравнению с английским SEO.

Что такое СЯ на самом деле

В голове новичка СЯ часто выглядит как «список ключевых слов в Excel». Это сильно упрощённое представление.

Полноценное семантическое ядро — это таблица из четырёх обязательных столбцов. Запрос — полная фраза в том виде, как её вводят пользователи. Кластер — группа запросов с одним интентом, объединённая под одну посадочную страницу. Посадочная — URL страницы вашего сайта, который должен ранжироваться по этому кластеру. Метрики — частотность общая и точная, региональная частотность, сезонность, конкурентность, приоритет внутри проекта.

Все четыре столбца обязательны. Файл с одним столбцом «запрос» — это не ядро, это сырой парсинг, с которым ещё предстоит работать.

Шаг 1: Сбор сырых запросов

Сначала собираете максимум потенциально релевантных запросов из всех доступных источников. Чем шире выборка на старте, тем больше материала для последующей очистки и кластеризации.

Основные источники следующие. Wordstat — главный источник базовой частотности и морфологических вариантов. Подсказки Яндекса (suggest, то что Яндекс предлагает дописать в строке поиска) — приходят с реального поведения пользователей и дают свежие, актуальные запросы. Конкуренты в Topvisor, Rush Analytics, Megaindex, SEMrush — что ранжируется у конкурентов в вашей нише, то и есть «работающая» семантика. Метрика собственного сайта в разделе «Источники → Поисковые запросы» — что уже приводит трафик, часто там обнаруживаются формулировки, которые вы сами бы не угадали. Search Console, если вы работаете и на Google тоже. Внутренние источники — запросы из чата поддержки клиентов, теги товаров, FAQ-страницы, фиды и каталоги. LLM (YandexGPT, GPT-4) для генерации синонимов и связанных тем — с обязательной верификацией каждого варианта через Wordstat.

Сколько запросов собирать — зависит от типа проекта. Для интернет-магазина — обычно от 10 до 100 тысяч. Для контентного сайта средней ниши — от 3 до 10 тысяч. Для лендинга — 200-1000. Не «сколько влезет», а «сколько реально может стать страницами плюс запасные».

Сейка подсказывает

Сейка не любит полу-автоматический сбор миллиона ключей через парсеры типа ScrapeBox. На выходе вы получите шум, который потом неделю чистить, и большая часть этого шума никогда не превратится в полезные страницы. Лучше начать с качественной выборки 5-10 тысяч от конкурентов и Wordstat, потом расширять по мере роста проекта.

Шаг 2: Частотность

Сам по себе список запросов бесполезен. Нужно знать, какой за каждым стоит реальный спрос. Этим занимается Wordstat.

В Wordstat есть несколько режимов измерения частотности. Базовая частотность — «купить пуховик» — это сколько раз в месяц вообще задавались запросы, содержащие эти два слова в любых формах и сочетаниях. Самая завышенная оценка, потому что включает «как купить пуховик», «где купить пуховик дешевле», «купить ребёнку пуховик» и так далее.

Точная фраза в кавычках — "купить пуховик" — только запросы с этими словами в любом порядке без других слов. Уже ближе к конкретике.

Точная словоформа с восклицательным знаком — "!купить !пуховик" — точные словоформы в любом порядке. Самая точная оценка по этим конкретным словам.

И самая жёсткая — восклицательный плюс порядок — [!купить !пуховик] — точная словоформа именно в этом порядке. Это уже почти реальный объём показов конкретного запроса.

Для коммерческих запросов имеет смысл смотреть все три (базовую — для оценки рынка, точную — для конкретики). Для информационных часто достаточно базовой.

Региональная частотность

В Wordstat можно задавать регион (по умолчанию — Россия плюс СНГ). Для регионального бизнеса это критично: смотрите конкретный регион, потому что частотность отличается в 2-10 раз от усреднённой по России. Москва обычно даёт заметную долю общероссийской частотности — для коммерческих запросов это часто 25-40%, для других категорий меньше, и если вы работаете не в Москве, реальный объём вашего рынка нужно смотреть отдельно.

Сезонность

Wordstat показывает помесячную динамику за последние два года в разделе «История запросов». Для запросов с явной сезонностью (пуховики, кондиционеры, учебники, мангалы, ёлки) это критично. Иначе вы будете запускать SEO-кампанию в межсезонье, ждать чудес, удивляться отсутствию трафика, и винить в этом SEO-команду.

Шаг 3: Очистка

Сырая семантика, как бы аккуратно вы её ни собирали, всегда содержит шум. И этот шум нужно отфильтровать, прежде чем переходить к кластеризации.

Что обычно приходится чистить. Топонимы не вашего региона — «купить пуховик новосибирск», если вы работаете только на Москву. Чужие бренды — «найк пуховик», если вы не торгуете найком. Информационные запросы в коммерческом ядре или коммерческие в информационном — «что такое пуховик» — это не для интернет-магазина, это для блога. Слишком общие запросы — «пуховик» в одиночку — слишком конкурентен, почти всегда смешан по интенту, и под него отдельная страница не делается. Опечатки и формальные дубли — «пуховик женский» и «женский пуховик» в Wordstat одна строка, но при парсинге выдачи могут давать разные позиции.

Стандартный метод чистки — создаёте список стоп-слов (отрицательных ключей). Под каждый проект свой список: конкуренты, чужие регионы, информационные «как» / «что» / «почему» (если ядро коммерческое), частые опечатки, нерелевантные тематические термины. Этот список применяется к сырому ядру, и большая часть шума отсеивается автоматически.

Дальше — ручная итерация. Открываете отфильтрованный список, проходите по нему глазами, помечаете сомнительные строки. Полностью автоматически очистить ядро не получится — нужен человеческий контроль над тем, что входит в финальную выборку.

Шаг 4: Кластеризация

Самый важный этап работы с семантикой. Подробно разбирается в отдельной статье про кластеризацию; здесь — кратко.

Запросы группируются так, чтобы каждый кластер можно было закрыть одной посадочной страницей. Метод — через схожесть SERP: если по двум запросам топ-10 Яндекса пересекается на пять и больше результатов, эти запросы относятся к одному кластеру (это стандартный «жёсткий» порог в Рунете).

Инструменты, которые умеют это делать: Topvisor, Rush Analytics, Key Collector, Just-Magic. После автоматической кластеризации обязательна ручная проверка — обычно один-два дня работы на сложное большое ядро.

Осторожно

Распространённая ошибка новичков — пытаться засунуть в один кластер «всё похожее по словам». Простой пример: «купить пуховик» и «лучший пуховик 2026» кажутся близкими по лексике, но SERP под них разный — первый показывает магазины, второй обзоры. Это два разных кластера, две разных посадочных страницы. Их объединение даст «никакую» страницу, которая плохо ранжируется под оба запроса.

Шаг 5: Привязка к страницам и архитектура сайта

Когда кластеры готовы, нужно решить: какой страницей вашего сайта закрыть каждый кластер. И здесь начинается архитектура сайта — потому что часто оказывается, что нужной страницы у вас просто нет.

Логика привязки. Высокочастотные коммерческие запросы («пуховики женские») → страница категории верхнего уровня. Среднечастотные с фильтрами («пуховики женские зимние») → подкатегория или специальная страница фильтра, индексируемая. Низкочастотные с уточнениями («пуховики женские короткие с капюшоном») → страница фильтра или фасет с уникальным контентом. Информационные («как выбрать пуховик») → раздел блога, гид. Транзакционные с конкретикой («купить пуховик columbia 50 размер») → карточка товара.

Архитектура должна выводиться из семантического ядра, а не наоборот. Если из ядра следует, что нужна страница «пуховики для невысоких женщин до 160 см», а такой страницы у вас нет — это не аргумент в пользу того, чтобы пропустить эту часть ядра. Это аргумент в пользу создания страницы.

Часто это означает реструктуризацию существующего сайта — добавление новых категорий, расширение структуры фильтров, появление целых блоков контента. Это нормальная часть SEO-работы.

Шаг 6: Приоритезация

В большом ядре редко удаётся сразу запустить все страницы. Поэтому нужна приоритезация — по какому кластеру работать в первую очередь, какой может подождать.

Стандартная матрица приоритезации выглядит так.

КластерЧастотностьКонкурентностьКонверсияПриоритет
Пуховики женские50 000Высокая2.5%1
Пуховики женские короткие5 000Средняя3.0%2
Пуховики для подростков2 000Низкая1.5%3
Как стирать пуховик8 000Низкая0.1%4 (контент-маркетинг)

Логика: высокая частотность плюс низкая конкурентность плюс высокая конверсия равно первая очередь. На таких страницах быстрее всего окупится SEO-усилие. Запросы с высокой конкурентностью или низкой конверсией — на второй-третий ход, после того как фундамент уже работает.

Шаг 7: Карта релевантности

Финальный артефакт работы с семантикой — это карта релевантности для каждой посадочной страницы. Она становится готовым техническим заданием для разработчика и контент-команды.

Что входит в карту для одной страницы. Кластер запросов (10-100 запросов, в зависимости от ниши). Главный запрос — самый частотный и интент-задающий, на который вы целитесь в title и H1. Группа дополнительных запросов — для проработки в H2, H3, в основном тексте. Минимальный объём контента — определяется по конкурентам через парсинг топ-10 SERP. Целевая позиция и план по трафику.

Это готовое ТЗ. С ним можно идти к копирайтеру, разработчику, заказывать дизайн посадочной — все знают, что делать.

Чем Yandex-семантика отличается от Google-семантики

Яндекс

  • Морфология играет роль: словоформы дают разные позиции.
  • Wordstat остаётся основным источником частот.
  • Региональная частотность критична для геозависимых.
  • YATI хорошо понимает синонимы — но не везде.
  • Низкочастотный «длинный хвост» хорошо ранжируется.

Google

  • Морфология сводится BERT’ом к смыслу.
  • Google Keyword Planner, Ahrefs, SEMrush как источники.
  • Региональность по странам, внутри страны слабее.
  • Лучше работает с английскими синонимами, чем с русскими.
  • Длинный хвост работает, но конкуренция выше.

Ошибки, которые часто допускают

Собрать ядро один раз и забыть. Семантика меняется со временем: появляются новые продукты, меняются тренды, появляются новые формулировки запросов. Ядро нужно пересматривать раз в шесть-двенадцать месяцев, иначе оно устаревает и перестаёт работать.

Игнорировать сезонность. Запускать SEO-кампанию в межсезонье и удивляться, почему трафика нет, — это типичный сценарий. Сезонность видна в Wordstat, и её нужно закладывать в план работы.

Засунуть в один кластер слишком много запросов с разными интентами. Получится «никакая» страница, которая не побеждает ни по одному из суб-интентов.

Не учитывать конкурентность. Залезть в нишу, где сидят аэрофлоты и сберы, с маленьким сайтом и без большого бюджета, и ждать топ-3 за полгода — это нереалистично.

Кластеризовать только по словам, без анализа SERP. Получите формально красивое, фактически не работающее ядро. Кластеризация без SERP не определяет реальный интент.

Короче говоря

Семантическое ядро — основа SEO в Рунете, без него работа превращается в случайность. Полноценное ядро = запрос плюс кластер плюс посадочная плюс метрики (четыре столбца минимум). Wordstat — главный источник частот в Яндексе; подсказки, конкуренты, Метрика — дополнения. Кластеризация через SERP — единственный надёжный метод; «по словам» не работает. Архитектура сайта должна выводиться из ядра, а если не сходится — пересматривайте архитектуру, а не ядро. Приоритезируйте по матрице частотность × конкурентность × конверсия. Раз в шесть-двенадцать месяцев — пересмотр и обновление ядра.

Дальше — про поисковый интент и кластеризацию запросов.

Источники

документация Topvisor и Rush Analytics, статьи Девака и Шакина про сбор семантики, классические материалы PromoPult про Wordstat.

Бесплатный AI SEO анализ

Сделайте аудит сайта прямо сейчас

Спросите Сейку напрямую — конкретный ответ по вашему сайту обычно быстрее, чем читать всю серию.

Убедитесь, что вы согласны с нашими Условиями использования и Политикой обработки персональных данных.