Сейчас по шагам — от пустой таблицы до структуры сайта. Без «скачайте Key Collector и поехали».
Семантическое ядро (часто сокращают до СЯ) — это основа любого SEO-проекта в Рунете. Если ядра нет, у вас не SEO, а серия удачных совпадений. Если ядро плохое — у вас SEO, которое стабильно не доезжает до результата, потому что бьёт мимо реальных запросов аудитории. Сейка разберёт, как собирать ядро правильно, особенно для Яндекса, где морфология и интент усложняют процесс по сравнению с английским SEO.
Что такое СЯ на самом деле
В голове новичка СЯ часто выглядит как «список ключевых слов в Excel». Это сильно упрощённое представление.
Полноценное семантическое ядро — это таблица из четырёх обязательных столбцов. Запрос — полная фраза в том виде, как её вводят пользователи. Кластер — группа запросов с одним интентом, объединённая под одну посадочную страницу. Посадочная — URL страницы вашего сайта, который должен ранжироваться по этому кластеру. Метрики — частотность общая и точная, региональная частотность, сезонность, конкурентность, приоритет внутри проекта.
Все четыре столбца обязательны. Файл с одним столбцом «запрос» — это не ядро, это сырой парсинг, с которым ещё предстоит работать.
Шаг 1: Сбор сырых запросов
Сначала собираете максимум потенциально релевантных запросов из всех доступных источников. Чем шире выборка на старте, тем больше материала для последующей очистки и кластеризации.
Основные источники следующие. Wordstat — главный источник базовой частотности и морфологических вариантов. Подсказки Яндекса (suggest, то что Яндекс предлагает дописать в строке поиска) — приходят с реального поведения пользователей и дают свежие, актуальные запросы. Конкуренты в Topvisor, Rush Analytics, Megaindex, SEMrush — что ранжируется у конкурентов в вашей нише, то и есть «работающая» семантика. Метрика собственного сайта в разделе «Источники → Поисковые запросы» — что уже приводит трафик, часто там обнаруживаются формулировки, которые вы сами бы не угадали. Search Console, если вы работаете и на Google тоже. Внутренние источники — запросы из чата поддержки клиентов, теги товаров, FAQ-страницы, фиды и каталоги. LLM (YandexGPT, GPT-4) для генерации синонимов и связанных тем — с обязательной верификацией каждого варианта через Wordstat.
Сколько запросов собирать — зависит от типа проекта. Для интернет-магазина — обычно от 10 до 100 тысяч. Для контентного сайта средней ниши — от 3 до 10 тысяч. Для лендинга — 200-1000. Не «сколько влезет», а «сколько реально может стать страницами плюс запасные».
Сейка не любит полу-автоматический сбор миллиона ключей через парсеры типа ScrapeBox. На выходе вы получите шум, который потом неделю чистить, и большая часть этого шума никогда не превратится в полезные страницы. Лучше начать с качественной выборки 5-10 тысяч от конкурентов и Wordstat, потом расширять по мере роста проекта.
Шаг 2: Частотность
Сам по себе список запросов бесполезен. Нужно знать, какой за каждым стоит реальный спрос. Этим занимается Wordstat.
В Wordstat есть несколько режимов измерения частотности. Базовая частотность — «купить пуховик» — это сколько раз в месяц вообще задавались запросы, содержащие эти два слова в любых формах и сочетаниях. Самая завышенная оценка, потому что включает «как купить пуховик», «где купить пуховик дешевле», «купить ребёнку пуховик» и так далее.
Точная фраза в кавычках — "купить пуховик" — только запросы с этими словами в любом порядке без других
слов. Уже ближе к конкретике.
Точная словоформа с восклицательным знаком — "!купить !пуховик" — точные словоформы в любом порядке.
Самая точная оценка по этим конкретным словам.
И самая жёсткая — восклицательный плюс порядок — [!купить !пуховик] — точная словоформа именно в этом
порядке. Это уже почти реальный объём показов конкретного запроса.
Для коммерческих запросов имеет смысл смотреть все три (базовую — для оценки рынка, точную — для конкретики). Для информационных часто достаточно базовой.
Региональная частотность
В Wordstat можно задавать регион (по умолчанию — Россия плюс СНГ). Для регионального бизнеса это критично: смотрите конкретный регион, потому что частотность отличается в 2-10 раз от усреднённой по России. Москва обычно даёт заметную долю общероссийской частотности — для коммерческих запросов это часто 25-40%, для других категорий меньше, и если вы работаете не в Москве, реальный объём вашего рынка нужно смотреть отдельно.
Сезонность
Wordstat показывает помесячную динамику за последние два года в разделе «История запросов». Для запросов с явной сезонностью (пуховики, кондиционеры, учебники, мангалы, ёлки) это критично. Иначе вы будете запускать SEO-кампанию в межсезонье, ждать чудес, удивляться отсутствию трафика, и винить в этом SEO-команду.
Шаг 3: Очистка
Сырая семантика, как бы аккуратно вы её ни собирали, всегда содержит шум. И этот шум нужно отфильтровать, прежде чем переходить к кластеризации.
Что обычно приходится чистить. Топонимы не вашего региона — «купить пуховик новосибирск», если вы работаете только на Москву. Чужие бренды — «найк пуховик», если вы не торгуете найком. Информационные запросы в коммерческом ядре или коммерческие в информационном — «что такое пуховик» — это не для интернет-магазина, это для блога. Слишком общие запросы — «пуховик» в одиночку — слишком конкурентен, почти всегда смешан по интенту, и под него отдельная страница не делается. Опечатки и формальные дубли — «пуховик женский» и «женский пуховик» в Wordstat одна строка, но при парсинге выдачи могут давать разные позиции.
Стандартный метод чистки — создаёте список стоп-слов (отрицательных ключей). Под каждый проект свой список: конкуренты, чужие регионы, информационные «как» / «что» / «почему» (если ядро коммерческое), частые опечатки, нерелевантные тематические термины. Этот список применяется к сырому ядру, и большая часть шума отсеивается автоматически.
Дальше — ручная итерация. Открываете отфильтрованный список, проходите по нему глазами, помечаете сомнительные строки. Полностью автоматически очистить ядро не получится — нужен человеческий контроль над тем, что входит в финальную выборку.
Шаг 4: Кластеризация
Самый важный этап работы с семантикой. Подробно разбирается в отдельной статье про кластеризацию; здесь — кратко.
Запросы группируются так, чтобы каждый кластер можно было закрыть одной посадочной страницей. Метод — через схожесть SERP: если по двум запросам топ-10 Яндекса пересекается на пять и больше результатов, эти запросы относятся к одному кластеру (это стандартный «жёсткий» порог в Рунете).
Инструменты, которые умеют это делать: Topvisor, Rush Analytics, Key Collector, Just-Magic. После автоматической кластеризации обязательна ручная проверка — обычно один-два дня работы на сложное большое ядро.
Распространённая ошибка новичков — пытаться засунуть в один кластер «всё похожее по словам». Простой пример: «купить пуховик» и «лучший пуховик 2026» кажутся близкими по лексике, но SERP под них разный — первый показывает магазины, второй обзоры. Это два разных кластера, две разных посадочных страницы. Их объединение даст «никакую» страницу, которая плохо ранжируется под оба запроса.
Шаг 5: Привязка к страницам и архитектура сайта
Когда кластеры готовы, нужно решить: какой страницей вашего сайта закрыть каждый кластер. И здесь начинается архитектура сайта — потому что часто оказывается, что нужной страницы у вас просто нет.
Логика привязки. Высокочастотные коммерческие запросы («пуховики женские») → страница категории верхнего уровня. Среднечастотные с фильтрами («пуховики женские зимние») → подкатегория или специальная страница фильтра, индексируемая. Низкочастотные с уточнениями («пуховики женские короткие с капюшоном») → страница фильтра или фасет с уникальным контентом. Информационные («как выбрать пуховик») → раздел блога, гид. Транзакционные с конкретикой («купить пуховик columbia 50 размер») → карточка товара.
Архитектура должна выводиться из семантического ядра, а не наоборот. Если из ядра следует, что нужна страница «пуховики для невысоких женщин до 160 см», а такой страницы у вас нет — это не аргумент в пользу того, чтобы пропустить эту часть ядра. Это аргумент в пользу создания страницы.
Часто это означает реструктуризацию существующего сайта — добавление новых категорий, расширение структуры фильтров, появление целых блоков контента. Это нормальная часть SEO-работы.
Шаг 6: Приоритезация
В большом ядре редко удаётся сразу запустить все страницы. Поэтому нужна приоритезация — по какому кластеру работать в первую очередь, какой может подождать.
Стандартная матрица приоритезации выглядит так.
| Кластер | Частотность | Конкурентность | Конверсия | Приоритет |
|---|---|---|---|---|
| Пуховики женские | 50 000 | Высокая | 2.5% | 1 |
| Пуховики женские короткие | 5 000 | Средняя | 3.0% | 2 |
| Пуховики для подростков | 2 000 | Низкая | 1.5% | 3 |
| Как стирать пуховик | 8 000 | Низкая | 0.1% | 4 (контент-маркетинг) |
Логика: высокая частотность плюс низкая конкурентность плюс высокая конверсия равно первая очередь. На таких страницах быстрее всего окупится SEO-усилие. Запросы с высокой конкурентностью или низкой конверсией — на второй-третий ход, после того как фундамент уже работает.
Шаг 7: Карта релевантности
Финальный артефакт работы с семантикой — это карта релевантности для каждой посадочной страницы. Она становится готовым техническим заданием для разработчика и контент-команды.
Что входит в карту для одной страницы. Кластер запросов (10-100 запросов, в зависимости от ниши). Главный запрос — самый частотный и интент-задающий, на который вы целитесь в title и H1. Группа дополнительных запросов — для проработки в H2, H3, в основном тексте. Минимальный объём контента — определяется по конкурентам через парсинг топ-10 SERP. Целевая позиция и план по трафику.
Это готовое ТЗ. С ним можно идти к копирайтеру, разработчику, заказывать дизайн посадочной — все знают, что делать.
Чем Yandex-семантика отличается от Google-семантики
Яндекс
- Морфология играет роль: словоформы дают разные позиции.
- Wordstat остаётся основным источником частот.
- Региональная частотность критична для геозависимых.
- YATI хорошо понимает синонимы — но не везде.
- Низкочастотный «длинный хвост» хорошо ранжируется.
- Морфология сводится BERT’ом к смыслу.
- Google Keyword Planner, Ahrefs, SEMrush как источники.
- Региональность по странам, внутри страны слабее.
- Лучше работает с английскими синонимами, чем с русскими.
- Длинный хвост работает, но конкуренция выше.
Ошибки, которые часто допускают
Собрать ядро один раз и забыть. Семантика меняется со временем: появляются новые продукты, меняются тренды, появляются новые формулировки запросов. Ядро нужно пересматривать раз в шесть-двенадцать месяцев, иначе оно устаревает и перестаёт работать.
Игнорировать сезонность. Запускать SEO-кампанию в межсезонье и удивляться, почему трафика нет, — это типичный сценарий. Сезонность видна в Wordstat, и её нужно закладывать в план работы.
Засунуть в один кластер слишком много запросов с разными интентами. Получится «никакая» страница, которая не побеждает ни по одному из суб-интентов.
Не учитывать конкурентность. Залезть в нишу, где сидят аэрофлоты и сберы, с маленьким сайтом и без большого бюджета, и ждать топ-3 за полгода — это нереалистично.
Кластеризовать только по словам, без анализа SERP. Получите формально красивое, фактически не работающее ядро. Кластеризация без SERP не определяет реальный интент.
Короче говоря
Семантическое ядро — основа SEO в Рунете, без него работа превращается в случайность. Полноценное ядро = запрос плюс кластер плюс посадочная плюс метрики (четыре столбца минимум). Wordstat — главный источник частот в Яндексе; подсказки, конкуренты, Метрика — дополнения. Кластеризация через SERP — единственный надёжный метод; «по словам» не работает. Архитектура сайта должна выводиться из ядра, а если не сходится — пересматривайте архитектуру, а не ядро. Приоритезируйте по матрице частотность × конкурентность × конверсия. Раз в шесть-двенадцать месяцев — пересмотр и обновление ядра.
Дальше — про поисковый интент и кластеризацию запросов.
документация Topvisor и Rush Analytics, статьи Девака и Шакина про сбор семантики, классические материалы PromoPult про Wordstat.