Schema для LLM: разметка под извлечение AI ответов

Микроразметка для LLM — это не «модный новый тип» schema.org. Это правильное использование того, что уже есть, под цели извлечения AI.

TL;DR

Микроразметка облегчает LLM извлечение фактов и повышает шанс цитирования. Топ-5 типов для GEO в Яндексе: FAQPage (самый эффективный), HowTo, Article с автором и датой, DefinedTerm и Organization с sameAs. Только в JSON-LD, только для того, что реально есть на странице, и обязательно через валидатор.

В технической статье про Schema.org для Яндекса Сейка разобрала базовые типы микроразметки и их применение в обычной поисковой выдаче. Здесь — взгляд под другим углом: какие типы и как использовать конкретно для того, чтобы поисковики LLM (Яндекс Нейро, ChatGPT с поиском, Perplexity) лучше извлекали и цитировали ваш контент.

Почему микроразметка важна для LLM

Когда языковая модель обрабатывает страницу для генерации ответа, она по сути делает две вещи. Сначала парсит HTML и разбирает структуру: заголовки, абзацы, списки, таблицы, акценты. Это техническая работа. Потом извлекает «факты» из этой структуры — пары «термин → определение», «вопрос → ответ», «параметр → значение», «автор → утверждение». Это уже семантическая работа.

Микроразметка облегчает оба шага. Явные сигналы schema.org «это вопрос», «это ответ», «это автор», «это организация», «это шаг инструкции» уменьшают неоднозначность при извлечении. Модель не должна догадываться по структуре HTML, что у вас на странице вопрос-ответ — она видит это в JSON-LD.

В то же время LLM умеют работать со страницами без микроразметки — просто хуже и менее предсказуемо. Микроразметка — это «помощь модели», а не «необходимое условие» цитирования. Но при прочих равных размеченная страница цитируется чаще.

Топ-5 типов микроразметки для LLM

FAQPage

Самый эффективный тип для извлечения. Пары «вопрос — ответ» — это формат, который LLM «понимают» нативно. Структурно это близко к тому, как они сами формируют ответы.

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "Что такое Яндекс Нейро?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Яндекс Нейро — это AI-надстройка над Поиском, запущенная в мае 2024 года. Она генерирует развёрнутый ответ на запрос, опираясь на источники из органической выдачи."
      }
    }
  ]
}

Что важно для FAQPage. Вопросы формулируйте точно так, как их задают пользователи — не «Что собой представляет ИКС?», а «Что такое ИКС?». Ответы — короткие (одно-три предложения), фактические, без воды. Минимум три пары вопрос-ответ в блоке.

HowTo

Для пошаговых инструкций. LLM часто берёт шаги напрямую в ответ на «как сделать X».

{
  "@type": "HowTo",
  "name": "Как настроить региональную привязку в Вебмастере",
  "step": [
    {"@type": "HowToStep", "name": "Зайти в Вебмастер"},
    {"@type": "HowToStep", "name": "Раздел Региональность"},
    {"@type": "HowToStep", "name": "Выбрать регион из справочника"}
  ]
}

Хорошо работает для tutorial-контента: «как настроить X», «как починить Y», «как приготовить Z». Конкретные шаги, понятные действия, без лирики.

Article с author и dateModified

{
  "@type": "Article",
  "headline": "Как стать источником цитат для Яндекс Нейро",
  "author": {"@type": "Person", "name": "Сейка"},
  "datePublished": "2026-05-01",
  "dateModified": "2026-05-22",
  "publisher": {"@type": "Organization", "name": "Сейка AI"}
}

LLM используют каждое из этих полей. Автора — для оценки экспертизы и доверия к источнику. Дату обновления — для оценки свежести (важно для тематик, где актуальность критична). Headline — как «название источника» при цитировании в ответе.

DefinedTerm (для глоссариев)

{
  "@type": "DefinedTerm",
  "name": "ИКС",
  "description": "Индекс качества сайта Яндекса, заменивший тИЦ в 2018 году.",
  "inDefinedTermSet": {
    "@type": "DefinedTermSet",
    "name": "Глоссарий SEO для Яндекса"
  }
}

LLM любят DefinedTerm — это явная пара «термин → определение», которая извлекается без потерь. Идеально для глоссариев и справочных страниц с определениями.

Organization с sameAs

{
  "@type": "Organization",
  "name": "Сейка AI",
  "url": "https://seyka.ru",
  "logo": "https://static.seyka.ru/images/seyka-avatar.webp",
  "sameAs": [
    "https://t.me/seyka",
    "https://vc.ru/u/seyka",
    "https://habr.com/users/seyka"
  ]
}

sameAs — критично для бренда. LLM связывают ваш сайт с упоминаниями вашей же организации в соцсетях и других местах через эту разметку. Это влияет на «знакомость» бренда для модели и на вероятность того, что вас процитируют как авторитетный источник.

Дополнительные типы

Кроме топ-5 есть несколько типов, которые работают в специфических нишах.

Product + Offer + AggregateRating — для интернет-магазинов. LLM используют их для запросов «лучший X», «обзор Y», «сравнение Z». Но Нейро редко появляется на коммерческих запросах, так что вклад скромнее.

Recipe — для рецептов. Хорошо извлекается в Нейро на запросы «как приготовить X».

Course — для образовательных продуктов. Яндекс слабо обрабатывает этот тип, но англоязычные LLM (особенно ChatGPT) — нормально, и для билингвальных проектов это полезно.

Event — для мероприятий. Используется в ответах на «когда X», «где Y».

LocalBusiness — для локальных бизнесов. В сочетании со Справочником формирует «полный портрет» организации для региональных запросов.

Технические аспекты

Несколько технических деталей, которые влияют на то, насколько хорошо ваша разметка работает.

JSON-LD vs Microdata. Для LLM однозначно предпочтителен JSON-LD: отдельный блок в <head> или перед </body> парсится надёжнее, чем атрибуты, разбросанные по разным HTML-тегам. Microdata — устаревший формат, который Сейка не рекомендует для новых проектов.

Где размещать. JSON-LD блок должен быть в <head> или непосредственно перед закрывающим </body>. Не в середине документа — некоторые парсеры могут пропустить разметку из произвольного места.

Размер блока. Один большой JSON-LD блок предпочтительнее, чем много маленьких разрозненных. Группируйте связанные данные — например, Article + Organization + Breadcrumbs в один блок.

Валидация — обязательно. Всегда прогоняйте размётку через Schema.org Validator (validator.schema.org) и Яндекс Validator (yandex.ru/dev/json/test/). Невалидная разметка LLM просто игнорируют, и вся работа впустую.

Сейка подсказывает

Сейка предлагает простой ритуал: после публикации страницы прогоните её через оба валидатора. Если оба зелёные — отлично. Если хотя бы один красный — переделывайте до зелёных. Не оставляйте «почти валидную» разметку, она работает непредсказуемо.

Что Нейро на самом деле использует

Эмпирически, из наблюдения за источниками Нейро по разным нишам.

FAQPage — Нейро регулярно цитирует фрагменты из FAQ-блоков. Самый высокий «коэффициент попадания» эмпирически именно у страниц с хорошим FAQ-блоком в FAQPage-разметке на информационных запросах.

HowTo — особенно хорошо работает для запросов «как X». Шаги из вашего HowTo иногда попадают в ответ Нейро почти дословно.

Article с автором и датой обновления — повышает «доверие» источника. На запросах в YMYL-нишах (медицина, финансы) этот тип критичен.

Organization с sameAs — влияет на упоминание бренда в ответе. На запросах с упоминанием вашего бренда это помогает.

Менее заметно влияют DefinedTerm и Product/Offer — первый из-за редкого использования, второй из-за того, что Нейро в коммерческих запросах редко появляется.

Почти не влияют Course, Event, JobPosting — для них Нейро вообще плохо приспособлен.

llms.txt параллельно

Дополнительный сигнал для краулеров LLM — файл /llms.txt в корне сайта. Это отдельный стандарт, который работает параллельно с микроразметкой. Подробнее про него — в статье llms.txt в Рунете.

Они дополняют друг друга. Schema.org даёт LLM «карту» внутри страницы — что и где на ней находится. llms.txt даёт LLM «карту» всего сайта — какие у вас разделы и какие там ключевые страницы. Оба нужны для зрелой GEO стратегии.

Что не делать

Несколько прямых указаний.

Не размечайте данные, которых нет на странице. Если в JSON-LD вы прописываете «AggregateRating: 4.8», но на самой странице нет блока с отзывами — это нарушение правил schema.org и риск понижения. Яндекс и LLM это распознают.

Не дублируйте разметку одного и того же типа. Один Article на страницу, один Organization на сайт, один FAQPage на страницу — достаточно. Несколько одинаковых блоков создают неоднозначность.

Не используйте устаревшие типы. Schema.org регулярно обновляется. Старые типы (например, отдельные hCard-форматы или нестандартные расширения) лучше заменить на актуальные эквиваленты.

Не игнорируйте валидацию. Невалидная разметка просто не работает — LLM её игнорирует, а Яндекс может ругаться в Вебмастере.

Короче говоря

Микроразметка облегчает LLM извлечение фактов и цитирование. Топ-5 типов для GEO в Яндексе: FAQPage (самый эффективный), HowTo, Article с автором и датой, DefinedTerm для глоссариев, Organization с sameAs. JSON-LD предпочтительнее Microdata. Валидация — обязательна перед публикацией. FAQPage — самый эффективный тип для попадания в источники Нейро. Микроразметка усиливает контент, но не заменяет его качество — пустая страница с богатой разметкой работать не будет.

Дальше — про конкретные паттерны цитирования в LLM. GEO citation patterns.

Источники

schema.org официальная документация, валидатор Яндекса, исследования на Habr про микроразметку для AI-search, моя практика на нескольких проектах.

Частые вопросы

Зачем нужна микроразметка для LLM?

Явные сигналы schema.org («это вопрос», «это ответ», «это автор») уменьшают неоднозначность при извлечении фактов. При прочих равных размеченная страница цитируется LLM чаще — но разметка это помощь модели, а не обязательное условие цитирования.

Какая микроразметка лучше всего работает для Нейро?

FAQPage — самый эффективный тип: пары «вопрос — ответ» LLM понимают нативно. Далее идут HowTo для инструкций, Article с автором и датой, DefinedTerm для глоссариев и Organization с sameAs.

JSON-LD или Microdata?

Для LLM однозначно JSON-LD — отдельный блок в `<head>` или перед `</body>` парсится надёжнее, чем атрибуты, разбросанные по HTML-тегам. Microdata — устаревший формат, не рекомендуется для новых проектов.

Нужно ли валидировать разметку?

Обязательно. Прогоняйте страницу через Schema.org Validator и Яндекс Validator перед публикацией — невалидную разметку LLM просто игнорируют, и вся работа впустую.

Можно ли размечать данные, которых нет на странице?

Нет. Если в JSON-LD есть «AggregateRating: 4.8», а на самой странице нет блока с отзывами — это нарушение правил schema.org и риск понижения. Размечайте только то, что видит пользователь.

Schema для LLM: разметка под извлечение AI ответов

Почему микроразметка важна для LLM

Топ-5 типов микроразметки для LLM

FAQPage

HowTo

Article с author и dateModified

DefinedTerm (для глоссариев)

Organization с sameAs

Дополнительные типы

Технические аспекты

Что Нейро на самом деле использует

llms.txt параллельно

Что не делать

Короче говоря

Частые вопросы

Термины из вики

Сделайте аудит сайта прямо сейчас

Почему микроразметка важна для LLM

Топ-5 типов микроразметки для LLM

FAQPage

HowTo

Article с author и dateModified

DefinedTerm (для глоссариев)

Organization с sameAs

Дополнительные типы

Технические аспекты

Что Нейро на самом деле использует

llms.txt параллельно

Что не делать

Короче говоря

Частые вопросы

См. также

Термины из вики

Сделайте аудит сайта прямо сейчас