llms.txt в Рунете — стоит ли уже сейчас

В русских SEO чатах ещё мало кто шипует llms.txt. Сейка покажет, почему стоит начать сейчас, даже если эффект пока неочевиден.

TL;DR

llms.txt — это markdown-карта сайта для краулеров LLM, дополняющая sitemap.xml: имя сайта, описание, разделы со ссылками и описаниями. Claude поддерживает формат официально, другие LLM — экспериментально, Яндекс публично не подтверждает, но эмпирически файл иногда помогает. Низкая стоимость внедрения плюс потенциальная отдача в будущем — стоит ставить сейчас; для крупных сайтов лучшая практика — автогенерация при сборке.

llms.txt — это файл, размещаемый в корне сайта по адресу /llms.txt, который содержит человекочитаемое описание основных разделов и страниц сайта в markdown-формате. Идея простая: дать краулерам LLM компактную «карту» сайта для более быстрого и точного понимания структуры, без необходимости полностью обходить все страницы.

Формат предложил Jeremy Howard в 2024 году, и за два года его внедрение в мире медленно растёт. К 2026 году статус такой: серьёзные сервисы LLM вроде Anthropic Claude официально поддерживают llms.txt; OpenAI и Perplexity — экспериментально; Яндекс публично не подтвердил поддержку, но эмпирически файл иногда помогает.

Сейка ставит llms.txt в собственных проектах, и сейчас разберу, почему это разумно, как делать, и где подводные камни.

Как выглядит llms.txt

Базовая структура очень простая. Это markdown-документ с заголовками и списками ссылок.

# Название сайта

> Краткое описание (1–2 предложения).

## Основной раздел

- [Название страницы](https://example.ru/url1): краткое описание.
- [Название страницы 2](https://example.ru/url2): краткое описание.

## Другой раздел

- [Название](https://example.ru/url3): краткое описание.

Это всё. Markdown с заголовками и списками. Никакого специфичного синтаксиса, никаких XML-схем.

Сам сайт seyka.ru шипует свой /llms.txt, который генерируется автоматически на основе опубликованного контента гида. Можете открыть его как образец — заодно увидите, как Сейка структурирует свой контент для LLM.

Зачем это нужно

Для краулеров LLM llms.txt даёт несколько преимуществ перед обычным sitemap.xml.

Компактная карта сайта в формате, удобном для модели. Sitemap.xml — это XML, который технически валиден, но не оптимизирован для извлечения смыслов. llms.txt — это markdown, который LLM «читают» как человек.

Человекочитаемые описания. В sitemap.xml нет описаний разделов, только URL и даты модификации. В llms.txt вы пишете «- Шаг 1. Что такое SEO: объяснение основ SEO для новичков», и модель понимает не только URL, но и о чём он.

Иерархия в markdown — заголовки H1, H2, списки. Это удобно для парсинга моделью, потому что markdown — это один из основных форматов, на которых LLM обучались.

Теоретически (потому что точные алгоритмы LLM закрыты) llms.txt помогает: быстрее находить ключевые страницы вашего сайта, лучше понимать структуру и категоризацию, точнее распознавать, какие страницы какого типа.

В практическом плане в 2026 году поддержка llms.txt выглядит так. Anthropic публикует собственный llms.txt и продвигает формат. OpenAI и ChatGPT — экспериментально, без явного подтверждения. Perplexity — частично использует. Яндекс Нейро — публично не подтверждает поддержку. Google AI Overviews — нет публичных данных.

То есть это не «обязательно сейчас даёт эффект» — а скорее «стоит дёшево, может дать эффект завтра».

Что класть в llms.txt

Минимум — это название проекта, описание в одно-два предложения, основные разделы со ссылками и краткими описаниями каждой.

# Название проекта

> Описание в одном-двух предложениях.

## Основные разделы

- [Страница 1](url): описание.
- [Страница 2](url): описание.

## Глоссарий или термины

- [Термин 1](url): краткое определение.

Расширенный вариант — можно добавить раздел с метаданными проекта:

## О проекте

- Аудитория: SEO-специалисты, работающие с русским рынком.
- Язык: русский.
- Обновление: ежемесячно.
- Контакт: seyka@alternex.ru.

И раздел с короткими FAQ, особенно полезный для понимания моделью «что вообще за проект»:

## Часто задаваемые вопросы

- **Что такое seyka.ru?** SEO-гид для Рунета.
- **Кто автор?** Сейка, SEO-консультант по русскому рынку.

Как генерировать

Для маленького сайта (до 20-30 страниц) llms.txt можно вести вручную: один раз создали, поддерживаете при изменениях. Не самый удобный способ, но рабочий.

Для большого сайта обязательно нужна автогенерация. Способы зависят от вашего стека.

Через CMS — большинство современных CMS либо имеют плагины для генерации llms.txt (WordPress, например), либо позволяют написать кастомный скрипт через хуки.

При сборке статичного сайта — если у вас Astro, Next.js, Hugo, Eleventy или другой статический генератор, llms.txt можно генерировать в момент сборки из вашей контентной базы. На seyka.ru именно так — при bun run build собирается актуальный llms.txt из всех опубликованных статей гида.

Через cron — отдельный скрипт, который раз в день или раз в неделю обходит сайт и обновляет файл. Менее элегантно, но рабочее решение для проектов на legacy-стеках.

Размер файла — без жёстких ограничений, но имеет смысл держать в разумных пределах: 50-500 строк для среднего сайта, 500-2000 для большого. Слишком огромный файл (несколько мегабайт) модель может не обработать целиком, и часть полезности теряется.

Что не делать

Не дублируйте sitemap.xml. llms.txt — не sitemap, не нужно загонять туда все 50 тысяч URL интернет-магазина. Только ключевые разделы и/или флагман-страницы, на которые вы хотите особо обратить внимание LLM.

Не кладите туда то, чего нет на сайте. «Раздел про X» с ссылкой на несуществующую страницу — это анти-сигнал, который снижает доверие LLM к вашему файлу.

Не игнорируйте обновления. Если сайт меняется, а llms.txt не обновляется, файл устаревает и со временем становится бесполезным или даже вредным. Лучше автогенерация, чем «настроил один раз и забыл».

Осторожно

Если у вас на сайте уже есть llms.txt 2024 года с устаревшими ссылками и описаниями — лучше его снять или обновить. Устаревший файл хуже отсутствующего, потому что LLM может опираться на него и предлагать ваши страницы, которые на самом деле уже не существуют.

Связь с robots.txt

Важно понимать, что llms.txt не заменяет robots.txt — это разные файлы для разных целей. robots.txt говорит ботам, какие URL обходить, какие нет; это инструкция доступа. llms.txt говорит LLM, какие у сайта основные разделы и что в них; это карта структуры.

Можно и нужно использовать оба одновременно. Они работают параллельно, никак не пересекаясь.

Семейные форматы

В 2025-2026 годах появляются и другие форматы для краулеров LLM, и о них полезно знать.

llms-full.txt — расширенная версия llms.txt с полным текстом ключевых страниц. Идея в том, чтобы LLM могла получить весь контент без дополнительных запросов к серверу. Поддержка пока ограниченная.

ai.txt — альтернативное предложение от другой команды. Не получило массового распространения; Сейка не использую.

AI metadata в <head> — экспериментальные мета-теги для разметки страницы как «AI-friendly». Тоже не стандартизировано.

Сейка пока стоит на llms.txt как наиболее распространённом и поддерживаемом стандарте. Если другой формат «выиграет» в индустрии — будем переходить.

Стоит ли тратить время

Стоит, если ваш сайт средний или большой, контент хорошего качества и регулярно обновляется, вы хотите попадать в AI-search на горизонте одного-двух лет, и есть техническая возможность автогенерации файла.

Можно отложить, если у вас совсем маленький сайт (меньше 20 страниц), сайт без какой-либо AI стратегии в целом, и нет ресурса даже на разовую настройку. В этих случаях усилия лучше потратить на другое.

Короче говоря

Llms.txt — это markdown-карта сайта для краулеров LLM, дополняющая sitemap.xml. Принимается Claude официально, экспериментально — другими LLM. Яндекс Нейро публично не подтвердил поддержку, но эмпирически файл иногда помогает. Низкая стоимость внедрения плюс потенциальная отдача в будущем — стоит ставить сейчас. Минимум: имя сайта, описание, разделы с ссылками и описаниями. Автогенерация при сборке — лучшая практика для крупных сайтов. Не дублируйте sitemap.xml, поддерживайте актуальность.

Дальше — про другую AI экосистему в Рунете. GigaChat и Сбер Поиск.

Источники

официальная спецификация llms.txt (Jeremy Howard, 2024), руководство Anthropic про llms.txt, публикации на Habr про адаптацию формата в Рунете, моя практика на seyka.ru и нескольких клиентских проектах.

Частые вопросы

Что такое llms.txt?

llms.txt — это файл в корне сайта по адресу /llms.txt, который содержит человекочитаемое описание основных разделов и страниц сайта в markdown-формате. Идея в том, чтобы дать краулерам LLM компактную «карту» сайта для быстрого и точного понимания структуры без полного обхода всех страниц.

Поддерживает ли Яндекс llms.txt?

Яндекс публично не подтвердил поддержку llms.txt, но эмпирически файл иногда помогает. Anthropic Claude поддерживает формат официально, OpenAI и Perplexity — экспериментально.

Чем llms.txt отличается от sitemap.xml?

Sitemap.xml — это XML без описаний разделов, только URL и даты модификации, не оптимизированный для извлечения смыслов. llms.txt — это markdown с человекочитаемыми описаниями и иерархией заголовков, который LLM «читают» как человек. llms.txt не заменяет sitemap.xml — они дополняют друг друга.

Как генерировать llms.txt?

Для маленького сайта (до 20-30 страниц) файл можно вести вручную. Для большого нужна автогенерация: через плагины или хуки CMS, при сборке статичного сайта из контентной базы, либо через cron-скрипт. На seyka.ru llms.txt собирается при сборке из всех опубликованных статей гида.

Стоит ли ставить llms.txt сейчас?

Стоит, если сайт средний или большой, контент хорошего качества и регулярно обновляется, есть цель попадать в AI-search на горизонте одного-двух лет и техническая возможность автогенерации. Можно отложить для совсем маленького сайта (меньше 20 страниц) или при отсутствии AI-стратегии и ресурсов.

llms.txt в Рунете — стоит ли уже сейчас

Как выглядит llms.txt

Зачем это нужно

Что класть в llms.txt

Как генерировать

Что не делать

Связь с robots.txt

Семейные форматы

Стоит ли тратить время

Короче говоря

Частые вопросы

Термины из вики

Сделайте аудит сайта прямо сейчас

Как выглядит llms.txt

Зачем это нужно

Что класть в llms.txt

Как генерировать

Что не делать

Связь с robots.txt

Семейные форматы

Стоит ли тратить время

Короче говоря

Частые вопросы

См. также

Термины из вики

Сделайте аудит сайта прямо сейчас