В русских SEO-чатах ещё мало кто шипует llms.txt. Сейка покажет, почему стоит начать сейчас, даже если эффект пока неочевиден.
llms.txt — это файл, размещаемый в корне сайта по адресу
/llms.txt, который содержит человекочитаемое описание основных разделов и страниц сайта в markdown-формате.
Идея простая: дать LLM-краулерам компактную «карту» сайта для более быстрого и точного понимания структуры,
без необходимости полностью обходить все страницы.
Формат предложил Jeremy Howard в 2024 году, и за два года его внедрение в мире медленно растёт. К 2026 году статус такой: серьёзные LLM-сервисы вроде Anthropic Claude официально поддерживают llms.txt; OpenAI и Perplexity — экспериментально; Яндекс публично не подтвердил поддержку, но эмпирически файл иногда помогает.
Сейка ставит llms.txt в собственных проектах, и сейчас разберу, почему это разумно, как делать, и где подводные камни.
Как выглядит llms.txt
Базовая структура очень простая. Это markdown-документ с заголовками и списками ссылок.
# Название сайта
> Краткое описание (1–2 предложения).
## Основной раздел
- [Название страницы](https://example.ru/url1): краткое описание.
- [Название страницы 2](https://example.ru/url2): краткое описание.
## Другой раздел
- [Название](https://example.ru/url3): краткое описание.
Это всё. Markdown с заголовками и списками. Никакого специфичного синтаксиса, никаких XML-схем.
Сам сайт seyka.ru шипует свой /llms.txt, который генерируется автоматически на основе опубликованного
контента гида. Можете открыть его как образец — заодно увидите, как Сейка структурирует свой контент для
LLM.
Зачем это нужно
Для LLM-краулеров llms.txt даёт несколько преимуществ перед обычным sitemap.xml.
Компактная карта сайта в формате, удобном для модели. Sitemap.xml — это XML, который технически валиден, но не оптимизирован для извлечения смыслов. llms.txt — это markdown, который LLM «читают» как человек.
Человекочитаемые описания. В sitemap.xml нет описаний разделов, только URL и даты модификации. В llms.txt вы пишете «- Шаг 1. Что такое SEO: объяснение основ SEO для новичков», и модель понимает не только URL, но и о чём он.
Иерархия в markdown — заголовки H1, H2, списки. Это удобно для парсинга моделью, потому что markdown — это один из основных форматов, на которых LLM обучались.
Теоретически (потому что точные алгоритмы LLM закрыты) llms.txt помогает: быстрее находить ключевые страницы вашего сайта, лучше понимать структуру и категоризацию, точнее распознавать, какие страницы какого типа.
В практическом плане в 2026 году поддержка llms.txt выглядит так. Anthropic публикует собственный llms.txt и продвигает формат. OpenAI и ChatGPT — экспериментально, без явного подтверждения. Perplexity — частично использует. Яндекс Нейро — публично не подтверждает поддержку. Google AI Overviews — нет публичных данных.
То есть это не «обязательно сейчас даёт эффект» — а скорее «стоит дёшево, может дать эффект завтра».
Что класть в llms.txt
Минимум — это название проекта, описание в одно-два предложения, основные разделы со ссылками и краткими описаниями каждой.
# Название проекта
> Описание в одном-двух предложениях.
## Основные разделы
- [Страница 1](url): описание.
- [Страница 2](url): описание.
## Глоссарий или термины
- [Термин 1](url): краткое определение.
Расширенный вариант — можно добавить раздел с метаданными проекта:
## О проекте
- Аудитория: SEO-специалисты, работающие с русским рынком.
- Язык: русский.
- Обновление: ежемесячно.
- Контакт: seyka@alternex.ru.
И раздел с короткими FAQ, особенно полезный для понимания моделью «что вообще за проект»:
## Часто задаваемые вопросы
- **Что такое seyka.ru?** SEO-гид для Рунета.
- **Кто автор?** Сейка, SEO-консультант по русскому рынку.
Как генерировать
Для маленького сайта (до 20-30 страниц) llms.txt можно вести вручную: один раз создали, поддерживаете при изменениях. Не самый удобный способ, но рабочий.
Для большого сайта обязательно нужна автогенерация. Способы зависят от вашего стека.
Через CMS — большинство современных CMS либо имеют плагины для генерации llms.txt (WordPress, например), либо позволяют написать кастомный скрипт через хуки.
При сборке статичного сайта — если у вас Astro, Next.js, Hugo, Eleventy или другой статический генератор,
llms.txt можно генерировать в момент сборки из вашей контентной базы. На seyka.ru именно так — при bun run build собирается актуальный llms.txt из всех опубликованных статей гида.
Через cron — отдельный скрипт, который раз в день или раз в неделю обходит сайт и обновляет файл. Менее элегантно, но рабочее решение для проектов на legacy-стеках.
Размер файла — без жёстких ограничений, но имеет смысл держать в разумных пределах: 50-500 строк для среднего сайта, 500-2000 для большого. Слишком огромный файл (несколько мегабайт) модель может не обработать целиком, и часть полезности теряется.
Что не делать
Не дублируйте sitemap.xml. llms.txt — не sitemap, не нужно загонять туда все 50 тысяч URL интернет-магазина. Только ключевые разделы и/или флагман-страницы, на которые вы хотите особо обратить внимание LLM.
Не кладите туда то, чего нет на сайте. «Раздел про X» с ссылкой на несуществующую страницу — это анти-сигнал, который снижает доверие LLM к вашему файлу.
Не игнорируйте обновления. Если сайт меняется, а llms.txt не обновляется, файл устаревает и со временем становится бесполезным или даже вредным. Лучше автогенерация, чем «настроил один раз и забыл».
Если у вас на сайте уже есть llms.txt 2024 года с устаревшими ссылками и описаниями — лучше его снять или обновить. Устаревший файл хуже отсутствующего, потому что LLM может опираться на него и предлагать ваши страницы, которые на самом деле уже не существуют.
Связь с robots.txt
Важно понимать, что llms.txt не заменяет robots.txt — это разные файлы для разных целей. robots.txt говорит ботам, какие URL обходить, какие нет; это инструкция доступа. llms.txt говорит LLM, какие у сайта основные разделы и что в них; это карта структуры.
Можно и нужно использовать оба одновременно. Они работают параллельно, никак не пересекаясь.
Семейные форматы
В 2025-2026 годах появляются и другие форматы для LLM-краулеров, и о них полезно знать.
llms-full.txt — расширенная версия llms.txt с полным текстом ключевых страниц. Идея в том, чтобы LLM могла получить весь контент без дополнительных запросов к серверу. Поддержка пока ограниченная.
ai.txt — альтернативное предложение от другой команды. Не получило массового распространения; Сейка не использую.
AI metadata в <head> — экспериментальные мета-теги для разметки страницы как «AI-friendly». Тоже не
стандартизировано.
Сейка пока стоит на llms.txt как наиболее распространённом и поддерживаемом стандарте. Если другой формат «выиграет» в индустрии — будем переходить.
Стоит ли тратить время
Стоит, если ваш сайт средний или большой, контент хорошего качества и регулярно обновляется, вы хотите попадать в AI-search на горизонте одного-двух лет, и есть техническая возможность автогенерации файла.
Можно отложить, если у вас совсем маленький сайт (меньше 20 страниц), сайт без какой-либо AI-стратегии в целом, и нет ресурса даже на разовую настройку. В этих случаях усилия лучше потратить на другое.
Короче говоря
Llms.txt — это markdown-карта сайта для LLM-краулеров, дополняющая sitemap.xml. Принимается Claude официально, экспериментально — другими LLM. Яндекс Нейро публично не подтвердил поддержку, но эмпирически файл иногда помогает. Низкая стоимость внедрения плюс потенциальная отдача в будущем — стоит ставить сейчас. Минимум: имя сайта, описание, разделы с ссылками и описаниями. Автогенерация при сборке — лучшая практика для крупных сайтов. Не дублируйте sitemap.xml, поддерживайте актуальность.
Дальше — про другую AI-экосистему в Рунете. GigaChat и Сбер Поиск.
официальная спецификация llms.txt (Jeremy Howard, 2024), руководство Anthropic про llms.txt, публикации на Habr про адаптацию формата в Рунете, моя практика на seyka.ru и нескольких клиентских проектах.