Что такое sitemap.xml и зачем он
sitemap.xml — это XML-файл со списком всех важных URL вашего сайта. Поисковик читает его и узнаёт две вещи: какие у вас есть страницы и когда каждая из них последний раз обновлялась. На основании этого он решает, что переиндексировать сейчас, а что — потом.
Без sitemap робот находит новые страницы только по внутренним и внешним ссылкам. Это работает, но медленно: новая статья в блог может пролежать неделю-другую, пока на неё не пойдёт первый поисковый трафик. С sitemap робот узнаёт о публикации в течение нескольких часов.
Кроме скорости, sitemap решает вторую важную задачу: показать поисковику страницы, на которые нет внутренних ссылок. Например, лендинги под рекламу, архивные материалы, фильтры каталога. Без карты они могут вообще не попасть в индекс.
Что внутри файла
Структура простая. Внутри корневого тега <urlset> идут блоки <url>, по одному на каждую страницу. Внутри блока — обязательный <loc> с полным URL и опциональные теги <lastmod> (дата последнего изменения), <changefreq> (как часто меняется: daily, weekly, monthly), <priority> (важность от 0.1 до 1.0).
Самый важный из опциональных — <lastmod>. Поисковики используют его, чтобы понять, нужно ли заходить на страницу заново. Если <lastmod> не менялся месяц — робот скорее всего пропустит этот URL и проверит другие.
Теги <changefreq> и <priority> по факту почти не учитываются — Google официально объявил, что игнорирует их. Но <lastmod> — критичный сигнал, и от него зависят и индексация, и Сытость вашего сайта в Сайтболите.
Как поисковики используют sitemap
Яндекс.Вебмастер: добавляете сайт → раздел «Индексирование → Файлы Sitemap» → вставляете URL карты. Через 1-3 дня видно, сколько URL найдено, сколько проиндексировано, какие отброшены и почему.
Google Search Console: добавляете сайт → «Sitemaps» → URL карты. Аналогично, через сутки появляется статистика.
Ссылку на sitemap желательно также прописать в robots.txt строкой «Sitemap: https://site.ru/sitemap.xml». Это самый надёжный способ — её прочитают и Яндекс, и Google, и любые AI-краулеры, и Bing.
Типовые проблемы и лимиты
Лимит одного файла: 50 000 URL и 50 МБ в распакованном виде. Если у вас крупный магазин с тысячами товаров — нужно делать sitemap index: один корневой файл, который ссылается на несколько подчинённых (sitemap-products.xml, sitemap-blog.xml и т. д.).
Главная проблема: устаревшие URL. Если в sitemap лежат страницы, которые отдают 404 или 301-редирект — поисковик начинает доверять файлу меньше. После любой массовой смены URL обязательно регенерировать карту.
Вторая проблема: нет <lastmod>. У многих Tilda-сайтов и старых конструкторов карта генерируется без даты обновления. Сайтболит в этом случае не может посчитать долю свежих страниц для показателя «Сытость» — компонент Б пропускается.
Третья: sitemap не отдаётся по HTTPS. Если основной сайт на https, а sitemap отдаётся с http://site.ru/sitemap.xml — Яндекс может его игнорировать. Должны совпадать и протокол, и домен.
Связь с Сытостью в Сайтболите
Сытость — один из шести показателей здоровья. 40 баллов из 100 в ней даёт компонент «свежесть страниц по sitemap.lastmod»: какая доля URL обновлена за последние 30 дней.
Это значит: даже если вы регулярно осматриваете сайт и добавляете страницы, но <lastmod> в карте не обновляется — Сытость не растёт. Поисковики тоже это видят: для них сайт «висит без движения», даже если на самом деле вы что-то меняете.
Правильно настроенный sitemap — то, что должно меняться при каждой правке любой страницы. Yoast SEO и RankMath в WordPress делают это автоматически. В Битриксе — модуль sitemap из коробки. В Tilda нужно нажимать «Опубликовать» — тогда дата перепишется.
Как сделать sitemap и не сломать
WordPress: поставьте Yoast SEO или RankMath — sitemap создастся автоматически по адресу /sitemap_index.xml. Никаких ручных манипуляций не нужно.
1С-Битрикс: «Маркетинг → Поисковая оптимизация → Настройка sitemap.xml» — мастер настройки, который генерирует карту и обновляет её по расписанию.
Tilda и другие конструкторы: карта генерируется автоматически по адресу site.ru/sitemap.xml. Главное — следить, чтобы в неё попадали все нужные страницы (в Tilda иногда забывают добавить страницы в публикацию).
Самописный сайт: попросите разработчика сделать генератор. На Python/PHP это 50 строк кода, и через час у вас будет рабочая карта.