Техническое здоровье

sitemap.xml: карта сайта, по которой ходят поисковики

sitemap.xml — это карта сайта в стандартном формате. Список всех страниц, который вы передаёте Яндексу и Google, чтобы они не искали новые материалы наугад. Без карты новая страница попадает в выдачу через неделю-месяц, с картой — за часы.

Что такое sitemap.xml и зачем он

sitemap.xml — это XML-файл со списком всех важных URL вашего сайта. Поисковик читает его и узнаёт две вещи: какие у вас есть страницы и когда каждая из них последний раз обновлялась. На основании этого он решает, что переиндексировать сейчас, а что — потом.

Без sitemap робот находит новые страницы только по внутренним и внешним ссылкам. Это работает, но медленно: новая статья в блог может пролежать неделю-другую, пока на неё не пойдёт первый поисковый трафик. С sitemap робот узнаёт о публикации в течение нескольких часов.

Кроме скорости, sitemap решает вторую важную задачу: показать поисковику страницы, на которые нет внутренних ссылок. Например, лендинги под рекламу, архивные материалы, фильтры каталога. Без карты они могут вообще не попасть в индекс.

Что внутри файла

Структура простая. Внутри корневого тега <urlset> идут блоки <url>, по одному на каждую страницу. Внутри блока — обязательный <loc> с полным URL и опциональные теги <lastmod> (дата последнего изменения), <changefreq> (как часто меняется: daily, weekly, monthly), <priority> (важность от 0.1 до 1.0).

Самый важный из опциональных — <lastmod>. Поисковики используют его, чтобы понять, нужно ли заходить на страницу заново. Если <lastmod> не менялся месяц — робот скорее всего пропустит этот URL и проверит другие.

Теги <changefreq> и <priority> по факту почти не учитываются — Google официально объявил, что игнорирует их. Но <lastmod> — критичный сигнал, и от него зависят и индексация, и Сытость вашего сайта в Сайтболите.

Как поисковики используют sitemap

Яндекс.Вебмастер: добавляете сайт → раздел «Индексирование → Файлы Sitemap» → вставляете URL карты. Через 1-3 дня видно, сколько URL найдено, сколько проиндексировано, какие отброшены и почему.

Google Search Console: добавляете сайт → «Sitemaps» → URL карты. Аналогично, через сутки появляется статистика.

Ссылку на sitemap желательно также прописать в robots.txt строкой «Sitemap: https://site.ru/sitemap.xml». Это самый надёжный способ — её прочитают и Яндекс, и Google, и любые AI-краулеры, и Bing.

Типовые проблемы и лимиты

Лимит одного файла: 50 000 URL и 50 МБ в распакованном виде. Если у вас крупный магазин с тысячами товаров — нужно делать sitemap index: один корневой файл, который ссылается на несколько подчинённых (sitemap-products.xml, sitemap-blog.xml и т. д.).

Главная проблема: устаревшие URL. Если в sitemap лежат страницы, которые отдают 404 или 301-редирект — поисковик начинает доверять файлу меньше. После любой массовой смены URL обязательно регенерировать карту.

Вторая проблема: нет <lastmod>. У многих Tilda-сайтов и старых конструкторов карта генерируется без даты обновления. Сайтболит в этом случае не может посчитать долю свежих страниц для показателя «Сытость» — компонент Б пропускается.

Третья: sitemap не отдаётся по HTTPS. Если основной сайт на https, а sitemap отдаётся с http://site.ru/sitemap.xml — Яндекс может его игнорировать. Должны совпадать и протокол, и домен.

Связь с Сытостью в Сайтболите

Сытость — один из шести показателей здоровья. 40 баллов из 100 в ней даёт компонент «свежесть страниц по sitemap.lastmod»: какая доля URL обновлена за последние 30 дней.

Это значит: даже если вы регулярно осматриваете сайт и добавляете страницы, но <lastmod> в карте не обновляется — Сытость не растёт. Поисковики тоже это видят: для них сайт «висит без движения», даже если на самом деле вы что-то меняете.

Правильно настроенный sitemap — то, что должно меняться при каждой правке любой страницы. Yoast SEO и RankMath в WordPress делают это автоматически. В Битриксе — модуль sitemap из коробки. В Tilda нужно нажимать «Опубликовать» — тогда дата перепишется.

Как сделать sitemap и не сломать

WordPress: поставьте Yoast SEO или RankMath — sitemap создастся автоматически по адресу /sitemap_index.xml. Никаких ручных манипуляций не нужно.

1С-Битрикс: «Маркетинг → Поисковая оптимизация → Настройка sitemap.xml» — мастер настройки, который генерирует карту и обновляет её по расписанию.

Tilda и другие конструкторы: карта генерируется автоматически по адресу site.ru/sitemap.xml. Главное — следить, чтобы в неё попадали все нужные страницы (в Tilda иногда забывают добавить страницы в публикацию).

Самописный сайт: попросите разработчика сделать генератор. На Python/PHP это 50 строк кода, и через час у вас будет рабочая карта.

Бесплатный осмотр сайта

Без карты сайта новая страница попадает в Яндекс через 2 недели — а конкурент уже забрал клиента

Sitemap — это разница между «опубликовал статью утром, к вечеру есть первые посетители» и «опубликовал, забыл, через месяц вспомнил, что Яндекс её до сих пор не нашёл». Особенно важно для блогов, магазинов и сайтов с регулярными новостями.

  • Проверка sitemap при каждом осмотре: формат, лимиты, lastmod, битые ссылки
  • Свежесть URL по lastmod входит в показатель «Сытость» — видно, реально ли сайт живёт
  • Готовые инструкции для WordPress, Битрикс и Tilda — что нажать, чтобы починить

Узнайте, видит ли Яндекс все ваши страницы

Без регистрации · без карты · результат за 60 секунд. Регистрация даст +100 пилюль и доступ к 14 параметрам 152-ФЗ со штрафами.