Карта сайта в формате XML (sitemap.xml) — файл в формате XML, в котором перечислены все основные страницы сайта. Файл sitemap.xml необходим для указания поисковым системам всех главных страниц сайта, которые необходимо проиндексировать.
Различают два вида:
- Статическая — создается самостоятельно либо в ручном режиме, либо при помощи дополнительных сервисов.
- Динамическая — внедряется в рамках CMS и позволяет автоматически обновлять карту сайта.
Для чего нужна XML-карта сайта
Правильно сформированная XML-карта позволяет:
- формировать актуальный список страниц сайта;
- облегчать поиск новых страниц и их индексацию;
- указывать частоту и приоритетность индексации;
- отслеживать дату изменений.
Синтаксис формирования карты сайта в формате XML
Карта сайта должна начинается строками:
<?xml version=«1.0″ encoding=«UTF-8″?>
<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9″>
Дальше идет перечисления страниц сайта по схеме:
<url>
<loc>https://site.com.ua</loc>
<lastmod>2020-01-10T18:00:15+00:00</lastmod>
<priority>1.00</priority>
<changefreq>daily</changefreq>
</url>
Закачивается карта сайта тегом, который указывает о завершении списка страниц сайта
</urlset>
Где:
Тэг | Описание тега |
<url> | Тг, указывающий на начало блока страницы и ее описания, является обязательным атрибутом карты сайта |
<loc> | Тег, указывающий адрес страницы, является обязательным атрибутом карты сайта |
<lastmod> | Тег, указывающий дату последнего изменения страницы, является желательным атрибутом карты сайта |
<priority> | Тег, указывающий приоритет страницы, диапазон от 1.00 до 0.1, 1.00 — самый высокий приоритет, 0.1 — самый низкий приоритет. |
<changefreq> | Тег, указывающий частоту обновления страницы, возможные значения:
always — всегда hourly — ежечасно daily — ежедневно weekly — еженедельно monthly — ежемесячно yearly — раз в год never — никогда |
Все основные поисковые системы имеют функционал добавления адреса файла sitemap.xml, который необходимо указать поисковой системе. В поисковой системе Google файл карты сайта в формате XML добавляется в настройках в Google Webmaster Tools, а другие поисковые системы имеют инструменты аналогичные высшее указанным.
После формирования карты нужно добавить следующий код в файл robots.txt:
User-Agent: *
Sitemap: https://site.com.ua/sitemap.xml
Общие правила составления XML-карты сайта
- Основной файл карты сайта должен иметь имя sitemap, разрешение xml, располагаться в корне сайта по адресу https://site.com.ua/sitemap.xml и быть доступным с интернета.
- При использовании сторонних модулей для формирования, карта сайта может генерироваться по другому адресу, в таком случае нужно настроить, 301 серверный редирект с https://site.com.ua/sitemap.xml на нужный URL.
- В начале документа sitemap.xml следует сначала размещать ссылки на страницы категорий, после них на страницы товаров.
- В sitemap.xml не должны включатся страницы, которые закрыты в robots.txt или на которых размещен мета тег <meta name=”robots” content=”noindex, follow” />
- Файл Sitemap не должен содержать более чем 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. В случаях, когда размер файла Sitemap превышает допустимый, выделяют несколько вариантов решения:
- разбить его на несколько частей, например, sitemap1.xml и sitemap2.xml
- файл sitemap.xml может быть заархивирован и иметь формат sitemap.xml.gz с целью уменьшения трафика на сайте.
Пример файла sitemap.xml
<?xml version=«1.0″ encoding=«UTF-8″?>
<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9″>
<url> <loc>https://site.com.ua</loc>
<lastmod>2020-01-10T08:12:32+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority> </url>
<url> <loc>https://site.com.ua/other/standart-banners-sizes.html </loc>
<lastmod>2020-01-10T08:12:32+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
<url> <loc>https://site.com.ua/htmlcss/dataurl.html </loc>
<lastmod>2020-01-10T11:19:49+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
<url> <loc>https://site.com.ua/htmlcss/internet-shop-gallery.html </loc>
<lastmod>2020-01-10T14:38:43+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
</urlset>
Пример файла содержащего перечисление под-карт
Если сайт имеет сложную структуру и много разделов, для удобства анализа, допускается разбиение карты сайта на под-карты, каждая из которых содержит перечисления страниц подраздела.
<?xml version=«1.0» encoding=«UTF-8»?>
<sitemapindex xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9»>
<sitemap> <loc>https://site.com.ua/sitemaps/sections.1935.xml.gz </loc>
<lastmod>2020-01-10</lastmod> </sitemap>
<sitemap> <loc>https://site.com.ua/sitemaps/gallery.2258.xml.gz </loc>
<lastmod>2020-01-13</lastmod> </sitemap>
<sitemap> <loc>https://site.com.ua/sitemaps/gallery.2259.xml.gz </loc>
<lastmod>2020-01-19</lastmod> </sitemap>
</sitemapindex>
XML sitemap для изображений
Для добавления картинок в карту сайта следует использовать дополнительные теги, для указания подробной информации об изображении, где используются следующие теги:
Тэг | Описание тега |
<image:image> | Тег, указывающий информацию об одной картинке, является обязательным атрибутом. Можно использовать до 1000 тегов <image:image> в рамках одного тега <loc> |
<image:loc> | Тег, указывающий адрес изображения, является обязательным атрибутом |
<image:title> | Тег, указывающий название |
<image:caption> | Тег, указывающий описание |
<image:geo_location> | Тег, указывающий геолокацию |
<image:license> | Тег, указывающий лицензию |
Пример карты сайта для изображений:
<?xml version=»1.0″ encoding=»UTF-8″?>
<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9»
xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>https://site.com.ua</loc>
<image:image>
<image:loc>https://site.com.ua/photo1.jpg </image:loc>
</image:image>
<image:image>
<image:loc>https://site.com.ua/photo2.jpg </image:loc>
</image:image>
</url>
</urlset>
XML-карта для Google Новостей
При формировании используются следующие обязательные теги
Тэг | Описание тэга |
<publication> | Тэг, указывающий на издательство публикации. Должен содержать два обязательных тега <name> — название издательства, и <language> — язык издания согласно формата ISO 639. |
<publication_date> | Тэг, указывающий дату и время публикации статьи на сайте согласно формата W3C |
<title> | Тэг, указывающий название статьи |
Пример карты сайта для новостей:
<?xml version=»1.0″ encoding=»UTF-8″?>
<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9»
xmlns:news=»http://www.google.com/schemas/sitemap-news/0.9″>
<url>
<loc>https://site.com.ua/news </loc>
<news:news>
<news:publication>
<news:name>Название издательства</news:name>
<news:language>ru</news:language>
</news:publication>
<news:publication_date>2020-01-10</news:publication_date>
<news:title>Название статьи</news:title>
</news:news>
</url>
</urlset>
Карта сайта для видео
Если сайт содержит большое количество видео-материалов, следует создавать отдельную карту сайта в формате XML для видео. Подробнее о том, как создать карту сайта для видео-материалов читайте в справочном центре Google.
Файл карты сайта в формате XML можно формировать вручную используя программы и сервисы которые формируют файл карты сайта, просканировав страницы сайта, или формировать автоматически используя программную реализацию которая автоматически обновляет карту сайта при добавлении, или изменении страниц сайта.
В случае изменения, файла карты сайта его следует пинговать для поисковой системы Google, то есть уведомлять поисковую систему о обновлении файла с целью ускорения индексации новых страниц.
Ссылка для пингования карты сайта для Google:
http://www.google.com/ping?sitemap=https://site.com.ua/sitemap.xml
Где https://site.com.ua/sitemap.xml адрес карты сайта
Сервис генерации карты сайта
Для небольших проектов, где новый контент добавляется редко, более рационально единоразово самому сгенерить карту сайта и не тратить ресурсы на реализацию автогенерируемой карты.
Для этого можно использовать XML-Sitemaps — cервис позволяющий сформировать карту сайта на основе структуры сайта с заданием параметров приоритета страниц, частоты обновления.
Среди других сервисов, можно выделить:
Или использовать функционал таких программ как
Готовые модули генерации карты сайта для распространенных движков
Для дополнительных возможностей и генерации большого объема страниц лучше использовать готовые модули. Ниже приведен список для популярных платформ:
Google XML Sitemaps — модуль автоматической генерации карты сайта и ее пингования для движка WordPress.
Sitemap Generator — модуль генерации карты сайта для движка Joomla.
GoogleSitemap0.9 — модуль генерации для движка ModX.
Simple Google Sitemap — модуль генерации для движка OpenCart.