• Павел Чертов

Синтаксис Sitemap.xml


Иногда при продвижении сайта возникает проблема с тем, что не все страницы сайта обходятся роботом поиска. Для решения этой проблемы (и для того, чтобы такой проблемы не возникало) используются файлы карт сайта.

Ссылка на них указывается в robots.txt в формате: Sitemap: https://example.com/sitemap.xml

Они все используют формат xml. Если вы знакомы с html, то можете считать, что это просто html, в котором могут быть любые теги. Если нет - не обязательно до конца понимать XML, чтобы понимать, как работают файлы карт сайта.

Такие файлы имеют 2 разных формата. Начнем с обычного файла карты сайта.

Обычные файлы карт сайта

Любой файл xml начинается с объявления того, что этот файл xml, и указания кодировки:

<?xml version="1.0" encoding="utf-8"?>

Эта строчка никогда не меняется.

После этого мы пишем <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Между <urlset … > и </urlset> будут идти все наши страницы.

Описание каждой страницы выглядит так:

<url> <loc>https://www.example.com/</loc> <lastmod>2017-11-19</lastmod> <changefreq>daily</changefreq> <priority>0.7</priority> </url>

Что в них входит

Между каждыми <url> и </url> находятся свойства, принадлежащие одной и той же странице.

  • Loc - единственное обязательное свойство - это адрес страницы, тот url, по которому она доступна

  • Lastmod - дата последнего изменения страницы - когда на ней последний раз что-то изменялось

  • Changefreq - как часто меняется страница - каждый день, каждый месяц итд., как часто имеет смысл проверять, изменялось что-то или нет

  • Priority - насколько важно просканировать эту страницу - это число от нуля (неважно) до 1 (очень важно). Если это поле не заполнено, приоритет равен 0.5.

Самое простое описание без дополнительных свойств выглядит так <url> <loc>https://www.example.com/</loc> </url>

А весь файл выглядит примерно так:

<?xml version="1.0" encoding="utf-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://www.example.com/</loc> ... </url>

<url> <loc>https://www.example.com/страница1</loc> ... </url> ... <url> <loc>https://www.example.com/последняя_страница</loc> ... </url> </urlset>

Каждый файл может содержать описания для не более чем 10 000 страниц. Если страниц больше, то необходимо либо указать несколько директив sitemap в robots.txt (обычно так не делают), либо указать в robots.txt ссылку на файл со списком карт сайта.

Индексные файлы карт сайта

Также как и обычные файлы карт сайта, файлы со списком карт сайта начинаются с объявления того, что это файл xml, и указания его кодировки:

<?xml version="1.0" encoding="utf-8"?>

Вместо urlset мы пишем <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Вместо url будет

<sitemap> <loc>http://example.com/карта_сайта.xml</loc> <lastmod>2017-11-19</lastmod> <changefreq>daily</changefreq> </sitemap>

  • Loc - адрес, по которому доступна карта сайта (обязательное поле)

  • Lastmod - когда последний раз изменялся (генерировался) файл

  • Changefreq - как часто меняется

Итоговый файл будет иметь вид <?xml version="1.0" encoding="utf-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://example.com/первая_карта_сайта.xml</loc> <lastmod>2017-11-19</lastmod> <changefreq>daily</changefreq> </sitemap> …. <sitemap> <loc>http://example.com/последняя_карта_сайта.xml</loc> <lastmod>2017-11-19</lastmod> <changefreq>daily</changefreq> </sitemap>

</sitemapindex>

#SEO #sitemap #HowTo

© 2019 Рекламная студия X-Project
Онлайн-маркетинг и реклама в интернете

Москва, Бережковская наб.

д. 16 к. 2

+7 495 783 86 20

  • Facebook Social Icon
  • in_sta_main
  • Vkontakte Social Иконка