Синтаксис Sitemap.xml

September 20, 2018

Please reload

Недавние посты

Как писать объявления для контекстной рекламы - основы основ

June 4, 2018

1/1
Please reload

Избранные посты

Синтаксис Sitemap.xml

 

 

 

 

Иногда при продвижении сайта возникает проблема с тем, что не все страницы сайта обходятся роботом поиска. Для решения этой проблемы (и для того, чтобы такой проблемы не возникало) используются файлы карт сайта.

 

 

 

Ссылка на них указывается в robots.txt в формате:
Sitemap: https://example.com/sitemap.xml


Они все используют формат xml. Если вы знакомы с html, то можете считать, что это просто html, в котором могут быть любые теги. Если нет - не обязательно до конца понимать XML, чтобы понимать, как работают файлы карт сайта.

 

Такие файлы имеют 2 разных формата. Начнем с обычного файла карты сайта.

 

Обычные файлы карт сайта

 

Любой файл xml начинается с объявления того, что этот файл xml, и указания кодировки:

<?xml version="1.0" encoding="utf-8"?>

Эта строчка никогда не меняется.

 

После этого мы пишем
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

 

Между
<urlset … > и </urlset> будут идти все наши страницы.

 

Описание каждой страницы выглядит так:

<url>
  <loc>https://www.example.com/</loc>
  <lastmod>2017-11-19</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.7</priority>
</url>

 

Что в них входит


Между каждыми <url> и </url> находятся свойства, принадлежащие одной и той же странице.

  • Loc - единственное обязательное свойство - это адрес страницы, тот url, по которому она доступна

  • Lastmod - дата последнего изменения страницы - когда на ней последний раз что-то изменялось

  • Changefreq - как часто меняется страница - каждый день, каждый месяц итд., как часто имеет смысл проверять, изменялось что-то или нет

  • Priority - насколько важно просканировать эту страницу - это число от нуля (неважно) до 1 (очень важно). Если это поле не заполнено, приоритет равен 0.5.

 

Самое простое описание без дополнительных свойств выглядит так
<url>
  <loc>https://www.example.com/</loc>
</url>

 

А весь файл выглядит примерно так:

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
  <loc>https://www.example.com/</loc>
  ...
</url>

<url>
  <loc>https://www.example.com/страница1</loc>
  ...
</url>
...
<url>
  <loc>https://www.example.com/последняя_страница</loc>
  ...
</url>
</urlset>

 

Каждый файл может содержать описания для не более чем 10 000 страниц.
Если страниц больше, то необходимо либо указать несколько директив sitemap в robots.txt (обычно так не делают), либо указать в robots.txt ссылку на файл со списком карт сайта.

 

Индексные файлы карт сайта


Также как и обычные файлы карт сайта, файлы со списком карт сайта
начинаются с объявления того, что это файл xml, и указания его кодировки:

<?xml version="1.0" encoding="utf-8"?>

 

Вместо urlset мы пишем
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

 

Вместо url будет

<sitemap>
  <loc>http://example.com/карта_сайта.xml</loc>
  <lastmod>2017-11-19</lastmod>
  <changefreq>daily</changefreq>
</sitemap>

  • Loc - адрес, по которому доступна карта сайта (обязательное поле)

  • Lastmod - когда последний раз изменялся (генерировался) файл

  • Changefreq - как часто меняется

Итоговый файл будет иметь вид
<?xml version="1.0" encoding="utf-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://example.com/первая_карта_сайта.xml</loc>
    <lastmod>2017-11-19</lastmod>
    <changefreq>daily</changefreq>
  </sitemap>
….
  <sitemap>
    <loc>http://example.com/последняя_карта_сайта.xml</loc>
    <lastmod>2017-11-19</lastmod>
    <changefreq>daily</changefreq>
  </sitemap>

</sitemapindex>

 

 

Share on Facebook
Share on Twitter
Please reload

Мы в соцсетях
Please reload

Поиск по тегам