|
|
Карта сайта, или Sitemap.
Довольно часто владельцы сайтов сталкиваются с необходимостью создания карты сайта - так называемым файлом Sitemap.
Что такое карта сайта?
Это файл, предназначенный для более оперативной обработки информации о сайте поисковыми сканерами. Sitemap располагается в корневом каталоге и содержит адреса страниц сайта, находящихся в том же каталоге или его подкаталогах, принадлежащих тому же домену и использующих тот же протокол, что и сам файл. Подразумевается, что указанные в файле страницы разрешены к индексации. Также в файле Sitemap содержатся метаданные, позволяющие поисковым системам получить наиболее полную информацию о сайте, среди которых даты и частота изменений, уровни приоритетности, типы содержания, а также сведения о содержимом: категории, лицензии и т.д.
Обязательно ли нужно создавать карту сайта?
Карта сайта будет очень полезна, если сайт новый и мало проиндексирован, содержит страницы с неиндексируемым контентом, страницы сайта плохо или совсем не связаны друг с другом, часто генерируются, сайт имеет очень глубокие уровни страниц, до которых поисковые роботы просто не доходят.
Как создаётся карта сайта?
Файл Sitemap создаётся в формате XML и кодировке UTF-8. При создании файла необходимо учитывать лимит на количество URL-адресов, которых в одном файле не должно быть больше, чем 50000. Размер самого файла не должен превышать 10 Мб. Проблема лимитирования решается созданием нескольких файлов Sitemap, перечисленных в индексном файле карты сайта.
Если сайт небольшой, то вполне можно сделать файл Sitemap вручную.
В случае же большого количества страниц проще позволить решить этот вопрос специальным скриптам в автоматизированном режиме. Большинство современных систем управления сайтом снабжены плагинами, позволяющими создать Sitemap в считанные секунды.
После создания и размещения файла Sitemap необходимо указать поисковым системам на его существование. Наиболее просто это делается это при помощи файла robots.txt, в котором приводится полный адрес нахождения карты сайта.
Теги, наиболее часто использующиеся в файле Sitemap:
Urlset – этим тегом, в котором устанавливаются стандарты протокола, должен открываться и закрываться любой Sitemap.
Url – родительский тег, также присутствующий в любом файле Sitemap.
Loc – дочерний обязательный тег, в котором указывается адрес страницы. Начинаться он должен обязательно с указания протокола и не превышать 2,048 символа.
Lastmod – дата последнего изменения. Прописывается в формате ГГГГ-ММ-ДД.
Changefreq – частота обновления контента. Значения могут быть: always (каждый раз, при загрузке страницы), hourly (ежечасно), daily (ежедневно), weekly (еженедельно), monthly (ежемесячно), yearly (ежегодно), never (никогда).
Priority – приоритет, то есть указание важности страниц в соответствии с мнением владельца сайта. Указывается в диапазоне от 0.0 до 1.0. Чем больше значение, тем выше важность. Более высокий приоритет следует присваивать страницам с часто обновляющимся контентом.
|
|
|
|
|
|
|