Реклама на сайте


[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Правильный robots.txt для uCoz и быстрая индексация сайта
VasyaДата: Суббота, 01.01.2011, 13:05 | Сообщение # 1
Сообщений: 87
Репутация: 654
Правильный robots.txt для uCoz и быстрая индексация сайта

Всем здравствуйте!
В этой статье я расскажу как правильно заточить документ robots.txt под поисковые системы и как быстро попасть в индекс поисковых систем.
Ну начнем:
1. Создание robots.txt под uCoz

Рассмотрим основные теги этого документа:
Disallow: это дистрибутив запрещающий индексацию страницы или каталога.
Allow: это дистрибутив разрешающий индексацию страницы или каталога.
Таким образом мы можем запретить индексацию любого каталога,но разрешить индексацию некоторых страниц тогоже каталога.
Возьмем для примера модуль Каталог файлов
Каталог модуля расположен поадресу /load/
Если поставить:

Code
Disallow: /load/

То каталог файлов у нас индексироватся не будет,но если нам нужны 2-3 странички этого каталога из всех (к примеру всего 10)
То в robots.txt пишем следущие строки:
Code
Allow: /load/адрес страницы

Внимание: строки с разрешением индексации страницы должны быть выше чем строка с запрещением индекса каталога.
Пример:
Code
Allow: /load/адрес страницы     
Allow: /load/адрес страницы     
Allow: /load/адрес страницы     
Disallow: /load/

Таким образом у нас будет индексироватся только те страницы которые указаны под тегом Allow
Теперь разберемся с тегом User-agent
это тег открывающий информацию о боте для которого будут доступны настройки всего того что ниже.
Тег User-agent ставится в самом верху и после него указывается имя бота для проверки
например:
Code
User-agent: uBot

Но если вы хотите указать для каждого бота поисковой системы,либо каталога сайтов и т.п. один и тот же дистрибутив, то ставим следущий тег:
Code
User-agent: *

И ниже перечисляем запреты и открытия разных страниц и каталогов.
Итак основная работа сделана и уже можно использовать этот документ для всех ботов, но если вы хотите лучшей индексации сайта и лучшего отоброжения его поисковым системам, лучше вписать еще такие строки:
Code
Sitemap:http://www.имя.домен/sitemap.xml     
Sitemap:http://www.имя.домен/sitemap-forum.xml

Это адресация на стандартные карты сайта системы uCoz, если у вас есть свой карта сайта, впишите свою.
Далее тоже не маловажно указать основной домен сайта.
(Если у вас стандартный домен от uCoz то вам ничего делать ненадо)
Если же вы прикрепили какой то домен к сайту, к примеру возьмем net.ru
Он будет отображаться поисковикам как зеркальный домен и будет хуже индексироватся чем основной.
Поэтому многие ошибочно говорят что net.ru и другие подобные домены хуже индексируются чем стандартные от uCoz.
Для того что бы поисковый бот определил прикрепленный домен как основной нам надо прописать в robots.txt такую строчку:
Host: www.имя-сайта.домен
Пример:
Code
Host: www.web-mir.net.ru

Также есть еще много всего,но это особо ненужно и уже по этой инструкции можно составить отличный robots.txt для поисковиков.
Пример готового robots.txt для uCoz:
Code
User-agent: *     
Disallow: /a/     
Disallow: /stat/     
Disallow: /index/1     
Disallow: /index/2     
Disallow: /index/3     
Disallow: /index/5     
Disallow: /index/7     
Disallow: /index/8     
Disallow: /index/9     
Disallow: /panel/     
Disallow: /admin/     
Disallow: /secure/     
Disallow: /informer/     
Disallow: /mchat     
Disallow: /search     

Host: www.web-mir.net.ru     
Sitemap:http://www.web-mir.net.ru/sitemap.xml     
Sitemap:http://www.web-mir.net.ru/sitemap-forum.xml

Ну вот вроде и всё что я хотел вам рассказать о Robots.txt


 
  • Страница 1 из 1
  • 1
Поиск: