В большинстве случаев веб-сайт/блог/сателлит начинают “готовить к индексации” уже после того, как он размещен в Интернете. Не советую этого делать, т. к. может привести к серьезным проблемам. О подготовке к индексации лучше позаботиться с начала создания сайта. Дизайн и навигация Дизайн желательно делать уникальным. Шаблонами в исходном виде пользоваться крайне не рекомендую. Использование фреймов – это лишний запрос для поискового робота, который может из-за выборки страницы с фреймом отложить индексирование какой-либо другой или вообще отложить индексацию. Роботами индексируется только текст, а вот графика остается невостребованной. Поэтому не стоит делать целые страницы, состоящих только из изображений.
Это также относится и к flash, на котором сейчас создаются сайты полностью. Хоть флеш и индексируется, но достаточно плохо. При проектировании ссылочной инфраструктуры веб-ресурса следует помнить о том, что лучшие для индексации страницы – статические, т. е обычные HTML-страницы. Сейчас же большинство веб-сайтов строится на PHP движках, где страницы обычно динамические.
Поисковики достаточно проблематично индексируют такие страницы. Поэтому для создания статических страниц рекомендуется использовать модуль mod_rewrite веб-сервера Apache. Например, с помощью него можно преобразовать ссылку вида index. php? about в адрес about. html Для передвижения по сайту робот ПС анализируют ссылки и поэтому навигация при помощи формы или Java-скрипта будет проигнорирована. Если дизайн все же требует подобного, то можно просто продублировать их с помощью обычных ссылок. Многие поисковые роботы планируют следующее посещения вашего сайта в зависимости от того, насколько много информации несут его страницы как часто они изменяются. В связи с этим крайне не рекомендую страницы типа “under construction”, “страница в разработке” и т. д., особенно на длительный срок. Мета-теги Прописываются в разделе Важные мета-теги для индексирования:
Robots Содержит указания для роботов поисковых машин, собирающих информацию о HTML документах в сети. Значение свойства Robots может состоять из следующих директив, разделенных запятыми:Index – эта страница должна быть индексирована. Noindex – эта страница не должна индексироваться. Follow – прослеживать гиперссылки на странице. Nofollow – не прослеживать гиперссылки на странице. All – = index, follow (принято по умолчанию). None – = noindex, nofollow.
Пример: Document-state Предназначен для управления индексацией поисковых роботов. Может иметь два значения:
Static – Нет необходимости индексировать эту страницу в будущем. Dynamic – Индексировать эту страницу регулярно (по умолчанию).
Пример: Revisit Указывает поисковому роботу, через сколько дней ему нужно вернуться и переиндексировать данный документ. Пример: Content-Type Отвечает за указание типа документа и кодировки символов. Пример:
Контент Самый важный аспект в индексации сайта. Поисковики ценят уникальность. Информация, уже размещенная в Интернете их не интересуют. Не нужно писать слова вразрядку, расставлять вручную переносы и т. д. Нежелательно размещать на одной странице слишком много или слишком мало текста. Рекомендуемое количество 2000-8000 знаков в тексте на одной странице. Рекомендуется использовать семантическую разметку Иногда возникает ситуация, что нужно запретить к индексации определенный участок текста. В это случае нужно использовать тег. Этот тег придуман Яндексом и принят Рамблером, а вот Google на него не реагирует. Карта сайта Это обычно одна страница сайта, на которой содержатся ссылки на все остальные страницы данного ресурса. Для поисковых систем создается специальный XML-файл, содержащий информацию о страницах сайта, которые подлежат индексации. Файл robots. txt Поисковые роботы при заходе на веб-сайт обращаются в первую очередь к файлу robots. txt, в котором содержатся инструкции к индексации. Домен и хостинг Безусловно стоит использовать платный хостинг. Большинство популярных бесплатных хостингов занесены под фильтр из-за огромного количества дорвеев. Индексация может проходить проблематично. По той же причине, Яндекс предвзято относится к бесплатным доменам 3-го уровня. net. ru, .org. ru, .pp. ru При ориентации на Рунет стоит использовать домен. ru или. su, при использовании на буржунет – .com, .net, .org и другие. Конечно, подготовка сайта к индексации не ограничивается приведенными выше рекомендациями, но, надеюсь, они помогут избежать многих ошибок. Постовой: Из блог CodeIsArt. ru узнал как размножить статьи при помощи AllSubmitter Надоело вкалывать? Отдохни, пока есть горячие туры в Доминикану! Понравилась заметка? Подписывайся на RSS Оставлено 9 комментариев: