Индексация сайта — процесс сканирования страниц вашего сайта с последующим добавлением сайта в поисковую выдачу поисковой машины. Поэтому стоит подумать о том, как ускорить индексацию сайта и как проверять индексацию сайта.
Что такое поисковая машина и как проходит процесс индексации я рассказывал в предыдущей статье: “Регистрация сайта в поисковых системах”. Даже если вы считаете себя опытным в этом деле я советую вам зайти по ссылке и просмотреть картинку процесса индексации, она отложится у вас в голове.
Как проверить индексацию сайта.
После добавления сайта в поисковые системы вам будет интересно, добавлена ли та или иная страница в поисковую выдачу. Поэтому, сейчас, я покажу как нужно проверять отдельную страницу, на примере своей страницы, к примеру вот этой: “Для чего нужен блог”.
Сразу сообщу, что данная страница была написана давно и к ней были использованы правила ускорения индексации, о которых я написал ниже. Проиндексированные страницы можно проверить двумя методами через поиск поисковой системы или через инструменты вебмастеров поисковых систем.
Про сервис инструментов для вебмастеров писать не буду (т.к. все ясно заходим на сервис инструмент вебмастеров от Google и Яндекса, добавляем сайт и смотрим какие страницы проиндексированы), а сейчас давайте разберемся, как проверять индексацию страниц с помощью поиска. Для разбора беру две самые авторитетные поисковые машины: Google и Яндекс.
Проверка индексации страницы в яндексе через поиск.
Для того, чтобы проверить индексацию отдельной страницы (в нашем случае страница: “Для чего нужен блог, ссылку на страницу я разместил выше”) в поиске яндекса, необходимо пройти в расширенный поиск яндекса.
В строку: “Я ищу” вписываем слова характеризующие нашу искомую страницу, в моем случае я вбиваю заголовок статьи.
В строку: “На сайте” вписываем адрес сайта на котором размещена страница. Для более понятного объяснения я приготовил для вас картинку:
Жмем кнопку: “Найти”. Нас перебрасывает в поиск Яндекса и мы видим вот такую страницу:
Как видим искомая страница появилась на первой строчке в поиске. Сверяем URL страницы искомой страницы и показанный URL в поиске и видим что искомая страница появилась в поиске Яндекса, а значит проиндексирована. Вот так проверяется индексация страницы в поиске Яндекса.
[warning]Следует понимать, что искомая страница может не показаться на первой строчке, но можно сказать с уверенностью, при индексации она будет находиться на первой странице. Поэтому стоит просмотреть все топ 10 страниц по этому запросу.[/warning]
Проверка индексации страницы в Google через поиск.
Как в случае с яндексом, индексация страницы проверяется в Google точно так же. Но вместо расширенного поиска используется код: site:site.ru. Вместо site.ru нужно поставить адрес сайта на котором расположена страница. И как всегда объяснение в картинке:
Проверка количества проиндексированных страниц через панель webmaster Яндекса и Google.
Вам интересно общее количество проиндексированных страниц в ПС Яндекс и Google? Такие данные можно получить через панель инструментов для вебмастеров. У каждой поисковой системы имеется своя панель инструментов для вебмастера. Для наглядности я рассмотрю все те же Яндекс и Google.
Панель инструментов Яндекс — нужно иметь аккаунт чтобы зайти в панель, далее добавить в панель ваш сайт и посмотреть общее количество проиндексированных страниц. Вот картинка на которой видно число страниц в поисковой выдачи Яндекса — 78.
Панель инструментов Google — также необходимо иметь аккаунт чтобы зайти в панель, добавить сайт и перейдя на вкладку: “Состояние / статус индексирования” посмотреть количество проиндексированных страниц. На картинке мы видим число — 328.
Почему количество проиндексированных страниц для Google и Яндекса разное?
Давайте посчитаем общее количество уникальных страниц на сайте 45 записей + около 20 рубрик (лень считать) + несколько отдельных страниц. Итого получается около 70 уникальных страниц. Яндекс примерно посчитал верно, но Google нашел в 4 раза больше.
Все дело в дублях страниц, которые генерирует движок wordpress (как создать блог на wordpress пошагово). Дубли страниц поисковым системам не нравятся. Получается что на каждую страницу генерируется еще 3 страницы движком wordpress. О дублях страниц и удалении дублей страниц я писал давно, но информация все еще является полной.
Для яндекса у меня описан robots.txt который запрещает яндексу индексировать дубли страниц. Для google я тоже описал robots.txt(описание правильного robots.txt), но как я понимаю он его игнорирует и при этом ест все страницы, как трактор, о чем свидетельствует скриншот индексации:
Проверка общего числа проиндексированных страниц с помощью сервиса pr-cy.
Pr-cy.ru — сервис показывающий вебмастерам различные данные по сайтам, в том числе интересующие нас количество проиндексированных страниц в Яндекс и Google,
Для проверки вписываем адрес сайта и смотрим ниже две колонки Яндекс проиндексированные и Google проиндексированные. Вот картинка:
Как видите по счет Яндекса сервис определил верно 78 страниц а по Google немного ошибся, но и этих данных мне достаточно.
5 правил ускорения индексации сайта.
Как вам уже понятно из заголовка я придерживаюсь пяти правилам ускорения индексации сайта. Начну в порядке важности, самое важное будет первым:
- Регулярное написание статей. Существует такое понятие как прикормка поискового робота (паука). Для того чтобы поселить поискового паука на сайте необходимо регулярно выкладывать материалы. При постоянном обновлении сайта паук будет заходить постоянно, ну и наоборот. Как правильно писать статьи.
- Анонсирование в социальные сети. У моего блога например внизу есть кнопки социальных сетей, через которые можно анонсировать статью, также кнопка retweet (устанавливаем кнопку retweet на wordpress) находящаяся справа от заголовка. После написания статьи сами анонсируйте в соц. сети, таким образом поисковый робот зайдет через соц. сети (вот вам список социальных сетей для продвижения).
- Внутренняя перелинковка сайта. Для блога на wordpress достаточно иметь вот эти плагины: wordpress related posts и simple tags перелинковка. Внутренняя перелинковка поможет вам и в продвижении сайта. Роботу на много легче найти страницу по ссылке с вашего сайта и собственно он не найдет страницу, на которую ни одна ссылка не ведет.
- Карта сайта блога. Говоря карта сайта я имею ввиду две карты: xml и карта для человека. XML карта добавляется в панель вебмастера и робот пройдет по ней (важный фактов), также добавляется в robots.txt. Карта для человека — это карта вот такого вида — карта сайта, по ней робот найдет все страницы сайта (блога в моем случае).
- Пинг сервисы. Я считаю этот пункт наименее важным, но все же полезным. Пинг сервисы — отправляет сигнал поисковым системам, что ваш блог обновился. У меня стоят около 80 пинг сервисов. Вбейте в google запрос “пинг сервисы” и скопируйте пинг сервисы к себе в wordpress. Путь => Административная панель => Настроки => Написание => и вставляем список сервисов в поле, показанное на картинке ниже:
Запрет индексации страниц.
Запрет индексации сайта я уже разбирал в данной статье — правильный robots.txt и удаляем дубли своими руками. Для чего нужно запретить индексацию, ведь как я уже говорил чем больше страниц будет в индексе, тем более будет шанс получить посетителя на сайт.
Дело в том, что поисковые системы не любят дубли страниц и находя дубль (по сути мы заставляем поискового робота два раза зайти на одно и тоже, а это затрата ресурса) могут понизить сайт в выдаче. Также покупая ссылки на страницу для продвижения страницы, дубль страницы может заменить вашу продвигаемую страницу в индексе, деньги на ветер.
На этом все, я вам рассказал все что нужно знать по темам: индексация сайта, как проверить сайт, как ускорить индексацию сайта, как запретить индексацию страниц.
Для меня очень нужная информация, спасибо.