SEO продвижение > Внутренняя оптимизация сайта > Поиск дублей в Google Webmaster

Как найти дубли страниц на сайте

Одна из значимых проблем, с которой может столкнуться начинающий web-мастер, - это дубли страниц на сайте, воспринимаемые поисковыми системами как спам и попытки увеличить число страниц при помощи повторяющегося контента.

Найти и убрать дубли страниц особенно сложно в связи с тем, что подавляющая их часть появляется на сайте из-за недостатков CMS, а не из-за попытки владельца web-ресурса использовать обмануть поискового робота. Другими словами, web-мастер может быть абсолютно не в курсе того, что на его сайте имеются дубли страниц, так как он просто установил движок «из коробки» и начал наполнять его контентом.

Дубли на сайте – это отрывки статей, слово в слово повторяющиеся на различных страницах web-ресурса. Наиболее часто их можно встретить в служебных разделах сайта, которые включают страницы поиска, календари, архивы, разделы и ряд других.

Кроме того, некоторые движки изначально содержат баг, который позволяет отдавать одно и тоже содержимое по разным адресам. Например, главная страница сайта может быть доступна при переходе по URL:
site.ru
site.ru/index.html
site.ru/index.php
site.com/index.html#comments

А каталог товаров будет доступен по адресам:
site.ru/cat=12&product=15
site.ru/product=15&cat=12

Как убрать дубли страниц на сайте

Самый простой способ убрать дубли страниц – это предупредить их возникновение еще на первоначальном этапе создания сайта. Если вы перепробовали множество CMS, но все равно не смогли настроить ни одну из них, сделайте свой первый сайт на HTML или PHP файлах. В этом случае вы гарантированно избежите возникновения дублей.

Однако если вы непредусмотрительно создали свой сайт на CMS, генерирующей множество дублей страниц, избавляться от них придется на уже действующем сайте.

Первоначально осуществим поиск дублей страниц при помощи инструмента Google Webmaster. Перейдите в раздел меню «Вид в поиске» – «Оптимизация» – «Оптимизация HTML». Если напротив пункта «Повторяющиеся заголовки» находится нуль, значит, поисковые роботы не обращаются по различным адресам к одинаковому содержимому на вашем сайте. Дубли страниц отсутствуют.

Дубли в Google Webmaster

Теперь необходимо проверить дубли страниц вручную, так как некоторые отрывки статей (чаще всего речь идет об анонсах) могут быть разбросаны по всему сайту, тогда как TITLE страниц будут совершенно разными.
Чтобы убрать дубли страниц, вам необходимо проверить следующее:

После того, как вы проведете аудит сайта, изучите свою CMS и настройте ее таким образом, чтобы не только убрать дубли страниц, но и предотвратить их появление.

  1. Замените встроенный поиск CMS на Google search или поисковик Яндекса или закройте его результаты в robots.txt.
  2. Напишите статью на «морду» web-ресурса и уберите оттуда анонсы, представляющие собой начало статьи.
  3. Используйте тег rel=canonical, чтобы указать на основной адрес на страницах-дублях. В настоящее время модуль для подключения этого тега имеется практически у каждой CMS.

После того, как вы удалите все дубли страниц на сайте, вы можете заметить, что web-ресурс заметно поднялся в выдаче поисковых систем, а его индексация стала более быстрой.


Меню сайта

Как найти дубли страниц на сайте
Как найти дубли страниц на сайте