Дубликаты страниц

 Дублированный контент

Дубликаты страниц — поиск и удаление дублированного контента

 

Дублированный контент является одной из самых больших проблем в SEO. Бесплатные CMS очень любят плодить дубликаты страниц, что является несомненным минусом при их использовании. Как вы знаете, или должны знать, если у вас существуют дубликаты страниц на сайте, вы, во-первых, соревнуетесь в продвижении сайта сами с собой, во вторых возникает угроза пессимизации сайта или попадания под более жесткие санкции поисковых систем за не уникальный контент. Кроме того, из-за дублированного контента, вы также распределяете вес страницы сайта на все дубликаты страниц, это очень плохо для Page Rank и ТиЦ.

Что считается Дублированным контентом?

Дублированный контент это — когда у вас есть несколько страниц с одинаковым тегом заголовка TITLE , метаописанием страниц (meta name=»description») или несколько страниц с одинаковым (контентом) содержанием.

Если вы используете систему управления контентом (CMS), как Drupal, Joomla или WordPress, и в содержимом вашего сайта имеются categories и/или tags, то очень возможно, что вы уже являетесь счастливым обладателем дубликатов страниц, даже не подозревая об этом. В основном, это беда WordPress и Joomla.

Как найти дублированный контент?

В настоящее время существует масса сервисов по выявлению дубликатов страниц. Каждый SEO специалист пользуется разными методами определения дублированного контента. Я хочу поделиться своим, несложным, методом по определению дублированного контента (Метаописание и Тег заголовка)с помощью инструмента Google Webmaster Central (GWS).

Google Webmaster Central имеет большой набор инструментов и поможет вам быстро найти дубликаты содержания, сообщив при этом количество страниц с одинаковыми заголовками страниц и метаописаниями страниц. Если вы используете инструменты Google для веб-мастеров, вот шаги для поиска дубликатов содержания:

  1. Войдите в свой аккаунт GWC
  2. Если у вас несколько сайтов, то выбирайте нужный и в левом меню откройте «Оптимизация» и нажмите «Оптимизация HTML»
  3. Здесь вы увидите таблицы с указанием дублированного контента, если таковые имеются.
  4. Нажмите на любой из ссылок, и вы увидите список страниц с дублированным контентом, и указанием их местонахождения. Если эти страницы не закрыты от индексации в robots.txt, то они являются дубликатами.

 

Оптимизация HTML

Дальше все просто — ходим по страницам и изменяем все, что одинаковое.

Теперь, когда вы определили дублированный контент, пришло время поискать страницы с одинаковым содержанием. Делается это просто — выделяем в тексте любое понравившееся предложение и копируем его. Заходим в Google или Яндекс и вставляем этот текст, взяв его в кавычки (Пример: «скопированный текст»), в поиск. В результатах поиска должна отобразиться только одна страница, как на рисунке ниже.

Поиск дубликатов страниц

Если же больше, то это будут страницы дубликаты с одинаковым содержанием. И хорошо, если это будут страницы только вашего сайта, вы это легко исправите. А бывает и такое, что ваши тексты копируют и выкладывают на другие сайты, с этим бороться уже сложнее. При наличии нескольких страниц на вашем сайте с разными URL, но одинаковым содержимым, вам следует определить нужную вам страницу, а остальные удалить с сайта и из индекса поисковых систем. Методы удаления разные и зависят от свойств дублированных страниц. Если вы обнаружили ваш контент на чужом сайте, то тут надо писать гневное письмо администратору сайта, с просьбой удалить или изменить ваш текст.

Если у вас есть методы, которые вы с успехом применяете, пожалуйста, напишите их в комментариях, чтобы другие, включая меня, могли извлечь из них выгоду при самостоятельном продвижении сайтов.

Оцените статью
( Пока оценок нет )
Поделиться с друзьями
Блог [SEO Jedi]
Добавить комментарий

  1. Гамбузия

    Подскажите, а реал каноникал эффективен от бублей страниц?

  2. SEOjedi автор

    Приведите пример, а то так не очень понятно, о чем вы говорите.

  3. Василий vahe-zdorovye

    Проверил я свои сайты таким способом под номером 2, на одном (молодом) появляется одна страница, а на втором где много статей то появляются несколько страниц в выдачи, в основном это публикации в блогах в виде цитат.
    Как быть в такой ситуации?

  4. Instructor

    Спасибо, у меня через дубли забанил Яша(