Дубликаты страниц

Fima Korolev

 Дублированный контент

Дубликаты страниц – поиск и удаление дублированного контента

 

Дублированный контент является одной из самых больших проблем в SEO. Бесплатные CMS очень любят плодить дубликаты страниц, что является несомненным минусом при их использовании. Как вы знаете, или должны знать, если у вас существуют дубликаты страниц на сайте, вы, во-первых, соревнуетесь в продвижении сайта сами с собой, во вторых возникает угроза пессимизации сайта или попадания под более жесткие санкции поисковых систем за не уникальный контент. Кроме того, из-за дублированного контента, вы также распределяете вес страницы сайта на все дубликаты страниц, это очень плохо для Page Rank и ТиЦ.

Что считается Дублированным контентом?

Дублированный контент это – когда у вас есть несколько страниц с одинаковым тегом заголовка TITLE , метаописанием страниц (meta name=”description”) или несколько страниц с одинаковым (контентом) содержанием.

Если вы используете систему управления контентом (CMS), как Drupal, Joomla или WordPress, и в содержимом вашего сайта имеются categories и/или tags, то очень возможно, что вы уже являетесь счастливым обладателем дубликатов страниц, даже не подозревая об этом. В основном, это беда WordPress и Joomla.

Как найти дублированный контент?

В настоящее время существует масса сервисов по выявлению дубликатов страниц. Каждый SEO специалист пользуется разными методами определения дублированного контента. Я хочу поделиться своим, несложным, методом по определению дублированного контента (Метаописание и Тег заголовка)с помощью инструмента Google Webmaster Central (GWS).

Google Webmaster Central имеет большой набор инструментов и поможет вам быстро найти дубликаты содержания, сообщив при этом количество страниц с одинаковыми заголовками страниц и метаописаниями страниц. Если вы используете инструменты Google для веб-мастеров, вот шаги для поиска дубликатов содержания:

  1. Войдите в свой аккаунт GWC
  2. Если у вас несколько сайтов, то выбирайте нужный и в левом меню откройте “Оптимизация” и нажмите “Оптимизация HTML”
  3. Здесь вы увидите таблицы с указанием дублированного контента, если таковые имеются.
  4. Нажмите на любой из ссылок, и вы увидите список страниц с дублированным контентом, и указанием их местонахождения. Если эти страницы не закрыты от индексации в robots.txt, то они являются дубликатами.

 

Рекомендую к прочтению:  Как правильно пользоваться wordstat

Оптимизация HTML

Дальше все просто – ходим по страницам и изменяем все, что одинаковое.

Теперь, когда вы определили дублированный контент, пришло время поискать страницы с одинаковым содержанием. Делается это просто – выделяем в тексте любое понравившееся предложение и копируем его. Заходим в Google или Яндекс и вставляем этот текст, взяв его в кавычки (Пример: “скопированный текст”), в поиск. В результатах поиска должна отобразиться только одна страница, как на рисунке ниже.

Поиск дубликатов страниц

Если же больше, то это будут страницы дубликаты с одинаковым содержанием. И хорошо, если это будут страницы только вашего сайта, вы это легко исправите. А бывает и такое, что ваши тексты копируют и выкладывают на другие сайты, с этим бороться уже сложнее. При наличии нескольких страниц на вашем сайте с разными URL, но одинаковым содержимым, вам следует определить нужную вам страницу, а остальные удалить с сайта и из индекса поисковых систем. Методы удаления разные и зависят от свойств дублированных страниц. Если вы обнаружили ваш контент на чужом сайте, то тут надо писать гневное письмо администратору сайта, с просьбой удалить или изменить ваш текст.

Если у вас есть методы, которые вы с успехом применяете, пожалуйста, напишите их в комментариях, чтобы другие, включая меня, могли извлечь из них выгоду при самостоятельном продвижении сайтов.


-->

4 комментариев »

  1. Гамбузия:

    Подскажите, а реал каноникал эффективен от бублей страниц?

  2. Василий vahe-zdorovye:

    Проверил я свои сайты таким способом под номером 2, на одном (молодом) появляется одна страница, а на втором где много статей то появляются несколько страниц в выдачи, в основном это публикации в блогах в виде цитат.
    Как быть в такой ситуации?

  3. Instructor:

    Спасибо, у меня через дубли забанил Яша(

Оставить комментарий

Ваш email не будет опубликован. Обязательные поля отмечены *

Что-то типа КАПЧИ :) *

Вы можете использовать это HTMLтеги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">