Саплментал (supplemental) страницы в WP
15.10.2008
Если вы работаете с WordPress блогами наиболее вероятно попадание страниц в саплментал. Сам блог, работа его системы приводит к появлению массы дублированного контента. К примеру, напишите на WP пост с настройками по умолчанию. Будете удивлены, что пост в WP повторится как минимум в 5 различных урлах. Пост появится в категориях, календаре, авторах, архивах. Соответственно следует ожидать массового попадания страниц в саплментал индекс Google, в котором хранится дублированный контент.
Как узнать, что ваш сайт находится в саплментале? Довольно просто. Можно использовать инструмент, любезно предоставленный нам мастером Ласто.
Как выйти из дополнительного (саплментал) индекса, как рекомендация.
1. Проверьте, чтобы в категориях, архивах показывался не весь пост, а только его анонс. Чтобы исправить это придется, к примеру, изменить файл archive.php.
2. Изменить файл robots.txt в основной директории. В нем стоит предусмотреть запрет индексации дублей контента. Как пример можно использовать следующий роботс измененный конечно под реалии вашего блога.
User-agent: Googlebot
Disallow: /*/feed/$
Disallow: /feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /category/*/$
Disallow: /page/*/$
Disallow: /tag/*/$
Disallow: /stat-pages/*$
Disallow: /index.php?*$
Disallow: /*/wp-*.php$
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /wp-images/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
После всех изменений, остается просто сидеть сложа руки и ждать робот Google для очистки индекса. Она занимает около 2-3 недель.
По прошествии времени уже неактуально. На блоге есть описание совершенно другое.
Извините, но коментирование запрещено.