Мусорные страницы в WordPress

В WordPress обнаруживается не мало артефактов маршрутизации, которые создают головную боль SEO-специалистам. Я уже рассказывал на днях о страницах вложений. А сегодня расскажу ещё об одном случае.

Попробуйте на вашем блоге под WP добавить к адресу публикации или страницы после слэша любое целое число.

К примеру, к адресу одной из статей на shra.ru

Добавим /1000

Что ожидается? Я считал, что WP покажет страницу 404. Но нет, он показывает ту же самую страницу, возвращая код 200. Если бы не каноническая ссылка в заголовке HTML, то мы бы имели дубль страницы. Вернее, неограниченное число дублей.

Что делать, если такие дубли каким то образом попали в индекс поисковой машины?

Возвращаем HTTP код 404 для дублей

Смысл в том, чтобы при обращении к неканоническому адресу страницы ответить 404 кодом.

Я реализовал зацепку к template_redirect и использовал All in One SeoPack плагин для получения канонического адреса страницы.

Ситуация с такими дублями весьма редкая. Остается не выясненным, почему WP обрабатывает данные адреса, не выбрасывая 404 страницу? Может у вас есть ответ? :)

Написать комментарий

Мало букафф? Читайте есчо !

Технические средства аудита сайта

Август 16, 2015 г.

Поговорим об инструментах для технического анализа вашего сайта. Одна из целей SEO - избавить сайт от проблем, которые могут мешать поисковым системам ...

Читать

Обновления plugina References, v1.1

Апрель 9, 2018 г.

Времени придумывать что то самому последние полгода вообще нет, потому дорабатываю свои плагины по заявкам пользователей :). References в плане ...

Читать

 

Комментарии к «Мусорные страницы в WordPress»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий:

Много комментариев в “Мусорные страницы в WordPress”

  1. AndrewTishkin:

    Забавно читая сию полезную статью видеть в адресе блога автора мусорные якоря: musornye-stranicy-v-wordpress/#axzz4XQ4Oob00
    Или в этой белиберде есть тайный смысл?

    • В этой белиберде конечно же есть смысл. Якоря эти не попадают в индекс, т.к. канонические адреса сформированы для каждой страницы сайта, а служат они для корректной работы tynt скрипта, которым и формируются. Этот якорь что то вроде хеш кода.