Мусорные страницы в WordPress

В WordPress обнаруживается не мало артефактов маршрутизации, которые создают головную боль SEO-специалистам. Я уже рассказывал на днях о страницах вложений. А сегодня расскажу ещё об одном случае.

Попробуйте на вашем блоге под WP добавить к адресу публикации или страницы после слэша любое целое число.

К примеру, к адресу одной из статей на shra.ru

Добавим /1000

Что ожидается? Я считал, что WP покажет страницу 404. Но нет, он показывает ту же самую страницу, возвращая код 200. Если бы не каноническая ссылка в заголовке HTML, то мы бы имели дубль страницы. Вернее, неограниченное число дублей.

Что делать, если такие дубли каким то образом попали в индекс поисковой машины?

Возвращаем HTTP код 404 для дублей

Смысл в том, чтобы при обращении к неканоническому адресу страницы ответить 404 кодом.

Я реализовал зацепку к template_redirect и использовал All in One SeoPack плагин для получения канонического адреса страницы.

Ситуация с такими дублями весьма редкая. Остается не выясненным, почему WP обрабатывает данные адреса, не выбрасывая 404 страницу? Может у вас есть ответ? :)

Мало букафф? Читайте есчо !

ЧПУ эксперимент

Август 1, 2015 г.

Зачем проводится данный эксперимент описано вот здесь. Эксперимент посвящен оценке вкладам в ранжирование ключа разных факторов. Это УРЛ страницы, вхождение ключа в заголовок, тело статьи, выделение strong и подзаголовки. Изначально хотелось проверить ...

Читать

Спам в аналитике гугла. Настраиваем фильтры

Ноябрь 29, 2016 г.

Куда катится этот мир? Спам уже пихают в статистику Гугла! Я признаю, что такой ход не лишен изящества. Но, господа спамеры, имейте совесть. :) ...

Читать

 

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий:

Много комментариев в “Мусорные страницы в WordPress”

  1. AndrewTishkin:

    Забавно читая сию полезную статью видеть в адресе блога автора мусорные якоря: musornye-stranicy-v-wordpress/#axzz4XQ4Oob00
    Или в этой белиберде есть тайный смысл?

    • В этой белиберде конечно же есть смысл. Якоря эти не попадают в индекс, т.к. канонические адреса сформированы для каждой страницы сайта, а служат они для корректной работы tynt скрипта, которым и формируются. Этот якорь что то вроде хеш кода.