Куда катится этот мир? Спам уже пихают в статистику Гугла! Я признаю, что такой ход не лишен изящества. Но, господа спамеры, имейте совесть. :)
Вот что я наблюдаю в отчете за день в списке языков:
Почти 10% сеансов составили спамерские сеансы с длинным посланием вместо языка: «Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!».
Лично мне, наблюдать это в отчетах не очень приятно. Удивительно, но Google не спешит отфильтровывать этот трафик из статистики (хотя стоит настройка фильтровать известных ботов). Так что давайте настраивать фильтры сами, благо возможность такая есть.
Переходим в закладку «Администратор», жмем «фильтры». Добавляем новый фильтр.
Название фильтра — обязательное поле. Тип — выбираем «пользовательский». Для значения поля фильтра «языковые настройки» вводим часть от длинной спам фразы — «Vote for Trump».
Все готово. Сохраняем.
Перед сохранением удобно проверить какой эффект оказывает фильтр. Для этого нажмите на «Проверить этот фильтр».
Теперь можно вернуться в статистику и посмотреть изменения.
Результат фильтрации
Спам исчез не сразу после настройки фильтра. Связано это с работой аналитики, суть которой нам простым смертным не постичь.
Пока я составлял эту статью, добавились кое какие данные, так что числа напротив «ru» подросли. А вот спамерская строка похудела с 97 до 9. Чуть позже призыв голосовать за трампа (Vote for Trump!) исчез и вовсе.
Другой подход
На самом деле, предложенный подход не верен. Спамеру не сложно поменять фразу. И что, мы каждый раз будем менять фильтр?
Вот статистика, для примера, с другого сайта:
Тут мы кроме «трампа», видим и какое то послание на китайском и рекламу o-o-8-o-o.com. Доля спама внушительна — доходит до 15% от общего числа запросов!
Можно попробовать составить «белый список» языков. Это радикальный способ, и он теоретически, наверное, правильный. Но придется перечислить все возможные комбинации. При этом редкие и какие то новые комбинации будут отброшены, и мы их не увидим в статистике.
А что если отсекать длинные названия языков? Все «штатные» названия укладываются в 5 символов. Как составить нужный фильтр?
Попробуйте следующий шаблон:
1 |
.{6} |
Т.е. будут отфильтрованы все запросы с языковыми настройками, где длина языка не менее 6 символов.
Шпасибо! оченно понравилось
Спасибо! Я так понял теперь новые значения учитываться не будут. А можно как то убрать эту строчку из уже зачисленных посещениях?
У меня очистился спам только в текущем дне. На историю действие фильтра не распространяется.
Спасибо, все четко и понятно.