Как определить что сайт попал под фильтр Панда?
Как определить что сайт попал под фильтр Панда?
Семён
Эдуард Пронин
5 декабря 2012
Алгоритм Панда фильтрует сайты из-за некачественного контента. Поисковик Google показывает сайты в выдаче по принципу уникальная статья с одной каждой позиции, другими словами Google пытается по максимум разнообразить выдачу, чтобы не показывать одно и тоже своим пользователям.
Ранее текстовые алгоритмы поисковика основывались на количестве ключевых слов в тексте, и его соотношения к тексту (тошнота). Такая простая методика была легко разоблачена оптимизаторами и вебмастерами, которые просто затачивали страницы под ключевые слова. Данные тексты не несут никакого смысла для пользователей, и они ориентированны на поисковые машины.
В следствии Google выпустил новый алгоритм «Panda», суть которого убрать из рейтингов «треш-сайты».
Google не публикует информацию о том как работает алгоритм, но можно перечислить основные причины и признаки фильтра Панды.
- Не уникальный контент. Как выше говорилось гуглу нет смысла показывать одно и тоже своим пользователям. Наличие на сайте дублированного контенета (больше 50%) позаимственного из других ресурсов, отличный повод попасть под фильтр.
- Заточенные страницы под поисковые запросы. Высокочастотные запросы, часто как правило имеют не естественный вид, например: окна Киев, телевизор цена Киев. Включения таких запросов в точном соответствии в статью, прямой сигнал Панде, так как Google, уже прекрасно распознает лексику славянских языков.
- Переспам. Изобилие ключевых слов по отношению к тексту, если в тексте 40 вхождений слова «тренинг» а сам текст 2000 символов, это прямой путь к штрафным санкциям.
- Теги strong. Данный тег предназначен для оформления важных моментов и терминов. Нормой по использованию —
1-2 тега для одного текста. Соответственно изобилие тегов strong, не приветствуется. - Синомизированный контент. Существуют сервисы по автоматическому генерированию уникального контента, которые основываються на подборе синонимов существующего контента. Панда не сколько раз обновлялась, и синомизированный контен также разоблачен.
- Скрытый текст. Текстовые материалы которое размещены с параметром CSS display:none
- Текст мелкого шрифта, такие тексты не читабельные и плохо воспринимаются.
Определения фильтра:
- Главная страница не в индексе, не в кеше. Нужно проверить операторами cache: и site:
- Если кеш главной страницы больше месяца, это говорит о том что Google не затрачивает ресурсы на индексацию некачественных сайтов.
- -Supplemental index. Дополнительный индекс в котором содержатся не информативные страницы (по мнению Google). Чтобы проверить основной и не основной индекс, нужно воспользоваться операторами site:site.com и site:site.com/&. Все страницы что в доп. индексе, занимают последние позиции в рейтинге и не приносят трафик. Более 50% страниц в доп индексе, сигнал для Панды.
Теги: SEO, внешняя оптимизация