№15 (13-10-2015). Панда, Пингвин и Колибри (ч. 1)

Что такое смена алгоритма?
Для начала обсудим алгоритм Google как таковой. Он чрезвычайно сложен — и продолжает усложняться по мере того, как Google пытается все лучше и лучше предоставлять людям информацию, которую они ищут. На заре создания поисковых систем специалисты по поисковому маркетингу могли без особого труда заставить Google показывать сайт своего клиента в числе первых. В некоторых случаях достаточно было просто поместить на сайт клиента метатег keywords — небольшой кусочек кода, который рассказывал поисковой системе о тематике страницы.



По мере эволюции Google его инженеры, которые были сфокусированы на предоставлении максимально релевантных поисковым запросам результатов, работали над способами предотвращения обмана поисковой системы и поиском новых методик определения степени соответствия страниц запросам. С течением времени алгоритм стал совокупностью сотен различных факторов. Есть много таких, в важности которых мы уверены — например, хорошие тайтлы (описания страниц между тегами в HTML-коде). Но есть много факторов, о которых можно только спекулировать — например, влияет ли на ранжирование нажатие гугловских кнопок +1.

До некоторых пор алгоритм Google менялся крайне редко. Если ваш сайт пробился на первое место по какому-то ключевому слову, то он гарантированно оставался там как минимум до следующего апдейта алгоритма, который мог произойти только через несколько недель или месяцев.

Все изменилось после запуска Caffeine в 2010. После этого поисковая выдача менялась уже несколько раз в день, а не раз в несколько недель. Google вносит более 600 изменений в алгоритм за год, и большая часть никак не анонсируется. Но когда поисковик внедряет по-настоящему крупное изменение, то оно получает имя и официальное объявление о запуске. И все в мире SEO сходят с ума в попытке понять, как обратить эти изменения себе на пользу. Три крупнейших изменения за последние несколько лет — это алгоритмы «Панда» (Panda), «Пингвин» (Penguin) и «Колибри» (Hummingbird).

Что такое «Панда»?
Этот алгоритм был запущен 23 февраля 2011 года и наделал много шума. Его назначение состояло в том, чтобы показывать высококачественные сайты выше в результатах поиска, а менее качественные вытеснять ниже. Поначалу это изменение алгоритма было безымянным, и многие называли его «Фермер», поскольку он ударил по контент-фермам (это сайты, которые агрегируют информацию с других ресурсов, часто воруя контент, с целью создать много страниц, которые выйдут в ТОП Google по каким-то ключевым словам). Однако под его воздействие попали и многие другие сайты. В дальнейшем алгоритм был официально назван в честь одного из его авторов, Навнита Панды [прим. пер.: вторым указанным в патенте автором, кстати, был русский программист Владимир Офицеров].

Сразу после запуска «Панды» на многих SEO-форумах утвердилось мнение, что алгоритм нацелен на сайты с неестественными ссылочными паттернами. Однако оказалось, что «Панда» практически не обращает внимания на ссылки, а анализирует именно внутренее качество сайта. В большинстве случаев попавшие под «Панду» сайты пострадали очень сильно. Но я видела и сайты, которые понесли от этого апдейта совсем небольшие потери. Но в целом «Панда» применялась к сайту в целом, не просто понижая отдельные страницы в выдаче — просто Google начинал качество сайта низким. В некоторых случаях «Панда» могла ударить по одному из разделов сайта — например, по новостному блогу или конкретному поддомену.

Всякий раз, когда сотрудников Google спрашивали о том, что нужно сделать для выхода из-под «Панды», они ссылались на пост Амита Сингала, в котором был приведен чеклист для определения качества сайта. Вот этот список:

  • Поверили ли бы вы информации, представленной в данной статье? 
  • Написана ли эта статья экспертом или энтузиастом, хорошо знакомым с темой, или же автор копнул совсем неглубоко? 
  • Есть ли на сайте полностью или частично дублированные тексты, а также избыточные статьи на одинаковые или очень похожие темы со слегка различным набором ключевых слов? 
  • Ввели бы вы на этом сайте данные своей кредитной карты? 
  • Есть ли в статье орфорграфические, стилистические или фактические ошибки? 
  • Отвечают ли рассматриваемые в контенте темы истинным интересам читателей сайта, или же сайт генерирует контент в попытке найти то, что будет высоко ранжироваться поисковыми системами? 
  • Представляет ли статья собой оригинальный контент, информацию, отчет, исследование или анализ? 
  • Предоставляет ли статья заметную ценность в сравнении с другими страницами в результатах поиска? 
  • Насколько хорошо было проверено качество контента? 
  • Описывает ли статья обе стороны истории? 
  • Является ли сайт признанным авторитетом в предоставлении информации в своей тематике? 
  • Является ли контент массово произведенным, созданным усилиями большого количества авторов или распределенным по большой сети сайтов, в которой отдельные страницы не получают должного внимания при создании? 
  • Хорошо ли статья отредактирована, или же написана небрежно и на скорую руку? 
  • Доверяли ли бы вы информации с этого сайта, касающейся вопросов здоровья? 
  • Вспомнили ли бы вы этот сайт в качестве авторитетного источника информации, если бы услышали его название? 
  • Предоставляет ли статья полное или исчерпывающее описание темы? 
  • Содержит ли статья нетривиальный анализ или информацию за пределами очевидного? 
  • Относится ли этот материал к тому классу статей, которыми вы хотели бы поделиться с друзьями, занести в закладки или порекомендовать кому-либо? 
  • Присутствует ли на странице избыточное количество рекламных объявлений, отвлекающих от основного контента или перемешанных с ним? 
  • Представляете ли вы эту статью в напечатанной в журнале, энциклопедии или книге? 
  • Являются ли статьи слишком короткими, неглубокими или не несущими полезных подробностей? 
  • Созданы ли страницы с большим вниманием к деталям? 
  • Будут ли посетители жаловаться, если увидят страницы с этого сайта?

Уф! Внушительный список! Эти вопросы не обязательно означают, что Google пытается алгоритмически вычислить, насколько интересны ваши статьи, и описывают ли они обе стороны истории. Скорее, эти вопросы попали в список, поскольку все эти факторы вносят свою лепту в то, что Google использует в определении качества вашего сайта. На самом деле никто не знает всех факторов, которые использует Google в составе «Панды». Но акцент на необходимости создания максимально качественного сайта для посетителей очевиден. Также важно показывать Google только лучшее, что у вас есть. Можно выделить несколько факторов, которые точно влияют на восприяние вашего сайта «Пандой».

Мало контента
Такие страницы дают очень мало (или ничего) тому, кто их читает. Это не значит, что на странице должно быть не меньше определенного количества слов, но в большинстве случаев страницы с небольшим количеством слов не особенно полезны. Если на вашем сайте много страниц с одним-двумя предложениями, и эти страницы попадают в индекс Google, тогда «Панда» может присвоить большей части проиндексированных страниц низкий рейтинг качества. Несколько страниц почти без контента не приведут к вызываемым «Пандой» проблемам, но если большая часть вашего сайта такова, то он не представляет интереса для пользователей, что не есть хорошо.

Дублированный контент
Есть несколько путей, которыми дублированный контент может «сообщить» алгоритму «Панда» о том, что сайт имеет низкое качество. Во-первых, это происходит, если на сайте много скопированного с других ресурсов контента. Например, вы наполняете блог статьями, которые берете на других сайтах. Google очень неплохо умеет определять первоисточник — он поймет, что не вы создали эти материалы. Если алгоритм видит, что большая доля вашего сайта создана из материалов других сайтов, «Панду» это не обрадует.

Вы также можете столкнуться с проблемой возникновения дублей контента на вашем собственном сайте. Например, если ваш сайт продает большое количество товаров. Возможно, что каждый продукт имеет отдельную страницу для каждого цветового вариант и размера. Но все эти страницы по сути являются одинаковыми. Если один продукт выпускается в 20 различных цветах и 6 различных размерах, то у вас будет 120 страниц для одного и того же товара, и все они будут практически идентичными. А теперь представьте, что у вас в ассортименте 4000 товаров. Это значит, что в индекс Google попадут почти полмиллиона страниц, хотя достаточно было бы 4000. В таких ситуациях можно исправить проблему с помощью тега canonical. У Moz есть хорошая статья про этот тег, и Доктор Пит также написал о нем отличный материал.

Низкокачественный контент
Когда я пишу статью и публикую ее на одном из моих сайтов, я хочу передать Google информацию, которая будет лучшей по данному вопросу. В прошлом многие SEO-специалисты давали такие советы владельцам сайтов: «пишите в блог каждый день, каждый день скармливайте Google новую порцию контента». Но если вы создаете контент не самого высшего качества, то это принесет больше вреда, нежели пользы. Многие вопросы Амита Сингала из приведенного выше списка относятся к тому, полезен ли ваш контент читателям. Предположим, что у меня есть блог о SEO, и каждый день я беру по небольшому отрывку из свежих чужих статей о SEO и публикую их в качестве поста на своем сайте. Захочет ли Google показать ищущим мой дайджест, или же предпочтет перенаправить их к полным статьям? Конечно же моя подборка не имеет такой же ценности, как сами статьи! А теперь давайте представим, что я делаю это каждый день в течение 4 лет. Теперь на моем сайте более 4000 страниц, которые содержат неуникальную и менее ценную по сравнению с другими сайтами информацию по теме.

Или вот такой пример: давайте представим, что я сантехник. Мне сказали, что нужно регулярно писать в блог, поэтому несколько раз в неделю я пишу статью на 2-3 параграфа на темы типа «Как починить текущий кран» или «Как прочистить засорившийся унитаз». Но я занятой человек и не могу вложить в свой сайт много времени. Поэтому я снабжаю каждую статью ключевыми словами в тайтле и в контенте, но сами тексты не особенно глубоко раскрывают тему и малополезны. Если большая часть страниц на моем сайте содержит информацию, во взаимодействие с которой никто не вовлекается, это может послужить признаком плохого качества для «Панды».

Есть и другие факторы, которые, вероятно, вносят вклад в работу алгоритма. Гленн Гейб недавно написал отличную статью, в которой рассмотрел сайты, затронутые самым свежим апдейтом «Панды». В ней приведен чрезвычайно подробный список того, на что нужно обращать внимание при создании «пандобезопасных» сайтов.

Как восстановиться после удара «Панды»
Google обновляет этот алгоритм примерно раз в месяц [прим. пер.: есть вероятность выйти из-под фильтра раньше, чем произойдет полный апдейт]. Они ранее объявляли об обновлениях «Панды», но теперь делают это только в случае серьезных изменений.

Когда «Панда» обновляется, Google свежим взглядом смотрит каждый сайт и определяет, соответствует ли он изменившимся критериям качества. Если ваш сайт пострадал от «Панды», и вы внесли изменения — например, удалили страницы с малым количеством контента и дубли, то после обновления вы должны увидеть, что состояние дел улучшилось. Однако для некоторых сайтов требуется несколько апдейтов, чтобы полностью выйти из-под негативного воздействия «Панды». Это происходит потому, что Google иногда требуется несколько месяцев, чтобы заново посетить все страницы вашего сайта и учесть внесенные изменения.

Теперь вместо обновления алгоритма Google делает то, что называется «апдейтом». Апдейт означает, что Google меняет критерии, которые они используют для определения того, что считать высококачественным сайтом. 20 мая 2014 года был выпущен апдейт под названием Panda 4.0. Это вызывало заметное улучшение ситуации для очень большого количества сайтов.  



Не все выходы из-под «Панды» такие же мощные. Но если вы попали под этот фильтр и проделали работу по внесению соответствующих изменений, то вы действительно должны увидеть некоторое улучшение.

Продолжение статьи Мэри Хейнс с подробностями о «Пингвине» и «Колибри» вы найдете в следующем выпуске нашей рассылки.

Версия для печати

Вернуться ко всем статьям

Заказ обратного звонка
Есть, что сказать?
Подписаться на рассылку