1. книги
  2. Руководства
  3. Анатолий Косарев

Поисковые алгоритмы ранжирования сайтов

Анатолий Косарев
Обложка книги

Этот труд — второе издание книги «SEO-продвижение. 36 фильтров Google». Название пришлось изменить потому, как по новым правилам нельзя на обложке писать названия брендов. Кроме этого второе издание претерпело большие изменения и дополнения, в результате её объем увеличился почти в три раза.Книга о том, какие сайты любят пользователи и поисковые системы, и как делать сайт первым в поисковой выдаче.

Оглавление

Купить книгу

Приведённый ознакомительный фрагмент книги «Поисковые алгоритмы ранжирования сайтов» предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Качественный, полезный и авторитетный контент

Перед тем как начать рассматривать фильтры желательно понимать их основную цель, чтобы правильно оценивать их работу, и пользоваться их благами.

Итак, начнем.

Google стремится к тому, чтобы в результатах поиска первую позицию всегда занимал лучший ответ, а далее по убыванию остальные, которые более-менее соответствуют запросу пользователей.

Для решения этой задачи фундаментом всего поиска Google приняты три кита, на основании которых и строятся все фильтры, или алгоритмы по результатам работы, которых выстраиваются сайты в результатах поиска пользователей на их запросы.

Эти три кита следующие.

Качественный контент

a. оригинальные тексты (копии и рера́йтинг это не качественный контент) и оригинальные изображения (сделанные самостоятельно);

b. тексты без орфографических, синтаксических и других ошибок;

c. хорошо структурированный текст;

d. LSI-терминология см. в следующей главе, и достаточный объем.

Кроме перечисленных пунктов качественного контента к его качеству относится длинна предложения и слов с учетом образованности аудитории, которой предназначается текст. Например, если магазин продает товары, рассчитанные на блондинок (по жизни, а не по способностям), то предложения должны быть короткими, со словами, которые употребляет именно это группа людей. Если же текст рассчитан на людей с высшим образованием, то и предложения, и тексты должны быть более длинными.

Google считает, что текст на сайте должен быть информативен. Большое количество не информативных слов (в, на, весьма, вполне) — понижает вес страницы. У каждого поисковика свой набор не информативных слов и фраз, которые, как и Google они держат в секрете. Эти слова и фразы называют стоп-словами, или шумовыми.

По мнению Google стоп-слова не несут информацию, и раздражают читателя. Но все же небольшое количество для связки должно быть. Мы не говорим, например, «перелез забор», но говорим «перелез через забор».

Чтобы было проще понять смысл слов, которые понижают рейтинг поясню на примере. Девочки, которые прошли курсы по копирайтингу, получают деньги за свою работу из расчета количества напечатанных знаков. У них расчёт простой чем больше, знаков в тексте тем больше они получат. Имея набор ключевых фраз, они умудряются вплетать массу бессмысленного текста.

Например: «Наша быстро развивающаяся компания молодых специалистов с большим опытом работы…». Какая информация, полезная в этой фразе?

Смотрите: «быстро развивающаяся» — ничего не говорящая фраза, читатель видит стандартный штамп, как на других сайтах, и сразу пропускает эту информацию. Нет информации.

Лучше написать: «В прошлом году мы обслужили 150 человек, а в этом 200!». Но эти цифры ничем не подкреплены. Но что значит обслужили? Пришел к ним человек, они ответили на его вопрос, и тот ушел. Можно считать, что они его обслужили. В добавок как проверить? Да в таком варианте есть информация, но как её проверить?

Убедительнее звучит: «В прошлом году мы заплатили 10 000 € налогов, а в этом — 14тыс.». Такая фраза внушает доверие, потому что её можно проверить.

Еще один плюс последний фразы — мы не говорим, что фирма развивается быстро, мы предоставляем возможность читателю самостоятельно сделать вывод, что фирма развивается быстро. Ведь могут оказаться люди, для которых увеличение прибыли на 40% за год не такой уж хороший результат.

Такой вариант, не навязанное мнение для каждого человека — самое ценное его собственное заключение. Более убедительным будет скриншот оплаты налогов за прошлый и текущий год, сделанный с официального сайта, с соответствующей подписью к скриншоту.

Далее «молодых». Вместо молодых лучше написать конкретно: «Возраст работников от 25 до 30 лет». Плюс за мой вариант — для 18—20 летнего заказчика 30 лет — это зрелый возраст. Для 50-ти летнего — это пацаны. Цифры вместо прилагательных для посетителя звучат убедительнее, а значит и полезнее. И Google воспринимает цифры более весомым фактором.

Идеально будет показать фотографии работников, с кратким описанием, возраста, образованием, стажем работы, и дугой информацией, чтобы каждый мог выносить свое суждение.

Фотографии с подписями для Google тоже положительный сигнал, что информация подается разнообразно, ведь мы любим разнообразие.

«Специалистов» — требуется доказать, что работники действительно специалисты. Например, закончил такой-то университет, стажировался там-то. Google уже имеет большой набор штампов, пустых фраз, которые не несут информации? Но снижают вес веб-страницы.

И последнее явное противоречие: «с большим опытом работы». Как у молодого специалиста может быть большой опыт работы?

Специалисты Google утверждают, что они отслеживают достоверность информации, и заметив неправду пессимизируют такие страницы. В качестве примера приводится такая фраза: «Колумб родился в Австралии» как явная ложь. Не берусь утверждать Google уже отлавливает фразы типа «молодых специалистов с большим опытом работы», но уверен, что и такие фразы будут попадать в их черный список.

Наше мировосприятиеустроено так, что если мы видим хоть одно противоречие, уход от четкого ответа, то в нас возникает недоверие ко всему сказанному. Google это знает и снижает вес веб-страниц, которые имеют такие фразы.

Сейчас мы разобрали один небольшой пример, как пример бесполезного текста. Разбирать же все ограничения, которыми пользуется Google нет смысла. Лучше довериться его Руководству, чтобы понять за что может быть наказан сайт. Повторюсь, что не на все уловки Google уже реагирует, но те, кто желает делать качественный, полезный и авторитетный сайт должны уже сегодня стараться избегать запреты, декларированные поисковиком.

Google не любит клише и штампы. Не любит прилагательные, местоимения, наречия, причастные и другие обороты. И наоборот, чем больше существительных и глаголов действия и состояния, числительных тем лучше.

Вспомните А. С. Пушкина

«Буря мглою небо кроет, Вихри снежные крутя; То, как зверь, она завоет, То заплачет, как дитя, То по кровле обветшалой Вдруг соломой зашумит, То, как путник запоздалый, К нам в окошко застучит.»

Посчитайте сколько здесь существительных и глаголов, а сколько прилагательных, и других частей речи.

Уверен, что у многих тексты на сайтах менее качественные по мнению Google.

Полезный контент

это:

· ответы на задранные вопросы (на фразы, которые набирает пользователь) поисковику;

· что комментируют, ставят лайки;

· пишут отзывы.

Полезный контент — это не просто статья на сайте, в блоге, или интернет-магазине, — это ценная информация, которой автор желает поделиться с другими людьми. Ценная информация — это то, что автор отправляет поисковикам, чтобы те помогли поделиться её с другими пользователями.

Так что по мнению Google качественный контент —

· Это то, чем можно поделиться.

· Это реальные ответы пользователю на задранные вопросы поисковику.

· Это то, что люди обсуждают в сети, на работе, в кругу друзей или дома.

· Это то, что цитируют.

Поэтому Google уделяет внимание сколько ссылок сделано на веб-страницу, сколько раз процитировали. Возможно, что, сдирая фрагменты текста с других сайтов Google добавляет вес сайту донору. Но уж точно не увеличивает вес, где замечен плагиат. Однако если фрагмент текста берется в кавычки, и пишется откуда взята цитата, то Google считает, что тема глубоко изучена, а поэтому статья полезная. Конечно, если цитата из авторитетного сайта.

LSI — скрытое (латентное) семантическое индексирование. Методика, разрабатываемая Google, и др. поисковыми системами. Цель — улучшение понимания содержания страниц сайта для более точной сортировки и выдачи соответствующего запросу пользователя.

Если прежде было достаточно ключевую фразу повторить несколько раз на странице сайта, чтобы войти в ТОП 10 при выдаче, то сейчас поисковики считают такое повторение фразы поисковым спамом, и за это понижают рейтинг сайта. Если же поисковый СПАМ — на множестве страниц, то поисковик может исключить этот сайт из поиска.

Сейчас Google проводит семантический анализ страниц сайта, и на основании результатов их ранжировать.

Факторов, влияющих на скрытое семантическое индексирование много, но остановимся на 5-ти наиболее значимых.

1. Направленность сайта

Поисковые машины разделяют сайты по запросам пользователей.

Грубо все сайты делятся на 3 категории.

· У пользователя есть информационные намерение? Информационное намерение — это когда человек ищет информацию по теме. Например, «что такое LSI копирайтинг». Отчасти для таких запросов был создан фильтр Hummingbird.

· Имеют ли человек навигационные цели? Навигационное намерение заключается в том, что поисковик ищет конкретную марку (автомобиля, телевизора, др.), веб-сайт, бизнес или продукт, используя поиск.

· У ищущего есть транзакционные намерения? Транзакционные намерения — это когда человек ищет что-то, потому что хочет это купить. Если предполагаемая покупка не предполагает длительной перевозки, например, пиццы, дивана, садового домика, или покупка услуги, то это геозависимые запросы, то в работу вступают такие фильтры как Pigeon и др. Обо всех пойдет речи далее.

Исходя из намерений страница должна иметь кроме текста и дополнительные атрибуты.

Например, информационный сайт должен иметь поиск, навигацию по разделам, категориям, статьям, чтобы пользователь мог за пару кликов перейти от одного нужного материала к другому. А также комментарии к статьям, и многое другое. Чем больше атрибутов, соответствующих типу сайта, тем сайт имеет больший вес.

Интернет-магазин должен иметь кнопку купить, корзину, цену, описание товара, отзывы на товар, доступную ссылку на доставку. Трудно будет интернет-магазину выбиться в лидеры, если он не имеет всех дополнительных атрибутов, которые есть у лидеров этого запроса.

Например, интернет-магазин, лидер выдачи имеют всё необходимое по требованиям Google. Чтобы иметь шансы обойти лидера другому магазину, нужно иметь все эти же атрибуты, плюс добавить свою изюминку. Если у сайта лидера в магазине нет видео, то новому сайту можно добавить видео-демонстрацию товара. Конечно, у сайта лидера могут быть высокими и другие показатели, но с изюминкой у новичка появляется шанс.

Кроме оценки всего сайта на направленность, и с наличием необходимых атрибутов важную роль играет LSI копирайтинг страниц сайта.

2. Словосочетания

Если Вы в Гугл наберёте слово «Кухня», то Google не поймет, что нужно, и выдаст всего понемногу, по разным темам.

· Кухня смотреть.

· Кухни стран мира.

· Дизайн кухни.

· Кухонная мебель.

· И много другого.

Но если написать «Кухни смотреть», то поисковик поймет, что человек хочет посмотреть сериал, и ему будут выбраны сайты, на которых можно смотреть сериал.

Если же написать «Кухонная мебель», то будут ранжироваться сайты по этой тематике. Стоит добавить слово купить, и поисковик поймет, что человеку нужен интернет-магазин. Причем Google понимает, что по такому запросу нужно выбрать близлежащие магазины, а не магазины из которых доставка будет стоить дороже мебели.

Но это начало. Для поисковика если появилось слово «мебель», и статья посвящена этой теме, то дополнительно Гугл ищет и другие слова, которые часто употребляются со словом «мебель». Например, фото, гарнитура, дерево, стол, стул, и др.

Слову «концерт» сопутствуют слова: билеты, места, аншлаг, премьера, выступление. Если прежде для SEO было достаточно написать на странице слово «Концерт» несколько раз, и выбиться в лидеры, то теперь оценивается полезность по сопутствующим словам.

По технологии скрытого семантического индексирования, если слову «концерт», не будет найдено сопутствующих слов, то такая страница будет расценена как СПАМ. А под такой фильтр уже попало много сайтов.

Сравнивая несколько статей с разных сайтов Гугл позиционирует выше ту статью, в которой было употреблено больше сопутствующих слов. Чем больше сопутствующих слов в статье, тем Google считает тема раскрыта лучше, тем присваивается выше рейтинг статьи. Также учитывается и количество запросов по сопутствующим словам.

3. LSI-компоненты

Каждая веб-сайт должен иметь соответствующие дополнительные компоненты.

Например, если сайт некоторого доктора, то желательна форма для записи на прием, карта как добраться, сертификаты, и многое другое. Собрать сопутствующие компоненты можно посмотрев на первый десяток сайтов в поисковой выдаче, по соответствующим ключевым фразам. Если дополнительных компонентов на сайте будет недостаточно, то будет трудно рассчитывать па высокие места.

4. Синонимы

Повторение одной и той же фразы много раз на странице сейчас понижает релевантность. Поисковики считают, что такой текст плохо читается, а поэтому не интересен. Теперь пришло время синонимов — слова различные по звучанию, но совпадающие по значению.

Например, синонимы слова «дом»: здание, дворец, изба, хата, хижина, землянка, лачуга, мазанка, палата, хоромы, терем, чертог, усадьба, дача, вилла, загородный дом. Барак, балаган, беседка, будка, караулка, кибитка, куща, намет, палатка, сторожка, шалаш, чум, шатер, юрта.

Чем больше синонимов расстановлено в тексте, тем выше рейтинг статьи.

Синонимы можно брать из словарей синонимов, но латентное семантическое индексирование опирается опять-таки на запросы пользователей, именно на те синонимы, которыми наиболее часто пользуются люди.

Например, синонимами слову «обучение» являются: Подготовка, Образование, Бизнес-обучение, Учеба, Преподавание, и еще несколько десятков.

Задача LSI копирайтера в том, чтобы выбрать самые популярные, и равномерно их расставить по тексту.

5. Стоп-слова или шумовые слова

Прежде к стоп-словам относились союзы, предлоги, причастия, и др. Они считались не информационными, и не учитывались.

Теперь палитра стоп-слов заметно расширилась. К ним добавились некоторые прилагательные (если это информационная статья) и ряд «крылатых» выражений, например, «добро пожаловать на наш сайт», или «индивидуальный подход к каждому клиенту».

Поэтому не стоит писать подобные фразы: «У нас работают профессионалы с большим опытом работы». Это уже бесит не только читателей, но и поисковики.

Пользователь на эту фразу сразу же дает 2-а возражения.

· А у кого работают не профессионалы? И

· А у кого работают профессионалы без опыта?

Да и вообще разве есть профи без опыта?

Для поисковика же эта фраза — поисковый СПАМ.

Чем больше на странице шумовых слов и фраз, тем менее информативна статья. Тем ниже её рейтинг.

6. Легкость чтения

Сейчас у людей преобладает клиповое мышление. Это значит, что люди слабо воспринимают информацию, на изучение сути которой уходит больше времени, чем на просмотр клипа.

А это значит, что тексты должны быть как СМС. Предложения должны быть простыми, не более 160 печатных знака, которые выражают суть.

Л. Толстовские предложения на пол страницы — не годятся. Считается, что лучше писать простыми предложениями по 6—8 слов, потому как если предложение длинное — читатель забудет о том, что говорилось в начале. Тем более если текст сложный в осмыслении.

Чес проще, тем лучше для любой аудитории.

Google для определения читаемости текста возможно пользуется индексом Фога и формулой Флеша.

Во всяком случае что-то подобное Google включил в свои фильтры.

Суть индекса и формулы — просты. Чем меньше слов в предложении, и чем короче слова, тем текст более читаемый, а значит такие статьи получают и больший рейтинг.

Это и понятно. Ведь трудно поверить, что человек, зашедший на веб страницу, не имеет проблем. Невероятно, что у него ни о чем не болит голова, к примеру, его жене, детям, тёще от него ничего не надо…

Сейчас любой заходит на страницу, чтобы по-быстрому получить нужную информацию, и использовать её.

Поисковые системы прекрасно понимают направленность сайта.

Для научного, информационного или сайта-магазина язык подачи информации различен.

Если сайт, к примеру, новостной, то там не должно быть длинных и сложных предложений. Должно быть больше действия, глаголов и минимум превосходной степени. Информация действия!

Если же это литературный сайт, то предложения могут быть длиннее, для простора творческих фантазий. Конечно, если сайт рассчитан на то, чтобы человек просто расслаблялся на нем.

Так SEO оптимизация из набора ключевых фраз превращается в более сложную систему продвижения сайта. А LSI-копирайтинг помогает создавать более приемлемые тексты для читателей, и максимально релевантные для поисковых систем.

Авторитетный контент

Это

e. Что цитируют на других сайтах и в соц. сети.

f. LSI-объекты: сертификаты, галереи работ.

g. Возраст сайта, и другие сигналы, о которых будет рассказано далее.

h. Сертификация безопасности: сертификат SSL.

Продолжу, и укажу на некоторые значительные признаки авторитетности, которые определяются различными фильтрами.

Например, если пользователь ищет характеристики некоторого бренда, то большее доверие вызовет описание с официального сайта, чем с сайта некоторой ремонтной мастерской, а тем более с домашней странички какого-то Васи. Если же Вася захочет по некотором запросу обойти сайт Apple, то это невозможно — никакой ссылочной массы сайту Васи не хватит, чтобы превзойти всемирный бренд.

Наличие политики конфиденциальности указывает Google, что владелец веб-сайта заботится о соблюдении законов и обеспечении безопасности своего веб-сайта.

Контактная информация — ещё один сигнал, который повышает авторитет сайта. А лично вы к какому сайту испытывает большее доверие, на котором один телефон, или возможность связаться с разными людьми по разным номерам. Это говорит о том, что предприятие большое, и может себе позволить, чтобы разные люди отвечали на вопросы по разным темам.

Наличие адреса компании, её филиалов тоже увеличивает авторитет сайта.

Маленькие виджеты из социальных сетей, таких как VK или OK, с фотографиями людей, которым понравился этот конкретный сайт.

Авторитетный веб-сайт — действующий сайт, а это определяется по

· обновлениям, и новостям;

· активности в социальных сетях;

· текущий год в авторском праве.

Если сайт авторитетный, то на него ссылаются другие сайты. Чем выше авторитет ссылаемого сайта, тем выше авторитет сайта, на который ссылаются. Кроме этого, учитывается и схожесть тематики. Авторитета не добавит даже самый крутой сайт рецептов сайту по ремонту компьютеров.

Материал, публикуемый на сайте, должен быть актуальным, убеждать фактами и ссылками, на сайты подтверждающие эти факты.

Пользовательская проверка

После этой предварительной (для Google оценки) наступает пользовательская проверка.

Если посетитель зашел на страницу, пробыл там время необходимое для изучения, изложенного материала, то к рейтингу страницы по этому запросу добавляется дополнительный вес. Если пользователь после изучения страницы не вернулся обратно в поиск, то для Google — эта страница идеально отвечает на запрос. Чем больший процент пользователей не возвращается в поиск, тем ценнее эта страница при ответе на такой запрос пользователей. Google знает, что нет ничего совершенного, поэтому устраивает некоторую ротацию, и посмотреть на реакцию пользователей при изучении других сайтов. Кроме этого, есть и дополнительные фильтры, такие как Hummingbird (Колибри), Pigeon (Голубь), и другие, которые помогают молодым и перспективным сайта оказаться в верхней части первой страницы поиска.

Сейчас ещё в тренде покупать ссылки. Чем вsit ранжируется сайт, тем больше считается вес ссылки. Но это только первое время. Далее Google учитывает ценность этой ссылки количеством пользовательских переходов. Сколько должно быть переходов по ссылке, чтобы считать её качественной, очевидно рассчитывается как CTR (количество переходов по ссылки к количеству показов страницы). Очевидно, учитывается популярность страницы из расчета популярности запроса.

Конечно, ещё алгоритмы далеки от совершенства, и бывает, что Google выдает не понятный результат.

Посмотрите на пример, из которого видно, что Google определил, что в этом запросе для него главное купить в Риге, а не сам товар. Google понял, что ищется, зарядка (блок питания) для ноутбука, но почему-то проигнорировал марку и / или параметры. Заметьте, что Google СЕМЬ раз вывел один и тот же сайт, и ни разу именно ту зарядку, которую я тестировал в поиске, а она есть на сайте.

Этот пример говорит о том, что ещё не всё в алгоритмах идеально, и не более того. Google непрерывно работает над усовершенствованием ранжирования, и уже через пару недель ошибка была исправлена.

И хотя я работал над этим сайтом, когда остался один снипет из 7, но тот, который будет отсылать на нужный блок питания, я как оптимизатор доволен, потому что если пользователь ищет зарядку с определенными параметрами, то он не будет переходить на те зарядки, которые ему не нужны.

Другой пример. Обратилась к нам небольшая фирма с просьбой продвинуть их сайт. Бюджет на продвижение у них был весьма ограничен, и мы предложили им для начала на каждой странице проставить Meta Keywords, чтобы знать какую страницу оптимизировать под какую ключевую фразу. Page Title и Meta Description у них уже были прописаны.

Представляете, этого было достаточно, чтобы их сайт через некоторое время оказался в первой десятке. Да все ключевые фразы были низкочастотные, и конкуренция в их отрасли маленькая.

И всё же ключевые слова, на которые Google объявил много лет назад больше не учитываются, оказалось были учтены. Возможно, что ключевые слова не учитываются для определения направленности веб-страницы, но, очевидно влияют на качество и авторитет страницы, ведь тег Meta Keywords никто не отменял, и правила хорошего тона желают, чтобы этот тег был заполнен.

К слову сказать, что мы всегда прописываем ключевые слова для себя, чтобы видеть под какие запросы оптимизировалась страница.

Но вернёмся к идеологии идеального поиска по мнению Google.

Проделаем мысленный эксперимент, представьте, что вы приглашаете к себе в гости людей на банкет.

Что им предложить, если вам дороги эти люди, и желаете показать, что вы заботитесь о них?

Во-первых, то, что они любят. Затем, чтобы продукты были свежими, вкусными и качественными. Если вы заботитесь об их здоровье, то продукты должны быть полезными, без содержания вредных веществ.

Так поступают гостеприимные хозяева.

Тоже самое и с сайтом. Приглашая зайти на сайт, нужно, чтобы предлагаемый материал был качественным и полезным.

Кроме этого, хозяева застолья позаботятся о том, чтобы обслуживающий персонал был авторитетным: еда была вкусно приготовленная и подавалась быстро. Гостей не принято заставлять ждать. Само собой тарелки должны быть чистыми, салфетки свежими, и будут соблюдены ещё тысяча мелочей.

Google формально описал, что должно быть на сайте, подобно нормам хорошего банкета, и с помощью своих фильтров по этим критериям определяет полезность, качественность и авторитетность сайта, и декларировал их в своем Руководстве.

А теперь представьте, что хозяин, который претендует на звание лучшего будет жульничать, обещать одно, а подавать другое, и из недоброкачественных продуктов на грязных тарелках…

Заметьте, что Google из миллионов предложений выбирает лучшее и поднимает их в выдаче. Разве и это не справедливо?

Мне не нравится распространенное слово «пессимизация», т.е. понижение в рейтинге. Мне кажется, что более объективно говорить о повышении в рейтинге хороших сайтов. Почему менее качественные сайты должны быть выше лучших? Многие оптимизаторы воют на весь интернет, когда какой-либо алгоритм «считает», что его сайт хуже других. Но разве алгоритм виноват, что конкурент сделал лучше.

ДА! Уходит время халявы, когда материал на сайте искусственно подстраивался под определенный алгоритм оставался в лидерах надолго. Алгоритмы совершенствуются все быстрее и быстрее. Поэтому становится выгоднее работать на перспективу, следуя Руководству Google, чем пользоваться ещё неучтенными фактами, чтобы получить минутное признание.

Но есть алгоритмы создания высоко ранжируемых сайтов, следуя инструкциям, которых, даже в конкурентных нишах возможно получить хороший результат.

Да не все Пушкины, Шекспиры и Рубенсы, и с этим нужно смериться. Не все способны пробежать стометровку меньше, чем за 12 секунд. Не все способны сделать что-то стоящее, и стать первыми, но многие хотят, поэтому выискиваются лазейки, придумываются уловки, а в результате, как всегда, страдает конечный потребитель.

Вот и получается, аналогичная ситуация: несколько человек приглашают вас на банкет. Google оценивает у кого банкет лучше, туда и направляет посетителей. Тот, кто лучше направляет, к тому и обращается конечный пользователь, поэтому Google заинтересованы в качественном поиске.

Чтобы понять, что значит для Google качественный контент нужно не забывать, что ПОИСК — это бизнес, а продуктом этого бизнеса является результат выдачи. Чем качественнее выдача, тем больше людей пользуются этим поисковиком, а это уже монетизированный продукт. Каждая ключевая фраза, введенная пользователем в строке поиска для Google — это вопрос, на который пользователь хочет найти ответ.

Первая цель поисковика понять какой вопрос был задан. Эта задача как известно из обрывков заявлений Google об организации поиска состоит из двух частей.

Это по этим или подобным запросам подобрать лучшие сайты, которые прежде удовлетворили пользователей. Заметьте, не накрученные сайты, а реальные.

Это и на основании прежних запросов этого пользователя понять, что же заданным вопросом (введенной ключевой фразой) пользователь желает узнать. Например, если прежде человек искал характеристики телевизоров и сравнивал их, а после этого набрал в поисковике «мониторы», то вероятнее всего он желает сравнивать теперь мониторы. Если же, Google заметил, что пользователь купил уже и телевизор, и другое в интернет-магазинах, то вероятнее всего имеет намерение купить монитор. Ни для кого не секрет, что Google отслеживает действия пользователя, знает о его намерениях не хуже, чем сам пользователь, и «подсовывает» ему не только рекламу, но и страницы в рамках пожеланий пользователя.

Для Google постоянный пользователь социальных сетей — это открытая книга. Можно представить какой мощностью обладает Google, если сейчас при приеме на работу работодатели стали обращаться к небольшим формочкам, которые собирают в социальных сетях всю открытую информацию, например с кем дружит, на кого подписан, что комментирует и репостит. Вторая цель — подобрать страницы и вывести их пользователю первыми, чтобы ознакомившись с первой же, посетитель получил ответ на свой вопрос. Согласитесь, что эта задача — искусственного интеллекта, и все больше напоминает разговор людей: один задает вопрос, а другой отвечает. Заметьте Google оценивает и ранжирует разные ответы на поставленный вопрос.

Резюме от Google

Google — имея миллиарды страниц с помощью алгоритмов научился определять какие веб-страницы отвечают на запросы пользователей, а какие имитируют свою полезность.

К наиболее распространенным способам имитации качества полезности и авторитетности Google относит следующие:

· Автоматически сгенерированное содержание:

o Текст, который бесполезен для читателей, но содержит ключевые слова, часто используемые в поиске.

o Текст, который переведен с помощью автоматического инструмента и опубликован без редактирования.

o Текст, созданный с помощью автоматических средств, например, цепей Маркова.

o Текст, созданный автоматически с помощью методов подбора синонимов.

o Текст, сформированный путем копирования контента из фидов Atom/RSS или результатов поиска.

o Контент, скопированный с различных веб-страниц без добавления уникальной информации.

· Участие в схемах обмена ссылками, например,

o Покупка или продажа ссылок, которые учитываются в системе PageRank. К этой категории относится выплата денег за размещение ссылок или сообщений, содержащих ссылки, предоставление товаров или услуг в обмен на публикацию ссылок, а также раздача «бесплатных» товаров с условием размещения отзывов о них со ссылками.

o Чрезмерный обмен ссылками («Сошлись на меня, а я сошлюсь на тебя») и партнерские страницы, служащие исключительно для перекрестного обмена ссылками.

o Масштабная реклама с помощью статей или комментариев с текстовыми ссылками, насыщенными ключевыми словами.

o Использование программ или сервисов для автоматизированного создания ссылок на сайт.

o Требование разместить ту или иную ссылку в соответствии с условиями использования или другим соглашением, если при этом владельцу контента со стороннего ресурса не предоставляется возможность заблокировать PageRank доступ к своей странице, например, с помощью директивы nofollow.

· Публикация страниц с некачественным или скопированным контентом, например,

o автоматически созданное содержание;

o бесполезные партнерские страницы;

o плагиат, например, скопированное содержание или некачественные публикации в блоге;

· Маскировка, например,

o Предоставление поисковым системам страницы с HTML-текстом, а пользователям — страницы с картинками или Flash.

o Добавление на страницу текста или ключевых слов только в ответ на запрос этой страницы агентом пользователя, связанным с поисковой системой.

· Скрытая переадресация, например,

o Поисковый сканер анализирует одну страницу, а пользователям показывается совершенно другая.

o Пользователи компьютеров видят обычную страницу, в то время как пользователи смартфонов перенаправляются хакерами на совершенно другой домен.

· Скрытый текст и скрытые ссылки, например,

o Использовать текст белого цвета на белом фоне

o Поместить изображение поверх текста

o Поместить текст за пределами экрана с помощью CSS

o Установить для размера шрифта значение 0

o Скрыть ссылку, используя в качестве текста ссылки один незаметный символ (например, дефис в середине абзаца)

· Дорвеи, например,

o Несколько доменных имен или страниц с таргетингом на отдельные регионы или города для переадресации пользователей на одну и ту же страницу.

o Страницы, единственной целью которых является перенаправление пользователей в определенный раздел сайта.

o Практически одинаковые страницы, которые скорее соответствуют возможным результатам поиска, чем выстроены в четкую иерархию.

· Скопированное содержание, например,

o Сайты, размещающие контент из других источников без дополнительной обработки.

o Сайты, на которых публикуется скопированное содержание с незначительными изменениями (например, слова заменены синонимами или используются автоматические методы обработки).

o Сайты, транслирующие с других ресурсов фиды, без собственных функций для работы с ними.

o Сайты, содержащие только встраиваемый контент, например, видео, изображения и прочие мультимедийные материалы, с других сайтов без дополнительной значимой информации.

· Участие в партнерских программах, если вы не создаете контент самостоятельно, например,

o Страницы со ссылками на товары, на которых размещены только описания и отзывы, скопированные с сайта продавца, и отсутствует какой-либо уникальный контент.

o Бесполезные страницы, которые содержат преимущественно материалы из других ресурсов и минимум оригинального контента.

· Загрузка страниц с нерелевантными ключевыми словами, например,

o Список телефонных номеров без дополнительной информации

o Текстовые блоки с перечнем городов и областей, по запросам которых веб-мастер пытается повысить рейтинг страницы

o Многократное повторение слова или фразы, из-за чего текст не воспринимается как естественный.

· Создание вредоносных страниц для фишинга и установки вирусов, троянов или другого нежелательного ПО, например,

o Манипулирование контентом таким образом, что при нажатии пользователем на конкретную ссылку или кнопку фактически происходит нажатие на другой элемент страницы.

o Внедрение на страницы новых объявлений или всплывающих окон, или замена существующих объявлений другими, а также реклама или установка программного обеспечения, которое выполняет эти действия.

o Добавление нежелательных файлов при загрузке содержания, запрошенного пользователем.

o Установка вредоносного ПО, троянских программ, шпионского ПО, рекламы или вирусов на компьютер пользователя.

o Изменение домашней страницы в браузере или настроек поиска без ведома и согласия пользователя.

· Некорректное использование разметки для расширенных описаний веб-страниц.

· Автоматические запросы в Google.

Заметьте, что начинающему вэб-мастеру нужно неистово «стараться» для того, чтобы его сайт попал под бан поисковой системы.

Google редко применяет репрессивные меры, исключая из индекса сайты, ограничиваясь пессимизацией — искусственным понижением в позиции поисковой выдачи.

Для этого специалисты интернет гиганта предусмотрели несколько основных алгоритмов.

Оглавление

Купить книгу

Приведённый ознакомительный фрагмент книги «Поисковые алгоритмы ранжирования сайтов» предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Вам также может быть интересно

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я