Присайживайтесь, берите кофе, предстоит достаточно занятный разговор. Начнем с главной "новости" - гугл использует машинное обучение при ранжировании и оценке контента на на наших сайтах. Кратко и по делу на эту тему написано, например, в этой заметке от Moz. Более чем очевидно, что LSI и страницы под точные вхождения близких по смыслу ключей уже канули в лету и все упирается именно в интент (намерение) человека при поисковом запросе. Для оценки связки запроса / соответствия контента и используется машинное обучение, постепенно уменьшая погрешность и улучшая качество тех ответов, которые получает пользователь на свой запрос.
Вроде все предельно просто, остается только одна проблема - как узнать коэффициенты и степень релевантности для того контента, который мы размещаем у себя на сайтах.
Серьезно, какие метрики для оценки контента мы используем сегодня? Длинна, уникальность, водянистость, грамматика, может еще переспам и какой-нибудь сумасшедший индекс читаемости Ганнига.
Некоторые вообще предлагают просто "писать для людей" (в бурже тоже) без оглядки на семантику, мол и так зайдет. Который год не устаю смеятся с этой шутки.
Вообщем, остается главный вопрос - а реально ли эти факторы влияют на ранжирование больше, чем закрытие интента по запросу? Вот с этого момента давайте разбираться уже чисто в прикладной плоскости, потому что добавив одно к другому мы и получим тот буст, который нам сегодня поможет толкнуть свои обзорные сайты на немного другой уровень.
Поможет нам в этом сам же гугл. И это уже не обрезки каких-то фантастических коммерческих разработок, а рабочая модель, которую Google использует у себя прямо сейчас. Причем для своих измышлений нам хватит даже того обрезка который они отдают бесплатно. Находится он здесь: https://cloud.google.com/natural-language
Давайте возьмем что-то совсем очевидное, что бы посмотреть как с этим работать. Допустим запрос best travel mugs. На первом месте стоит https://www.thespruceeats.com/best-travel-mugs-4072909 на третьем https://www.roastycoffee.com/travel-mugs/. Берем плюс-минус первые два экрана (я захватил до второго товара) и скармливаем для анализа. Видим анализ слов на странице.
В первую очередь нас интересует Salience - уровень важности слова либо уверенности в его значении в рамках документа. Т.е. даже на этом скрине мы видим, что гугл прекрасно понимает что это про потребительские товары, которые продаются на Амазоне и писал это все некий автор.
Дальше, закладка Sentiment - оценка мнения о предмете обсуждения. ДА, у нас наконец-то появились внятные цифры от машины. Если мы выбираем лучшие товары, давайте предположим что и мнения о таких товарах должны быть положительными. Шкала выглядит следующим образом:
Но тут уже не надо быть гением что бы понять что зеленое - норм, желтое - ок и красное - неуд. Смотрим топ1:
Так же стоит убедится с какой вероятностью гугл относит этот текст к одной из категорий:
На закладке Syntax можно наблюдать как напряглась машина "вот этим всем", затратив скорее всего 0.001 сек. (надеюсь я не слишком оптимистичен с цифрой) на анализ.
А теперь внимание - вопрос в судию! Получив понятные коэффициенты по текстовке из топ1, что нам нужно сделать дальше?
ПРАВИЛЬНО - СРАВНИТЬ С ТЕМ ЧТО НАПИСАНО У НАСВозьмем все тот же топ3 от roastycoffee.com, я захватил кусок с таблицей и так же с обзором двух товаров:
Как говорится - HOLY F8CK! При том что сама текстовка выписана очень даже неплохо - обьясняют как работает кружка, нагрев, красивая табличка и все как любят на типичных статейниках. Но этот супертематический сайт по кофе стоит именно там где стоит, отчасти потому что в топ1 гугл видит, что видит... давайте сравним вместе:
Топ1. https://www.thespruceeats.com
- Амазон
- Утренний кофе
- Напитки
- Кружка для похода
- Выбор
- Редактор
Топ3. https://www.roastycoffee.com/
- Забота
- Кофе
- Кружка
- Цель
Ну как разница? А теперь эмоциональный окрас текстовки:
И самое интересное, оценка категории к которой относится текст
Да-да, поисковик уверен что это скорее про КОФЕ как напиток, а не про КРУЖКУ ДЛЯ КОФЕ, как изделие. Теперь, видя по цифрам, следующий вопрос - какая текстовка полнее закрывает интент пользователя? Ведь очевидно что та, где про "выбор кружек", а не "про кофе для кружек для кофе". Да, делаем выводы и идем дооптимизировать свои сайты.
Поздравляю, мы только что стали на шаг дальше от большинства типичных индусов 😄
Оптимизируем дальше
Если думали что все, то нет. Идем в выдачу картинок (не удивляйтесь). Объясняю логику - картиночная выдача работает по тем же принципам, с той лишь разницей что ей нужно закрывать интент на графику. Нас интересуют ключевые слова которые всплывают на первой странице такой выдачи. Смотрим.
В данном случае довольно скудно, но все же. Мы видим что в статью нужно добавить кружки которые:
- Удобны в транспорте
- Подойдут для подарка
- Стальные
- Хорошо держат температуру
- Многоразового использования (мелкие, как замена стаканчику)
С ходу, из картинок, без каких либо платных инструментов мы апгрейдим статью тем, что будет забирать НЧшку и закрывать интент.
И еще дальше
Смотрел NaZapad 13, а конкретно часовой доклад про LightHouse. Скажу честно - про этот Lighthouse вообще раньше не слышал, и меня как гуманитария пригрузило вообще неслабо, если не сказать, что накрыло. Но, крайне убедительные выводы отрицать нельзя, и погуглив убедился что сами гугловцы говорят что это таки у них один из факторов ранжирования. Причем, очень хотелось видеть все в понятных "попугаях", ну, как в старом добром gtmetrix'е и через сервис, а не через девтул браузера. И вот, оказывается есть у них в гугле такая тулза. Идем на https://web.dev/ и находим внизу вот такую кнопку
А теперь сравним, топ1, топ3 и, скажем, топ8. Ну и там же рекомендации что нужно исправить.
Убедиться, что мы смотрим на "попугаев" именно в LightHouse можем по ссылке подробного отчета.
Так что теперь подтянув пузомерки в GTmetrix не расслабляемся и идем еще дорабатывать под Lighthouse. У меня все, надеюсь было полезно.
Апдейты статьи
03.05.2020
Корреляция топа относительно значений Sentiment - здесь.
Объектная оптимизация контента - здесь.
Зачетный тестдрайв, так что простой рерайт и побольше ключиков по теме и все, а как же умные гугл шмугл?
Так, что это все работает только в комплексе с кондовой сеошкой. Добавил к ней YMYL — плюс, добавил под лайтхаус — плюс, добавил нормальное ссылочное — плюс, подклеил дроп — плюс и так далее. Все зависит от ниши в которую заходишь. А так, можно конечно упрощать до «рерайт по теме и все», но это тогда в рушку инфосайты делать 😀
Отличный анализ, Слав респект!
Спасибо.
Всё бы хорошо, но до сих пор основной фактор— это ссылки, как ни вылизывай контент, всё равно топа не будет.
На второе место я бы поставил тематичную релевантность сайта или кластера на сайте.
А дальше уже интент страницы, поведенческие, скорость загрузки, канибализация и всё остальное.
Это мои наблюдения, по мере убывания факторов расположил.
Так хорошо или плохо в итоге? 😀 В остальном — чем больше оптимизации, тем меньше ссылочного (отнюдь не дешевого) понадобится и тем более долгоиграющим будет сам ревьюшник. Пора начинать писать и про линкбилдинг похоже, согласен что ссылки никто не отменял.
И не хорошо, и не плохо, просто факт.
И я бы отметил совсем другую вещь в этих страницах- это интент, за которым зашёл пользователь.
В первом случае сразу идёт список с хорошим описанием преимуществ, затем идёт обзор товаров,- это зачем непосредственно приходят посетители.
Во втором примере тоже есть список в начале, но он какой-то скучный, непонятный, не даёт чёткий ответ, что из этого надо купить. Далее идёт кусок воды о том, как хорошо взять в дорожку горячего кофе (да я знаю, я за этим и пришёл на сайт111, не надо писать на сайте мой вопрос, дайте мне ответ111), и только потом самые усердные долистают до обзора и ответа на свой вопрос.
Поведение, вот и весь ответ.
Текст тоже играет важную роль, но в данном случае интент более важен.
Ссылочное и скорость сайта даже смотреть не будем, в данном случае тут и так всё ясно.
Проблема только в том что «скучный» и «непонятный» это субьективзим, а не метрика со значением 🙂
Все круто, а для русскоязычных сайтов через что можно проверить вместо https://cloud.google.com/natural-language а то он русский не поддерживает. Sentiment и категорию не определеяет
Наверняка у Яндекса есть какой-то очередной неудачный клон, но это не точно 🙂
прочитал с удовольствием, спасибо-)
Пора писать начальству, уже не первый и даже не второй 🙂
Велкам!
Вячеслав, спасибо. Вас, как гуманитария, все интересней читать. Периодически возникают вопросы, сегодня даже решил задать. Лайтхаус интересная штука, но вам удалось добиться захода в зеленую зону? Я вывел, но в консоли все равно средняя скорость. Потому что лайтахус это только инструмент, а гугля снимает в браузере. И получается что лайтхаус 92, GTmetrix 99 по обеим системам подсчета, а серч консоль — давай до свидания. Типа слишком долгий ответ сервера. И я вам скажу, это можно победить, но уже нужно залазить в дебри, а желания нет. По сути, гуглоиды слишком высоко задрали эту планку. Им бы пересмотреть порог зеленый зоны.
Переходи на amp, помогает.
Отказались от amp уже достаточно давно (если что).
Привет, Вячеслав.
Не используете — это из-за того, что использование AMP страниц формально противоречит правилам амазона (из за того, что отгрузка AMP траффика идет с домена Гугла)? Вроде на blackhatworld видел тред о потерее акка из-за AMP.
Ахах, спасибо 🙂 да удалось, но не совсем мне — Олегу, который это все это оптимизирует и постоянно допиливает для наших сайтов. А так, у нас в ТГ группе есть парень который настраивает это все «под ключ», стукнись к @themikex по стоимости/условиям если нужно.
Спасибо за контакты. Ради интереса — зайди в консоль и посмотри, как она отобразит ваши быстрые сайты. Зеленое в лайтхаусе еще ничего не значит.
Мы говорим про дооптимизацию того что уже и так оптимизировано.
Проверил web.dev, жаль картинку нельзя прикрепить для убедительности.
У меня Lighthouse показывает везде 100, кроме Accessibility, который 94 🙂 Страницы под НЧ, Конкуренты намного медленнее. Но траста домена все равно не хватает, поэтому болтаюсь пока на 20-70 позициях.
По анализу текста — спасибо. Интересно попробовать создать идеальную генеренку 🙂
Велкам, рад что пригодилось.
В скором времени появятся алгоритмы, которые будут писать идеальный, с точки зрения понимания Google, текст. И не нужны копирайтеры 🙂
Да, читал такие теориии, а программисты станут гуманитариями, которые будут пиарить продукты которые будет писать за них машина.
сори за оффтоп, амазон снизил комиссия то смешных 3%, 1% :(( есть на примете стоящие партнерки?
Есть — Амазон 🙂
Полезная статья, спасибо!
Пожалуйста. Но рекламировать здесь свои купоны не нужно, линк потер.