Связаться со мной

Оптимизация страниц пагинации: 6 способов управления индексацией и каких ошибок следует избегать

187
18 минут

В статье расскажу, как оптимизировать страницы пагинации в интернет-магазинах, информационных сайтах, форумах. Информация будет полезной начинающим SEO-специалистам и владельцам сайтов, занимающихся продвижением самостоятельно.

Полное содержание

  1. Что такое пагинация на сайте и для чего она нужна
    1. Причина 1. Скорость загрузки страницы
    2. Причина 2. Больше страниц — больше рекламных блоков
  2. 6 способов управления индексацией страниц пагинации
  3. 3 частые ошибки
  4. Выводы

Что такое пагинация на сайте и для чего она нужна

Пагинация (от анг. page) — разделение контента в разделе сайта на отдельные документы для оптимизации скорости загрузки страницы.

Чаще всего мы ее встречаем:

  • В категориях товаров интернет-магазинов;
  • В рубриках информационных сайтов;
  • В обсуждениях на форумах;
  • В длинных статьях и онлайн-книгах;
  • В галереях;

Причина 1. Скорость загрузки страницы

Для примера я возьму случайный интернет-магазин и выберу категорию со 173 товарами, разбитыми на 6 страниц по 30 товаров на каждой. На сайте не настроено кеширование, сжатие, не оптимизированы скрипты, стили и шрифты, поэтому скорость загрузки страниц изначально низкая, но сравнение нагрузки все равно наглядное.

Страница категории с пагинацией по 30 товаров

Страница категории с отображением 173 товаров

Изменение

Количество элементов DOM

2 407

4 342

80%

Размер страницы, kb

3 698

4 858

31%

Из них HTML, kb

516

14%

660

14%

28%

Из них шрифты, kb

212

6%

212

4%

0%

Из них CSS, kb

163

4%

163

3%

0%

Из них JS, kb

2070

56%

2070

43%

0%

Их них изображения, kb

737

20%

1754

36%

138%

Количество запросов

121

226

87%

Из них изображений

60

50%

165

73%

175%

Использовано оперативной памяти в Chrome, Mb

160

210

31%

Таким образом, пагинация сокращает размер страницы, уменьшая количество запросов к серверу, используется меньше оперативной памяти, что в совокупности влияет на скорость загрузки страницы.

Причина 2. Больше страниц — больше рекламных блоков

Это актуально для форумов, онлайн-книг, длинных статей и прочих видов контента, где высокая вовлеченность.

Например, вы решили купить новый монитор, который удовлетворит ваши потребности — Ultra HD, естественная цветопередача для работы, звук — для фильмов и игр, дизайн — для души. Вы находитесь на четвертой ступени лестницы узнавания Ханта и выбираете между вариантами.

Вещь дорогая, одних характеристик и красивых фотографий недостаточно, требуется взвешенное решение. Вам нужны обзоры и отзывы. Скорее всего в цепочке исследования вы попадете на форум Overclockers или iXBT. Вы нуждаетесь в информации, поэтому будете изучать страницу за страницей в обсуждениях. На Overclockers на одной странице 5 рекламных блоков при 21 сообщении, на iXBT — 9 при 29. Если вы просмотрите 10 страниц, то увидите 50 и 90 рекламных блоков соответственно.

6 способов настроить индексацию страниц пагинации

Я перечислю способы в порядке от менее предпочтительных к оптимальному.

rel=next/prev

Этот способ занимает последнее место, потому что теги next/prev с 21.03.2019 больше не поддерживаются Google и никогда не поддерживались Яндексом. Я включаю этот способ в список, потому что еще несколько ближайших лет он будет встречаться на сайтах.

Отсутствие запрета на индексацию

Не закрывать страницы пагинации от индексации следует на форумах, в книгах и статьях, где на каждой странице уникальный контент, который следует индексировать несмотря на то, что у них может быть одинаковый заголовок.

В интернет-магазинах, рубриках статей, галереях отсутствие указаний приводит к образованию частичных дублей и, как следствие, размытию релевантности и каннибализации ключевых слов.

Например, запросу «купить {category-name}» будут релевантны страницы:

  • /category-name/
  • /category-name/?page=2
  • /category-name/?page=n

Атрибут noindex, nofollow или директива Disallow в robots.txt

В обоих случаях страницы запрещено индексировать. Это решает проблему каннибализации, но несет существенный недостаток.

Поисковые системы, сканируя сайт, не индексируют содержание страниц, не переходит по ссылках и не передают вес на внутренние страницы. Таким образом, карточки товаров и статьи могут не проиндексироваться, а вес, передаваемый на страницы пагинации, уйдет в никуда.

Несмотря на то, что оба способа не оптимальны, закрытие от индексации в robots.txt предпочтительней тегов noindex, nofollow. Во втором случае бот перейдет на страницу, начнет сканировать и остановится на директиве

<meta name="robots" content="noindex, nofollow">

Таким образом, он потратит ресурсы на сканирование и создаст нагрузку на сервер.

Если страницы пагинации закрыты в robots директивой Disallow, то бот не перейдет на них. Это позволит сэкономить ресурс на сканирование и уменьшит нагрузку на сервер на больших сайтах.

Важно. Ни один из этих способов не гарантирует, что страницы не попадут в индекс. Бывает, что они индексируются, но со временем выпадают.

Атрибут rel=canonical на страницу «Показать все»

Этот способ рекомендовали в Google и Яндекс, но на момент написания статьи страницы удалены.

Елена Першина о canonical на view all
Рисунок 1. Сохраненный комментарий Елены Першиной

Implement a View All page. Searchers commonly prefer to view a whole article or category on a single page. Therefore, if we think this is what the searcher is looking for, we try to show the View All page in search results. You can also add a rel=»canonical» link to the component pages to tell Google that the View All version is the version you want to appear in search results. Цитата из удаленной страницы справки Search Console

С одной стороны выглядит логично, так как каждая страница пагинанации частично дублирует общую со всеми товарами. С другой — есть существенный недостаток. Пользователь, переходя на сайт из поисковой системы, столкнется с с загрузкой тяжелой страницы со множеством изображений, что увеличит трафик, уменьшит скорость и заполнит оперативную память. Словом, со всем тем, для чего документ и разделяют на отдельные страницы.

Атрибут noindex, follow

До марта 2019 года я считал этот способ оптимальным.

Если на первую страницу указать canonical, то это противоречило бы настройкам пагинации для Google, так как при использовании next, prev canonical следовало указывать «на себя». Поэтому отдельно для Яндекса можно было указать:

<meta name="yandexbot" content="noindex, follow">

Таким образом, Google-бот обрабатывал страницы пагинации по-своему, а Яндекс, в соответствии указаниям, переходил бы по ссылкам, индексировал карточки товаров или статьи, при этом не добавлял страницы пагинации в индекс.

rel=canonical на первую страницу

Этот способ с 2015 года официально рекомендует Яндекс.

Еще недавно Google в справке указывал, что canonical следует использовать на страницах с идентичным контентом. Это не относилось к контенту на страницах пагинации, так как на них содержание всегда уникальное, а одинаковый только заголовок. В текущей версии руководства дается такое определение.

Каноническим называется URL страницы, которую роботы Google считают главной среди нескольких ее вариантов на вашем сайте. Например, если одна и та же страница размещена по нескольким URL, таким как example[dot]com/?dress=1234 и example[dot]com/dresses/1234, одна из версий будет выбрана в качестве канонической. Обратите внимание, что страницы могут быть не полностью идентичными. Они могут различаться, например, настройками фильтров или сортировки (сортировка по цене или фильтрация товаров по цвету не делают страницу уникальной).

Это значит, что после упразднения тегов next/prev Google дает зеленый свет на применение canonical и для пагинации.

При этом способе внутренние страницы индексируются, вес распределяется по внутренним ссылкам, а вес самой страницы пагинации передается на первую каноническую страницу.

Елена Першина о сравнении canonical и next-prev
Рисунок 2. Елена Першина в комментарии заявила, что canonical не будет препятствовать индексации товаров и его свойства соответствуют тегам next/prev от Google.

3 частые ошибки

  1. Первая страница пагинации имеет свой алиас
  2. Распространенная ситуация, когда есть рубрика /category/, где после переключения на вторую и последующие страницы, у первой появляется свой идентификатор. Например, ?page=1. Тем самым образуется полный дубль заглавной страницы рубрики. Некоторые веб-мастера ставят 301 редирект, однако это решает проблему лишь частично. Редиректы создают лишнюю нагрузку на сервер при обходе, а также замедляют загрузку страниц. Для внутренних ссылок используйте их, чтобы указать поисковым ботам новый адрес. Ссылки со старыми адресами заменяйте на новые. Необходимо, чтобы на месте первой страницы стояла прямая ссылка на рубрику без идентификатора.

  3. Бесконечная прокрутка на AJAX
  4. Когда пользователь опускается вниз страницы, подгружаются новые товары. Этот способ можно использовать, если в рубрике товаров на 2-3 дополнительные страницы. Если товаров несколько сотен, то это противоречит пользовательскому опыту. В подвале сайта может находиться важная информация или навигация. Пользователь не сможет до нее добраться, пока не загрузит все карточки товаров. Особенно иронично это выглядит, когда под пагинацией расположен SEO-текст, который в связи с этим невозможно прочитать

    Пагинация на AJAX удобна и полезна пользователям, если ее использовать обдуманно. Вместо бесконечной прокрутки сделайте кнопку «Показать еще», при клике на которую будут подгружаться новые товары или статьи. (см. рис. 3)

  5. Подгрузка товаров на AJAX при отсутствии классической пагинации
  6. Если контент подгружаются на AJAX при прокрутке или по клику «Показать еще», но при этом нет ссылок на страницы пагинации, то карточки товаров или статьи могут не проиндексироваться и недополучить вес, потому что поисковые боты все еще плохо обрабатывают JavaScript.

    Динамическую подгрузку товаров сочетайте с классической пагинацией.

Елена Першина о сравнении canonical и next-prev
Рисунок 3. В интернет-магазине «Розетка» страницы пагинации на AJAX подгружаются при клике на кнопку «Показать еще 32 товара», при этом динамическая пагинация сочетается с классической.

Выводы

  1. Пагинация нужна для оптимизации скорости загрузки страниц, трафика и нагрузки на сервер, а также для увеличения показов рекламных блоков на форумах, в длинных статьях, где высокая степень вовлеченности пользователя;
  2. Не закрывайте от индексации страницы пагинации на форумах, в статьях и книгах;
  3. Ограничивайте индексацию страниц пагинации в категориях товаров, рубриках статей, галереях изображений;
  4. Google больше не учитывает теги next/prev;
  5. Оптимальный способ управления индексацией страниц пагинации, который поддерживает Яндекс и Google — использовать атрибут rel=canonical;
  6. Не полагайтесь только на AJAX-пагинацию. Несмотря на положительный пользовательский опыт, сочетайте ее с классической для эффективной индексации контента.
Автор
Занимаюсь интернет-маркетингом, руковожу проектами, выстраиваю бизнес-процессы. Основная специализация - оптимизация сайтов под поисковые системы (SEO). Консультирую, делаю аудиты.