Техническое SEO

Пагинация в SEO

Пагинация в SEO — настройка для поисковых систем

Как пагинация влияет на краулинговый бюджет и индексацию, когда применять noindex и canonical, примеры кода для HTML, PHP и sitemap.

Пагинация — разбивка большого списка на страницы с отдельными URL: /catalog/page/2, /catalog/page/3. Технически просто, но именно пагинация чаще всего «съедает» краулинговый бюджет на крупных сайтах. Googlebot обходит сотни шаблонных страниц вместо карточек товаров — и часть ассортимента так и не попадает в индекс.

Что такое пагинация

Пагинация — разбивка большого массива контента (товаров, статей, отзывов) на последовательные страницы с уникальными URL. Стандартные паттерны: /catalog/?page=2, /catalog/page/2/, /catalog/2/. Поисковик воспринимает каждую из них как отдельный документ.

Googlebot обходит страницы пагинации последовательно. На крупных каталогах глубокие страницы получают меньше краулов — новые товары индексируются с задержкой.

Три формата пагинации ведут себя с точки зрения SEO принципиально по-разному:

Формат 1Нумерованные страницы

Кнопки «1 2 3 ... 100», каждая — отдельный URL. Гибко настраивается: noindex, canonical или полная индексация.

Формат 2Бесконечная прокрутка

Контент подгружается по скроллу без смены URL. Без JavaScript-рендеринга Googlebot видит только первый экран. Требует HTML-fallback.

Формат 3Кнопка «Загрузить ещё»

URL не меняется, контент добавляется по клику. Аналогичная проблема с краулингом — без рендеринга JS видна только первая порция контента.

Краулинговый бюджет и дублированный контент

Интернет-магазин с 500 товарами и 20 позициями на страницу генерирует 25 URL пагинации на одну категорию. При 50 категориях — уже 1250 URL, каждый из которых Googlebot обходит прежде, чем доберётся до карточек товаров.

Реальный кейс. Интернет-магазин электроники, 8000 SKU. Пагинация без noindex — 400+ URL категорийных страниц. Новые товары попадали в индекс через 3–4 недели. После закрытия пагинации через noindex, follow время индексации сократилось до 3–5 дней.

Три конкретных проблемы, которые пагинация создаёт для SEO:

  • Дублированный контент. Title и Description категории одинаковы на /page/1 и /page/15. Заголовок раздела повторяется. Google видит схожие страницы и не понимает, какую показывать в выдаче.
  • Разбавление ссылочного веса. Внутренние ссылки делятся между десятками URL пагинации. Товары на странице 10+ получают минимальный PageRank.
  • Перерасход краулингового бюджета. На небольших и средних сайтах Googlebot тратит ресурс на шаблонные страницы вместо приоритетного контента.

Сравнение форматов пагинации

ФорматКраулингДублиSEO-решение
Нумерованные страницыПолный обход всех URLЕсть (Title/Description)noindex / canonical / полная индексация
Infinite ScrollТолько 1-й экран без JSНет (один URL)HTML-fallback + рендеринг
«Загрузить ещё»Только видимый контентНет (один URL)SSR или рендеринг JS

Стратегии SEO-настройки

Выбор стратегии зависит от одного вопроса: несут ли страницы 2+ самостоятельную ценность? Если пользователь никогда не приходит на /catalog/page/7 из поиска — незачем тратить на неё краулинговый бюджет.

Выбор стратегии: блог закрывает пагинацию через noindex, крупный e-commerce индексирует полностью с уникальными мета-тегами, средний каталог — canonical на первую страницу.

Стратегия 1 — noindex на страницы 2+. Оптимальна для блогов, новостных и контентных сайтов. Страницы пагинации не несут самостоятельного поискового смысла — `noindex` закрывает их от индексации, сохраняя follow для обхода ссылок. Краулинговый бюджет уходит на контент, а не на шаблонные списки.

Стратегия 2 — rel=canonical на страницу 1. Мягче noindex: страницы 2+ остаются доступными (для прямых ссылок, рекламы), но canonical указывает на /page/1. Google понимает: это продолжение одного раздела, основная версия — первая страница.

Стратегия 3 — полная индексация. Для крупного e-commerce, где каждая страница пагинации содержит уникальные товары. Требует уникальных Title и Description для каждой страницы вида «Ноутбуки купить — страница 3» и self-referencing canonical (каждая страница ссылается сама на себя).

Простой тест для выбора стратегии: откройте GSC → «Эффективность» и отфильтруйте URL по паттерну /page/. Если страницы пагинации дают ненулевой трафик — подумайте дважды перед noindex.

Технические реализации

Большинство задач решается тремя конструкциями в <head>: <meta name="robots">, <link rel="canonical"> и записями в sitemap.xml. Рассмотрим каждую с примерами кода.

rel=next/prev: устаревший атрибут

До 2019 года Google поддерживал rel="next" и rel="prev" для обозначения серии пагинации. В марте 2019 Google объявил об отказе от их поддержки. Добавлять эти атрибуты ради Google — бессмысленно. Bing формально их поддерживает, но доля Bing в большинстве рунет-проектов незначительна.

Источник: официальный блог Google Search Central, март 2019 — «An update on rel-prev-next». Google прямо написал: «we've been using these as a hint, but dropping them doesn't affect indexing».

noindex для страниц пагинации

Добавляется в <head> на страницах 2+. Важный нюанс: используйте noindex, follow, а не noindex, nofollow — иначе Googlebot не перейдёт по ссылкам со страниц пагинации и не проиндексирует товары.

HTML
<!-- Страница /catalog/page/2/ и выше -->
<head>
  <meta name="robots" content="noindex, follow">
</head>

<!-- Страница /catalog/ (первая страница) — без noindex -->
<head>
  <meta name="robots" content="index, follow">
</head>

В WordPress условие обычно реализуют через хук wp_head с проверкой is_paged():

PHP
// functions.php
add_action('wp_head', function() {
    if (is_paged()) {
        echo '<meta name="robots" content="noindex, follow">' . "\n";
    }
});

rel=canonical на первую страницу

Когда страницы 2+ должны быть доступны, но не дублировать раздел — canonical указывает на первую страницу. Первая страница получает self-referencing canonical.

HTML
<!-- /catalog/page/3/ -->
<head>
  <link rel="canonical" href="https://example.com/catalog/">
</head>

<!-- /catalog/ — self-canonical (обязательно) -->
<head>
  <link rel="canonical" href="https://example.com/catalog/">
</head>
Canonical — подсказка (hint), не директива. Google может проигнорировать его и проиндексировать страницу 3 как самостоятельную. Если нужна гарантия — используйте noindex.

Пагинация в sitemap.xml

Правило: в sitemap включайте только страницы, открытые для индексации. Страницы с noindex в sitemap — это конфликт сигналов, который тратит краулинговый бюджет.

XML
<!-- sitemap.xml — только индексируемые страницы -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

  <!-- Страница 1 — всегда включаем -->
  <url>
    <loc>https://example.com/catalog/</loc>
    <changefreq>daily</changefreq>
    <priority>0.8</priority>
  </url>

  <!-- Страницы 2+ — только при стратегии полной индексации -->
  <url>
    <loc>https://example.com/catalog/page/2/</loc>
    <changefreq>weekly</changefreq>
    <priority>0.4</priority>
  </url>

</urlset>

Типичные ошибки пагинации

Большинство ошибок — не от незнания, а от невнимательной реализации. CMS-генераторы sitemap и шаблоны meta-тегов часто не учитывают пагинацию:

noindex попал на страницу 1

Условие if page > 1 написано неверно — noindex получает и главная страница категории. Трафик раздела падает до нуля за несколько недель.

Ошибка 1
Страницы noindex в sitemap

Генератор sitemap автоматически добавляет все URL. Google получает конфликт: sitemap говорит «индексируй», meta robots — «нет». Краулинговый бюджет тратится впустую.

Ошибка 2
Canonical ведёт на несуществующий URL

Первая страница — /catalog/, но canonical со страниц 2+ указывает на /catalog/page/1/ (которой нет, 404). Google получает битую цепочку canonicals.

Ошибка 3
Infinite scroll без HTML-fallback

Вся пагинация на JavaScript, статических URL нет. Googlebot видит только первые N позиций — остальные товары в индекс не попадают.

Ошибка 4
Одинаковый Title на всех страницах пагинации

При полной индексации все страницы получают один Title. Google видит дублированный контент и снижает релевантность раздела. Каждая страница должна иметь уникальный мета-тег с указанием номера страницы.

Ошибка 5

Найти большинство ошибок можно в Google Search Console → «Покрытие»: страницы с noindex, исключённые URL и конфликты canonical видны в отчёте сразу.

Зависит от типа сайта. Для блогов и новостных сайтов — да, страницы 2+ не несут самостоятельной ценности и расходуют краулинговый бюджет. Для крупного e-commerce — нет: каждая страница содержит уникальные товары, которые важно проиндексировать.
Нет. С марта 2019 года Google официально отказался от обработки rel=next и rel=prev. Bing формально поддерживает, но для Google эти атрибуты не влияют на индексацию.
noindex — директива, страница гарантированно не попадёт в индекс. Canonical — подсказка, Google может проигнорировать. Если нужна гарантия — noindex. Если страницы нужны для прямых ссылок или рекламных кампаний — canonical мягче.
Негативно без HTML-fallback. Без рендеринга JavaScript Googlebot видит только контент первого экрана. Решение: реализовать статические URL для каждой порции контента или обеспечить серверный рендеринг (SSR).
Только если они открыты для индексации. Страницы с noindex в sitemap создают конфликт сигналов и расходуют краулинговый бюджет. Включайте в sitemap только те URL, которые хотите видеть в индексе.