Техническое SEO
Пагинация в SEO

Как пагинация влияет на краулинговый бюджет и индексацию, когда применять noindex и canonical, примеры кода для HTML, PHP и sitemap.
Пагинация — разбивка большого списка на страницы с отдельными URL: /catalog/page/2, /catalog/page/3. Технически просто, но именно пагинация чаще всего «съедает» краулинговый бюджет на крупных сайтах. Googlebot обходит сотни шаблонных страниц вместо карточек товаров — и часть ассортимента так и не попадает в индекс.
Что такое пагинация
Пагинация — разбивка большого массива контента (товаров, статей, отзывов) на последовательные страницы с уникальными URL. Стандартные паттерны: /catalog/?page=2, /catalog/page/2/, /catalog/2/. Поисковик воспринимает каждую из них как отдельный документ.
Три формата пагинации ведут себя с точки зрения SEO принципиально по-разному:
Кнопки «1 2 3 ... 100», каждая — отдельный URL. Гибко настраивается: noindex, canonical или полная индексация.
Контент подгружается по скроллу без смены URL. Без JavaScript-рендеринга Googlebot видит только первый экран. Требует HTML-fallback.
URL не меняется, контент добавляется по клику. Аналогичная проблема с краулингом — без рендеринга JS видна только первая порция контента.
Краулинговый бюджет и дублированный контент
Интернет-магазин с 500 товарами и 20 позициями на страницу генерирует 25 URL пагинации на одну категорию. При 50 категориях — уже 1250 URL, каждый из которых Googlebot обходит прежде, чем доберётся до карточек товаров.
noindex, follow время индексации сократилось до 3–5 дней.Три конкретных проблемы, которые пагинация создаёт для SEO:
- Дублированный контент. Title и Description категории одинаковы на
/page/1и/page/15. Заголовок раздела повторяется. Google видит схожие страницы и не понимает, какую показывать в выдаче. - Разбавление ссылочного веса. Внутренние ссылки делятся между десятками URL пагинации. Товары на странице 10+ получают минимальный PageRank.
- Перерасход краулингового бюджета. На небольших и средних сайтах Googlebot тратит ресурс на шаблонные страницы вместо приоритетного контента.
Сравнение форматов пагинации
| Формат | Краулинг | Дубли | SEO-решение |
|---|---|---|---|
| Нумерованные страницы | Полный обход всех URL | Есть (Title/Description) | noindex / canonical / полная индексация |
| Infinite Scroll | Только 1-й экран без JS | Нет (один URL) | HTML-fallback + рендеринг |
| «Загрузить ещё» | Только видимый контент | Нет (один URL) | SSR или рендеринг JS |
Стратегии SEO-настройки
Выбор стратегии зависит от одного вопроса: несут ли страницы 2+ самостоятельную ценность? Если пользователь никогда не приходит на /catalog/page/7 из поиска — незачем тратить на неё краулинговый бюджет.
Стратегия 1 — noindex на страницы 2+. Оптимальна для блогов, новостных и контентных сайтов. Страницы пагинации не несут самостоятельного поискового смысла — `noindex` закрывает их от индексации, сохраняя follow для обхода ссылок. Краулинговый бюджет уходит на контент, а не на шаблонные списки.
Стратегия 2 — rel=canonical на страницу 1. Мягче noindex: страницы 2+ остаются доступными (для прямых ссылок, рекламы), но canonical указывает на /page/1. Google понимает: это продолжение одного раздела, основная версия — первая страница.
Стратегия 3 — полная индексация. Для крупного e-commerce, где каждая страница пагинации содержит уникальные товары. Требует уникальных Title и Description для каждой страницы вида «Ноутбуки купить — страница 3» и self-referencing canonical (каждая страница ссылается сама на себя).
/page/. Если страницы пагинации дают ненулевой трафик — подумайте дважды перед noindex.Технические реализации
Большинство задач решается тремя конструкциями в <head>: <meta name="robots">, <link rel="canonical"> и записями в sitemap.xml. Рассмотрим каждую с примерами кода.
rel=next/prev: устаревший атрибут
До 2019 года Google поддерживал rel="next" и rel="prev" для обозначения серии пагинации. В марте 2019 Google объявил об отказе от их поддержки. Добавлять эти атрибуты ради Google — бессмысленно. Bing формально их поддерживает, но доля Bing в большинстве рунет-проектов незначительна.
noindex для страниц пагинации
Добавляется в <head> на страницах 2+. Важный нюанс: используйте noindex, follow, а не noindex, nofollow — иначе Googlebot не перейдёт по ссылкам со страниц пагинации и не проиндексирует товары.
<!-- Страница /catalog/page/2/ и выше -->
<head>
<meta name="robots" content="noindex, follow">
</head>
<!-- Страница /catalog/ (первая страница) — без noindex -->
<head>
<meta name="robots" content="index, follow">
</head>В WordPress условие обычно реализуют через хук wp_head с проверкой is_paged():
// functions.php
add_action('wp_head', function() {
if (is_paged()) {
echo '<meta name="robots" content="noindex, follow">' . "\n";
}
});rel=canonical на первую страницу
Когда страницы 2+ должны быть доступны, но не дублировать раздел — canonical указывает на первую страницу. Первая страница получает self-referencing canonical.
<!-- /catalog/page/3/ -->
<head>
<link rel="canonical" href="https://example.com/catalog/">
</head>
<!-- /catalog/ — self-canonical (обязательно) -->
<head>
<link rel="canonical" href="https://example.com/catalog/">
</head>noindex.Пагинация в sitemap.xml
Правило: в sitemap включайте только страницы, открытые для индексации. Страницы с noindex в sitemap — это конфликт сигналов, который тратит краулинговый бюджет.
<!-- sitemap.xml — только индексируемые страницы -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<!-- Страница 1 — всегда включаем -->
<url>
<loc>https://example.com/catalog/</loc>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<!-- Страницы 2+ — только при стратегии полной индексации -->
<url>
<loc>https://example.com/catalog/page/2/</loc>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>Типичные ошибки пагинации
Большинство ошибок — не от незнания, а от невнимательной реализации. CMS-генераторы sitemap и шаблоны meta-тегов часто не учитывают пагинацию:
Условие if page > 1 написано неверно — noindex получает и главная страница категории. Трафик раздела падает до нуля за несколько недель.
Генератор sitemap автоматически добавляет все URL. Google получает конфликт: sitemap говорит «индексируй», meta robots — «нет». Краулинговый бюджет тратится впустую.
Ошибка 2Первая страница — /catalog/, но canonical со страниц 2+ указывает на /catalog/page/1/ (которой нет, 404). Google получает битую цепочку canonicals.
Вся пагинация на JavaScript, статических URL нет. Googlebot видит только первые N позиций — остальные товары в индекс не попадают.
Ошибка 4При полной индексации все страницы получают один Title. Google видит дублированный контент и снижает релевантность раздела. Каждая страница должна иметь уникальный мета-тег с указанием номера страницы.
Ошибка 5Найти большинство ошибок можно в Google Search Console → «Покрытие»: страницы с noindex, исключённые URL и конфликты canonical видны в отчёте сразу.