Robots.txt для SEO — полное руководство

Robots.txt для SEO: полный гайд

Robots.txt для SEO: полный гайд

Блог:

Что такое robots.txt?

robots seoRobots.txt – это простой текстовый файл, который содержит директивы для поисковых систем. Он указывает им, какие страницы и файлы должны быть проиндексированы, а какие нет. Это помогает управлять SEO вашего сайта, предотвращая индексацию нежелательных или конфиденциальных данных.

Будьте осторожны при внесении изменений в Robots.txt:  не корректная директива может закрыть нужные вам разделы сайта от индексации.

Поисковые системы регулярно проверяют файл robots.txt у сайтов на предмет наличия в нем инструкций. Если файл отсутствует или в нем нет применимых директив, поисковики будут проходиться по всему сайту.

Как создать файл robots.txt?

Создать файл robots.txt просто: откройте текстовый редактор (блокнот, notepad+, vs code) и сохраните файл с именем "robots.txt". Затем загрузите его в корневой каталог вашего сайта, чтобы поисковые системы могли его найти.

Файл должен быть доступен по адресу: https://вашсайт.ru/robots.txt

Синтаксис robots.txt

Синтаксис robots.txt прост: каждое правило должно начинаться с директивы "User-agent", за которой следует директива "Disallow" или "Allow" и путь к странице или файлу, который нужно заблокировать или разрешить.

Пример правил для robots.txt:

User-agent: *

Disallow: /private/

Allow: /public/

В данном случае, все краулеры не могут индексировать страницы в каталоге "private", но могут индексировать страницы в каталоге "public".

Значения символов:

* – любая последовательность символов.

$ – конец строки.

# – комментарии.

Разберем подробнее все директивы для robots.txt

Директива

Что делает

User-agent

яндекс google

Указывает на робота, для которого действуют перечисленные в robots.txt правила.

Disallow

яндекс google

Запрещает обход разделов или отдельных страниц сайта.

Allow

яндекс google

Разрешает индексирование разделов или отдельных страниц сайта.

Sitemap

яндекс google

Указывает путь к файлу Sitemap, который размещен на сайте.

Clean-param

яндекс

Указывает роботу, что URL страницы содержит параметры (например, UTM-метки), которые не нужно учитывать при индексировании.

Crawl-delay

яндекс

Задает роботу минимальный период времени (в секундах) между окончанием загрузки одной страницы и началом загрузки следующей.

Требования Яндекс к файлу Robots.txt

  1. Размер файла не должен превышать 500 КБ.
  2. Файл должен быть в формате TXT и назван как robots.txt.
  3. Файл должен быть размещен в корневой директории сайта.
  4. Файл должен быть доступен для роботов. Сервер, на котором расположен сайт, должен возвращать код HTTP со статусом 200 OK

Ошибки в robots.txt и их последствия

Блокировка важных страниц

Ошибки в robots.txt могут привести к блокировке важных страниц вашего сайта, что ухудшит его видимость в поисковых системах. Убедитесь, что вы тщательно проверили правила в файле, чтобы предотвратить такие проблемы.

Противоречивые правила

Противоречивые правила в robots.txt могут запутать роботов, что повлияет на индексацию вашего сайта. Убедитесь, что правила в файле robots.txt ясны и не противоречат друг другу.

Пропуск правил для краулеров

Если вы не указали правила для определенного краулера, он может обрабатывать ваш сайт неправильно, что может привести к проблемам с индексацией. Убедитесь, что все важные краулеры имеют соответствующие правила в файле robots.txt.

Не следует блокировать файлы JavaScript или CSS при помощи robots.txt. Боты могут некорректно отображать контент на вашем сайте, если они не имеют доступа к этим ресурсам.

Как проверить и исправить ошибки в robots.txt

Для проверки файла robots.txt на наличие ошибок вы можете использовать различные инструменты, такие как Google Search Console или Yandex.Webmaster. Эти инструменты предоставляют информацию о правилах вашего файла robots.txt и помогают определить, есть ли какие-либо проблемы.

яндекс Инструмент анализа файла robots.txt от Яндекс

https://webmaster.yandex.ru/tools/robotstxt/

google Инструмент проверки файла robots.txt от Google

https://support.google.com/webmasters/answer/6062598

Кириллические символы в robots.txt

В файле robots.txt запрещено использование кириллических символов. Для преобразования кирилличекского домена используйте конвертер Punycode.

Преобразование кириллических url

Для преобразования кириллических названий используйте Unicode конвертер

unicode конвертер

Неправильно

User-agent: *

Disallow: /каталог/

Sitemap: https://вашсайт.рф/sitemap.xml

Правильно

User-agent: *

Disallow: /%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3/

Sitemap: https://xn--80aae4a1bi2b.xn--p1ai/sitemap.xml

Руководства по robots.txt от Яндекс и Google

яндекс Документация Яндекса по файлу robots.txt

https://yandex.ru/support/webmaster/controlling-robot/robots-txt.html

google Документация Google по файлу robots.txt

https://developers.google.com/search/docs/crawling-indexing/robots/intro?hl=ru

Пример robots.txt для запрета всего сайта

User-agent: *

Disallow: /

Пример robots.txt для Wordpress

User-agent: *

Disallow: /cgi-bin

Disallow: */?

Disallow: /wp-

Disallow: *?s=

Disallow: *&s=

Disallow: /search

Disallow: /author/

Disallow: *?attachment_id=

Disallow: */trackback

Disallow: */feed

Disallow: */embed

Disallow: */page/

Allow: /wp-content/plugins/

Allow: /wp-content/themes/

Allow: /wp-content/cache/

Allow: /wp-includes/

Allow: */uploads

Allow: /*/*.js

Allow: /*/*.css

Allow: /wp-*.png

Allow: /wp-*.jpg

Allow: /wp-*.jpeg

Allow: /wp-*.gif

Sitemap: https://example.ru/sitemap.xml

Пример robots.txt для Bitrix

User-Agent: *

Disallow: */index.php$

Disallow: /bitrix/

Disallow: /personal/

Disallow: */cgi-bin/

Disallow: /local/

Disallow: /test/

Disallow: /*show_include_exec_time=

Disallow: /*show_page_exec_time=

Disallow: /*show_sql_stat=

Disallow: /*bitrix_include_areas=

Disallow: /*clear_cache=

Disallow: /*clear_cache_session=

Disallow: /*ADD_TO_COMPARE_LIST

Disallow: /*ORDER_BY

Disallow: /*?print=

Disallow: /*?list_style=

Disallow: /*?sort=

Disallow: /*sort_by=

Disallow: /*?set_filter=

Disallow: /*?arrFilter=

Disallow: /*?order=

Disallow: /*&print=

Disallow: /*print_course=

Disallow: /*?action=

Disallow: /*&action=

Disallow: /*register=

Disallow: /*forgot_password=

Disallow: /*change_password=

Disallow: /*login=

Disallow: /*logout=

Disallow: /*auth=

Disallow: */auth/

Disallow: /*backurl=

Disallow: /*back_url=

Disallow: /*BACKURL=

Disallow: /*BACK_URL=

Disallow: /*back_url_admin*

Disallow: /*?utm_source=

Disallow: */order/

Disallow: /*download

Disallow: /test.php

Disallow: */filter/*/apply/

Disallow: /*setreg=

Disallow: /*logout

Disallow: */filter/

Disallow: /*sphrase_id

Disallow: */search/

Disallow: /*type=

Disallow: /*?product_id=

Disallow: /*?display=

Disallow: /*?view_mode=

Disallow: /*view=

Disallow: /*min_price=

Disallow: /*max_price=

Disallow: /*&page=

Disallow: /*?path=

Disallow: /*?route=

Disallow: /*?products_on_page=

Disallow: /*?PAGEN_1=1$

Disallow: /*?PAGEN_1=1/$

Disallow: /*?new=

Disallow: /*?edit=

Disallow: /*?preview=

Disallow: /*SHOWALL=

Disallow: /*SHOW_ALL=

Disallow: /*SHOWBY=

Disallow: /*SPHRASE_ID=

Disallow: /*TYPE=

Disallow: /*?utm*=

Disallow: /*&utm*=

Disallow: /*?VIEW=

Disallow: /*?SORT_TO=

Disallow: /*?SORT_FIELD=

Disallow: /*set_filter=

Disallow: */auth.php

Disallow: /*?alfaction=

Disallow: /*?oid=

Disallow: /*?name=

Disallow: /*?form_id=

Disallow: /*&form_id=

Disallow: /*?bxajaxid=

Disallow: /*&bxajaxid=

Disallow: /*?view_result=

Disallow: /*&view_result=

Disallow: */resize_cache/

Disallow: /*?linerow=

Disallow: /bitrix/panel/

Disallow: *?sort_ord=

Disallow: *?sort_dir=

Disallow: *?category_id=

Disallow: *?item_id=

Disallow: *?pn_pr=

Disallow: *?page=

Disallow: *?tab=

Disallow: *?display=

Disallow: *?linerow=

Disallow: *?year=

Disallow: *?oid=

Disallow: */filter/

Disallow: *showElements*

Disallow: *PAGEN_2*

Disallow: *?ORDER_ID=

Disallow: *how=*

Disallow: */form/?name=

Disallow: *?name=

Disallow: /*gclid*

Disallow: /*yclid*

Disallow: /*ymclid*

Disallow: /test*

Disallow: /404.php

Disallow: /api/*

Disallow: /*?RID*

Disallow: *?preview=

Disallow: *bitrix_*=

Disallow: *auth=

Disallow: /*?tag

Disallow: /*set_filter*

Disallow: /*?showElements=

Disallow: /*?tid*

Disallow: /*&tid*

Disallow: *?FILTER*=

Disallow: *?ei=

Disallow: *?p=

Disallow: *?q=

Disallow: *?tags=

Disallow: *B_ORDER=

Disallow: *BRAND=

Disallow: *CLEAR_CACHE=

Disallow: *SECTION_ID=

Disallow: *section_id=

Disallow: *SECTION[*]=

Disallow: *SHOW_ALL=

Disallow: *SHOWBY=

Disallow: *SORT=

Disallow: *SPHRASE_ID=

Disallow: *TYPE=

Disallow: /*?from*

Disallow: /*&from*

Disallow: /*block=*

Disallow: *r1=

Disallow: */?_ym_debug

Disallow: */apply/*

Disallow: *&by*

Disallow: *?by*

Disallow: *?id=*

Disallow: *?a=*

Disallow: *?amp*

Disallow: *IBLOCK_ID=*

Disallow: *RESULT_ID=*

Disallow: *PROPERTY=*

Disallow: *IN_STOCK=*

Disallow: *SECTION_CODE=*

Disallow: *SIZE=*

Disallow: *added=*

Disallow: *position=*

Disallow: *callibri=*

Disallow: *gtm_debug=*

Disallow: *placement=*

Disallow: *source=*

Disallow: *&adv=*

Disallow: *?adv=*

Disallow: *option=*

Disallow: *?hhtmFrom=*

Disallow: *?_r=*

Disallow: *sort_order=*

Allow: /upload/*

Allow: /bitrix/components/

Allow: /bitrix/cache/

Allow: /bitrix/js/

Allow: /bitrix/templates/

Allow: /bitrix/*.js

Allow: /bitrix/*.css

Allow: /local/components/

Allow: /local/cache/

Allow: /local/js/

Allow: /local/templates/

Allow: /local/*.js

Allow: /local/*.css

Allow: /local/*.jpg

Allow: /local/*.jpeg

Allow: /local/*.png

Allow: /local/*.gif

Sitemap: https://example.ru/sitemap.xml

Пример robots.txt для ModX

User-agent: *

Disallow: /cgi-bin

Disallow: /manager/

Disallow: /assets/

Disallow: /core/

Disallow: /connectors/

Disallow: /index.php

Disallow: *?

Allow: /assets/*.jpg

Allow: /assets/*.jpeg

Allow: /assets/*.gif

Allow: /assets/*.png

Allow: /assets/*.pdf

Allow: /assets/*.js

Allow: /assets/*.css

Allow: /assets/*.svg

Sitemap: https://example.ru/sitemap.xml

Пример robots.txt для OpenCart

User-agent: *

Disallow: /*route=account/

Disallow: /*route=affiliate/

Disallow: /*route=checkout/

Disallow: /*route=product/search

Disallow: /index.php

Disallow: /admin

Disallow: /catalog

Disallow: /download

Disallow: /export

Disallow: /system

Disallow: /*?sort=

Disallow: /*&sort=

Disallow: /*?order=

Disallow: /*&order=

Disallow: /*?limit=

Disallow: /*&limit=

Disallow: /*?filter_name=

Disallow: /*&filter_name=

Disallow: /*?filter_sub_category=

Disallow: /*&filter_sub_category=

Disallow: /*?filter_description=

Disallow: /*&filter_description=

Disallow: /*?tracking=

Disallow: /*&tracking=

Disallow: /*?page=

Disallow: /*&page=

Disallow: /wishlist

Disallow: /login

Sitemap: http://example.ru/sitemap.xml

Пример robots.txt для Joomla

User-agent: *

Disallow: /administrator/

Disallow: /bin/

Disallow: /cache/

Disallow: /cli/

Disallow: /components/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /layouts/

Disallow: /libraries/

Disallow: /logs/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /index.php* # Только если у вас включен SEF

Allow: /index.php?option=com_xmap&sitemap=1&view=xml

Sitemap: http://example.ru/sitemap.xml

Пример robots.txt для Drupal

User-agent: *

# CSS, JS, Images

Allow: /core/*.css$

Allow: /core/*.css?

Allow: /core/*.js$

Allow: /core/*.js?

Allow: /core/*.gif

Allow: /core/*.jpg

Allow: /core/*.jpeg

Allow: /core/*.png

Allow: /core/*.svg

Allow: /profiles/*.css$

Allow: /profiles/*.css?

Allow: /profiles/*.js$

Allow: /profiles/*.js?

Allow: /profiles/*.gif

Allow: /profiles/*.jpg

Allow: /profiles/*.jpeg

Allow: /profiles/*.png

Allow: /profiles/*.svg

# Directories

Disallow: /core/

Disallow: /profiles/

# Files

Disallow: /README.txt

Disallow: /web.config

# Paths (clean URLs)

Disallow: /admin/

Disallow: /comment/reply/

Disallow: /filter/tips

Disallow: /node/add/

Disallow: /search/

Disallow: /user/register

Disallow: /user/password

Disallow: /user/login

Disallow: /user/logout

# Paths (no clean URLs)

Disallow: /index.php/admin/

Disallow: /index.php/comment/reply/

Disallow: /index.php/filter/tips

Disallow: /index.php/node/add/

Disallow: /index.php/search/

Disallow: /index.php/user/password

Disallow: /index.php/user/register

Disallow: /index.php/user/login

Disallow: /index.php/user/logout

Disallow: /drupal-9-migration

Disallow: /drupal-migration-services

Disallow: /drupal-7-end-of-life

Disallow: /drupal-migration-rescue

Sitemap: http://example.ru/sitemap.xml

Пример robots.txt для Magento

User-agent: *

Disallow: /catalogsearch/

Disallow: /search/

Disallow: /customer/account/login/

Disallow: /*?SID=

Disallow: /*?PHPSESSID=

Disallow: /*?price=

Disallow: /*&price=

Disallow: /*?color=

Disallow: /*&color=

Disallow: /*?material=

Disallow: /*&material=

Disallow: /*?size=

Disallow: /*&size=

Sitemap: http://example.ru/sitemap.xml

Поделиться статьей

Vkontakte Odnoklassniki Twitter

Наши кейсы