Казань
Пн-Сб | 09:00-18:00
97 оценок средняя 4,90 из 5

Руководство как закрыть сайт от индексации через robots.txt и другие способы. Как проверить закрыт ли сайт от индексации в поисковой системе?

Чтобы страницы сайта или сам сайт появлялись в выдаче поисковых систем, необходимо, чтобы сайт был проиндексирован индексирующими роботами. Обычно, сайты доступны для индексации, но бывают случае, когда ресурс требуется запретить к сканирование. Ситуации, требующие запрета индексирования сайта:

  1. Сайт находится в процессе разработки и вывод в результатах поиска “сырых” страниц не желательно. Чтобы каждый раз не вычищать ненужные страницы из индекса, лучше сразу закрыть сайт от индексирования.
  2. Создается дубликат основного сайта, на котором разработчики тестируют различные доработки. Если дубликат попадет в индекс, что это может привести к путанице и серьезно ухудшить позиции основного сайта.
  3. На страницах содержится конфиденциальная или предназначенная для узкого круга пользователей информация, например если это корпоративный ресурс.
  4. На страницах содержится контент, который не нужно индексировать, так как он неактуальный или относится к административной части сайта и бесполезен в плане индексации.

4 основных способа запрета индексации сайта

С помощью файла robots.txt

Более надежный способ внести все изменения вручную непосредственно в сам файл robots.txt. Этот файл, который находится в корневом каталоге вашего сайта (обязательное требование), содержит в себе директивы для поисковых роботов, поэтому они сразу же посещают именно его, а затем уже остальные страницы и директории.

Помимо того, что robots.txt должен находится в корневом каталоге, он должен соответствовать еще ряду обязательных требований:

  • Размер не более 500 КБ;
  • Название файла должно быть полностью в нижнем регистре;
  • Доступен по адресу mysite/robots.txt, а при запросе сервер должен отправить ответ 200 ОК.

В файле прописываются следующие директивы:

  • User-agent, указывающий, для каких именно поисковых роботов эта директива предназначается;
  • Disallow указывает на запрет действия;
  • Allow указывает на разрешение действия;
  • Clean-param облегчает поисковому роботу Яндекс правильное определение страницы для индексации;
  • Sitemap с содержанием прямого адреса карты вашего сайта.

Для полное закрытие сайта от индексации необходимо прописать следующую команду;

User-agent: *
Disallow: /

Можно закрыть сайт только от одного типа поисковых роботов, например Google:

User-agent: Googlebot
Disallow: /

Перейдя в Google Search Console, вы можете в поле проверки адреса вставить URL нескольких страниц своего сайта. Скорее всего, система покажет вам результат «Заблокировано по строке», но это не 100% – так как данная директива носит рекомендательный, но не обязательный характер, то поисковые системы Google все равно могут индексировать страницы. В Яндексе запрет на индексацию сайта действует со 100% результатом.

Также есть возможность закрыть сайт для всех роботов поисковых систем, кроме одной:

User-agent: *
Disallow: /

User-agent: Yandex
Allow: /

Таким образом, вы можете открыть свой сайт для индексации только поисковым роботом Яндекса.

Кроме полного запрета на индексацию сайта, можно запретить индексацию отдельных папок

User-agent: *
Disallow: /category/

Запретить индексировать отдельные страницы

User-agent: *
Disallow: /page.html

Закрыть все категории кроме указанной

User-agent: *
Disallow: /
Allow: /category

Таким же способом можно скрыть директории скриптовые файлы и файлы определенного формата, UTM-метки, всю категорию кроме отдельного файла.

С использованием тега name=”robots”

Еще одним вариантом закрыть сайт от индексации является использование тега name=”robots”, который поисковики считают приоритетным. Этот тег в обязательном порядке должен прописываться внутри тегов <head> и </head>. Например:

<meta name=”robots” content=”noindex, nofollow”/>

или

<meta name=”robots” content=”none”/>

С помощью HTML-кода

Метатеги в блоке <head> самого HTML кода также позволяют полностью закрыть страницу от индексации поисковыми системами. Здесь используется атрибут “content” со следующими значениями:

  • follow  – разрешение на индексацию всех ссылок.
  • nofollow – разрешение на сканирование всех ссылок, но запрет на их индексацию.
  • index – разрешение на индексацию содержимого страницы.
  • noindex – запрет на индексацию содержимого страницы, кроме ссылок.
  • all – разрешение на индексацию всего содержимого страницы, включая ссылки.

Атрибут “name” позволяет открывать или закрывать страницу для роботов определенной поисковой системы.

Например, данный код запрещает роботу Google индексировать страницу:

<meta name="googlebot" content="noindex, nofollow"/><br>

С помощью настроек сервера

В случае, если все вышеописанные способы не помоги и поисковые роботы (в частности роботы Google) продолжают индексировать страницы сайта, можно ограничить возможность посещения в настройках сервера. Это крайний способ, который рекомендуется использовать в последнюю очередь.

Запрет на и в настройках сервера вводится в файле .htaccess. Необходимо открыть этот файл и вручную прописать в нем следующий код:

SetEnvIfNoCase User-Agent "^Googlebot" search_bot
SetEnvIfNoCase User-Agent "^Yandex" search_bot
SetEnvIfNoCase User-Agent "^Yahoo" search_bot
SetEnvIfNoCase User-Agent "^Aport" search_bot
SetEnvIfNoCase User-Agent "^msnbot" search_bot
SetEnvIfNoCase User-Agent "^spider" search_bot
SetEnvIfNoCase User-Agent "^Robot" search_bot
SetEnvIfNoCase User-Agent "^php" search_bot
SetEnvIfNoCase User-Agent "^Mail" search_bot
SetEnvIfNoCase User-Agent "^bot" search_bot
SetEnvIfNoCase User-Agent "^igdeSpyder" search_bot
SetEnvIfNoCase User-Agent "^Snapbot" search_bot
SetEnvIfNoCase User-Agent "^WordPress" search_bot
SetEnvIfNoCase User-Agent "^BlogPulseLive" search_bot
SetEnvIfNoCase User-Agent "^Parser" search_bot

Так вы сможете закрыть сайт от поисковых роботов всех систем. Если следует ограничить робота какой-то определенной системы, то достаточно будет строки кода с ее упоминанием.

Запрет на индексацию для сайтов на WordPress

Учитывая, что все больше ресурсов создаются на движке WordPress, рассмотрим этот способ отдельно. Тем более, что он является наиболее простым и быстрым и не требует особых знаний – все делается с помощью встроенного набора инструментов.

  1. Переходим в «Панель управления» CMS;
  2. Выбираем «Настройки» – «Чтение»;
  3. В разделе «Видимость для поисковых систем» ставим галочку в поле «Рекомендовать поисковым системам не индексировать сайт»;
  4. Нажимаем кнопку «Сохранить изменения».

Система сама вносит все необходимые изменения в файл robots.txt, чтобы запретить индексацию сайта. Плюсом этого способа является его простота, но здесь есть и обратная сторона – вы не ставите полный запрет на индексацию, а лишь «рекомендуете» поисковикам не обращать внимание на него. Причем для Яндекс эта рекомендация действует в 100% случаев, а вот с Google все не так и просто – примерно в половине случаев поисковые роботы все равно могут проиндексировать сайт.

Для WordPress имеется отдельный плагин Yoast SEO, который также позволяет закрывать как отдельные страницы сайта, так и весь ресурс от индексации.

  1. Установите плагин на вашу CMS
  2. Откройте страницу в редакторе и перейдите в самый низ до окна плагина;
  3. На вкладке плагина «Дополнительно» настройте разрешение или запрет на индексацию.

Проверка индексации сайта

После того, как вы закрыли сайт или отдельные страницы от индексации одним из описанных выше способов, рекомендуется произвести проверку. Существует несколько вариантов, как это сделать.

В Google Search Console

В панели Google Search Console выберите пункт «Проверка по URL», после чего вставьте в поисковую строку адрес вашего сайта или определенной страницы (если закрывались отдельные страницы). Если вы все сделали правильно, то увидите надпись «URL нет в индексе Google».

В Яндекс.Вебмастер

Аналогичным способом подобная проверка производится в Яндекс.Вебмастер. Сначала следует пройти верификацию, после чего перейти в инструментарий и выбрать там пункт «Проверка ответа сервера».

Откроется новая страница, где будет отдельное поле, куда следует вставить URL проверяемой страницы. В случае, если страница закрыта от индексации, вы увидите уведомление «URL запрещен к индексированию».

Через поисковую строку поисковика

Откройте ваш браузер и в поисковой строке введите site:https://mysite.ru, где mysite.ru – это адрес вашего ресурса. Если действует запрет на индексацию, то в результатах поиска вы увидите 0 страниц.

97 оценок средняя 4,90 из 5
Ваш сайт продвигают, но результаты вас не устраивают?

Закажите у нас экспресс-аудит.
Вас это ни к чему не обязывает.

КАК НАЧАТЬ РАБОТАТЬ С НАМИ

Если вы уже знаете, что вашему бизнесу в Казани нужно продвижение в интернете:

  • Заполните форму заявки – это займет минимум времени;
  • Мы предложим вам оптимальные варианты для решения именно вашей проблемы;
  • Можете просто заказать обратный звонок

Мы сделаем все, чтобы вы получили желаемое:

  • Предложим комплексное решение задачи по SEO-продвижению и оптимизации сайта;
  • Используем только результативные приемы – никаких трат впустую;
  • Используем все инструменты digital-маркетинга, которые помогут в достижении целей.

Наше агентство последовательно и аккуратно во всем:

  • Тщательно согласовываем все детали и условия будущего сотрудничества по разработке и продвижения сайта;
  • Обязательно оговариваем и фиксируем стоимость услуг в долгосрочном договоре сотрудничества. Это защищает нашего клиента от скрытых платежей и комиссий за SEO, раздувания сметы в процессе работы над проектом;
  • Мы не работаем без финансовых и юридических гарантий. Клиент всегда уверен в нашей ответственности и надежности;
  • Мы делаем наше сотрудничество приятным и интересным при помощи акций, а также поощряем скидками и бонусами наших постоянных клиентов за их доверие.

Вы получаете персонального консультанта, который будет вести ваш проект в Казани. Он готов ответить на все ваши вопросы, поможет разобраться в деталях. Мы располагаем достаточным количеством специалистов, чтобы ваш сайт продвигался максимально быстро.

Чтобы обеспечить нужный результат, а также уверенность нашего клиента, что все под контролем, наше агентство просто следует принципам:

  • Мониторинг состояния и позиций сайта: непрерывный и прозрачный. Он позволяет отслеживать эффект от наших мероприятий по продвижению и оптимизации в динамике;
  • Доступность данных. Клиент получает подробный отчет о продвижении: какие показатели, какая динамика, что было сделано, что еще предстоит сделать;
  • Постоянная поддержка сайта и помощь. Если что-то не так с ресурсом, мы всегда готовы прийти на помощь.

Вы получаете результат от нашей работы в виде роста и развития вашего бизнеса в Казани.

Мы готовы отвечать финансово и юридически за свою работу, потому что знаем, что предлагаем вам лучшие решения, уверены в их результатах.

    Заказать звонок
    оставьте заявку и наш менеджер свяжется с вами

    Спасибо за обращение!
    Мы свяжемся с вами в ближайшее время.

    Будем друзьями в социальных сетях?