Как настроить смартфоны и ПК. Информационный портал

Что такое индексация и как ее улучшить. База данных Google

Что такое индексирование сайта? Как оно происходит? На эти и другие вопросы вы можете найти ответы в статье. в поисковых системах) называют процесс приобщения информации о сайте к базе данных роботом поисковой машины, которая впоследствии используется для розыска сведений на веб-проектах, прошедших такую процедуру.

Данные о веб-ресурсах чаще всего состоят из ключевых слов, статей, ссылок, документов. Индексироваться также могут аудио, изображения и так далее. Известно, что алгоритм выявления ключевых слов зависим от поискового устройства.

На типы индексируемой информации (flash файлы, javascript) существует некоторая лимитация.

Управление приобщением

Индексирование сайта - сложный процесс. Чтобы им управлять (к примеру, запрещать приобщение той или иной страницы), нужно использовать файл robots.txt и такие предписания, как Allow, Disallow, Crawl-delay, User-agent и другие.

Также для ведения индексации применяют теги и реквизит , скрывающие содержимое ресурса от роботов Google и «Яндекса» (Yahoo применяет тег ).

В поисковой системе Goglle новые сайты индексируются от пары дней до одной недели, а в Яндексе - от одной недели до четырёх.

Вы желаете, чтобы ваш сайт показывался в запросах результатов поисковиков? Тогда он должен быть обработан «Рамблером», «Яндексом», Google, Yahoo и так далее. Вы должны сообщить поисковым машинам (паукам, системам) о существовании вашего веб-узла, и тогда они просканируют его полностью или частично.

Многие сайты не индексируются годами. Информацию, которая на них находится, не видит никто, кроме их владельцев.

Способы обработки

Индексирование сайта может выполняться несколькими способами:

  1. Первым вариантом является ручное добавление. Вам нужно ввести данные своего сайта через особые формы, предлагаемые поисковиками.
  2. Во втором случае робот поисковой машины сам находит ваш веб-узел по ссылкам и индексирует его. Он может разыскать ваш сайт по ссылкам с других ресурсов, которые ведут на ваш проект. Этот способ наиболее эффективен. Если поисковик нашёл сайт таким образом, он считает его значительным.

Сроки

Индексирование сайта происходит не слишком быстро. Сроки разные, от 1-2 недель. Ссылки с авторитетных ресурсов (с великолепным PR и Тиц) значительно ускоряют размещение сайта в базе поисковиков. Сегодня самым медленным считается Google, хотя до 2012 года он мог выполнять эту работу за неделю. К сожалению, всё очень быстро меняется. Известно, что Mail.ru работает с веб-узлами в этой области около полугода.

Индексирование сайта в поисковиках осуществить способен не каждый специалист. На сроки добавления в базу новых страниц уже обработанного поисковиками сайта влияет частота корректировки его контента. Если на ресурсе постоянно появляется свежая информация, система считает его часто обновляемым и полезным для людей. В этом случае её работа ускоряется.

За ходом индексации веб-узла можно следить на особых разделах для веб-мастеров или на поисковиках.

Изменения

Итак, мы уже разобрались, как происходит индексирование сайта. Необходимо отметить, что базы данных поисковиков часто обновляются. Поэтому количество добавленных в них страниц вашего проекта может меняться (как уменьшаться, так и увеличиваться) по следующим причинам:

  • санкции поисковика к веб-узлу;
  • наличие погрешностей на сайте;
  • изменение алгоритмов поисковиков;
  • отвратительный хостинг (недосягаемость сервера, на котором находится проект) и так далее.

Ответы «Яндекса» на обычные вопросы

«Яндекс» - поисковая система, которой пользуются многие пользователи. Она занимает пятое место среди розыскных систем мира по числу обработанных исследовательских запросов. Если вы в неё добавили сайт, он может слишком долго добавляться в базу.

Добавление URL не гарантирует его индексацию. Это лишь один из методов, с помощью которого сообщают роботу системы о том, что появился новый ресурс. Если на сайт отсутствуют ссылки с других веб-узлов или их немного, добавление поможет его быстрее обнаружить.

Если индексация не произошла, нужно проверить, не было ли на сервере сбоев в момент создания ему заявки от робота «Яндекса». Если сервер сообщает об ошибке, робот завершит свою работу и попытается её выполнить в порядке всестороннего обхода. Работники «Яндекса» не могут увеличить скорость добавления страниц в базу поисковика.

Индексирование сайта в «Яндексе» - довольно-таки сложное занятие. Вы не знаете как добавить ресурс в поисковую систему? Если на него имеются ссылки с других веб-узлов, то добавлять специально сайт не требуется - робот его автоматически разыщет и проиндексирует. Если у вас нет таких ссылок, можно использовать форму «Добавить URL», чтобы заявить поисковику о существовании веб-узла.

Необходимо помнить, что добавление URL не гарантирует индексацию вашего творения (или её скорость).

Многим интересно, сколько времени занимает индексирование сайта в «Яндексе». Сотрудники этой компании не дают гарантий и не прогнозируют сроки. Как правило, с тех пор, как робот узнал о сайте, страницы его в поиске появляются через два дня, иногда - через пару недель.

Процесс обработки

«Яндекс» - поисковая система, требующая точности и внимания. Индексация сайта состоит из трёх частей:

  1. Поисковый робот выполняет обход страниц ресурса.
  2. Содержимое (контент) сайта записывается в базу данных (индекс) розыскной системы.
  3. Через 2-4 недели, после обновления базы, можно увидеть результаты. Ваш сайт появится (или не появится) в поисковой выдаче.

Проверка индексации

Как проверить индексацию сайта? Выполнить это можно тремя способами:

  1. Введите наименование своего предприятия в строке поиска (к примеру, «Яндекса») и проверьте каждую ссылку на первой и второй странице. Если вы обнаружите там URL своего детища, значит, робот свою задачу выполнил.
  2. Можно ввести URL своего сайта в розыскной строке. Вы сможете увидеть, сколько интернет-листов показывается, то есть проиндексировано.
  3. Зарегистрируйтесь на страницах веб-мастеров в Mail.ru, «Гугле», «Яндексе». После того как вы пройдёте верификацию сайта, вы сможете увидеть и итоги индексации, и иные сервисы поисковиков, созданные для улучшения работы вашего ресурса.

Почему «Яндекс» отказывает?

Индексирование сайта в Google осуществляется следующим образом: робот в базу данных заносит все страницы сайта, некачественные и качественные, не выбирая. Но в ранжировании участвуют лишь полезные документы. А «Яндекс» весь веб-хлам исключает сразу же. Он может проиндексировать любую страницу, но поисковик со временем ликвидирует весь мусор.

У обеих систем имеется добавочный индекс. И у той, и у другой страницы низкого качества влияют на рейтинг веб-узла в целом. Здесь работает простая философия. Излюбленные ресурсы конкретного пользователя будут занимать более высокие позиции в его выдаче. Зато этот же индивидуум с трудом отыщет сайт, который ему в прошлый раз не понравился.

Именно поэтому сперва необходимо от индексации прикрыть копии веб-документов, проинспектировать наличие пустых страниц и не пускать в выдачу некачественный контент.

Ускорение работы «Яндекса»

Как можно ускорить индексирование сайта в «Яндексе»? Необходимо выполнить следующие шаги:

Промежуточные действия

Что необходимо выполнить, пока веб-страница «Яндексом» не проиндексирована? Отечественный поисковик должен считать сайт первоисточником. Именно поэтому ещё до публикации статьи обязательно необходимо добавить её содержание в форму «Специфичных текстов». В противном случае плагиаторы скопируют запись на свой ресурс и окажутся в базе данных первыми. В итоге признаны авторами будут они.

База данных Google

Запрещение

Что собой представляет запрет индексирования сайта? Вы можете наложить его как на всю страницу, так и на отдельную её часть (ссылку или кусок текста). Фактически существует как глобальный запрет индексации, так и локальный. Как это реализуется?

Рассмотрим запрет добавления в базу поисковика веб-узла в Robots.txt. С помощью файла robots.txt можно исключить индексацию одной страницы или целой рубрики ресурса так:

  1. User-agent: *
  2. Disallow: /kolobok.html
  3. Disallow: /foto/

Первый пункт говорит о том, что инструкции определены для всех ПС, второй указывает на запрет индексации файла kolobok.html, а третий - не разрешает добавление в базу всей начинки папки foto. Если нужно исключить несколько страниц или папок, укажите их все в «Роботсе».

Для того чтобы воспрепятствовать индексации отдельного интернет-листа, можно применить мета-тег robots. Он отличается от robots.txt тем, что даёт указания сразу всем ПС. Этот мета-тег подчиняется общим принципам формата html. Его нужно размещать в заголовке страницы между Запись для запрета, к примеру, может быть написана так: .

Ajax

А как проводит индексирование Ajax-сайтов Yandex? Сегодня технологией Ajax пользуются многие разработчики веб-узлов. Конечно, у неё есть большие возможности. С помощью неё можно создавать быстродействующие и производительные интерактивные веб-страницы.

Однако системы веб-лист «видит» не так, как пользователь и браузер. К примеру, человек смотрит на комфортный интерфейс с подвижно подгружаемыми интернет-листами. Для поискового робота содержимое той же страницы может быть порожним или представленным как остальной статический HTML-контент, для генерации которого скрипты не идут в дело.

Для создания Ajax-сайтов можно применять URL с #, но его робот-поисковик не использует. Обычно часть URL после # отделяется. Это нужно учитывать. Поэтому взамен URL вида http://site.ru/#example он делает заявку главной странице ресурса, размещённой по адресу http://site.ru. Это значит, что контент интернет-листа может не попасть в базу данных. В итоге он не окажется в результатах поиска.

Для усовершенствования индексации Ajax-сайтов «Яндекс» поддержал изменения в поисковом роботе и правилах обработки URL таких веб-узлов. Сегодня веб-мастера могут указать поисковику «Яндекса» на необходимость индексации, создав соответствующую схему в структуре ресурса. Для этого необходимо:

  1. Заменить в URL страниц символ # на #!. Теперь робот поймёт, что он сможет обратиться за HTML-версией наполнения этого интернет-листа.
  2. HTML-версия контента такой страницы должна быть размещена на URL, где #! заменён на?_escaped_fragment_=.

Привет друзья. Сегодня будет небольшой, короткий пост для вас, но очень полезный. Профи блоггинга и так наверное знают про ту фишку, о которой я расскажу в статье, но для новичков будет самое то. Речь пойдет о том как ускорить индексацию вашей новой статьи гуглом.

Как сделать так, чтобы ваша новая, свежая статья залетела в индекс мега быстро. У меня рекорд 21 секунда, жаль не заскриншотил (забыл), зато заскриншотил залет свежей статьи в индекс за 51 секунду. Тоже не плохо.

Быстрая индексация роботами — залог здоровья вашего блога. Почему важна быстрая индексация блога я объяснять не буду, наверняка вы об этом и так знаете. Давайте сразу к делу. Написали вы свежую статью. Нажали кнопку «Опубликовать» и она (статья) появилась на блоге.

Можно конечно же подождать, пока придет робот google и скушает (проиндексирует) ее, но все таки лучше самому сообщить ему о том, что на вашем блоге есть новый url адрес — ваша статья. Делается все очень просто.

У каждого из вас наверняка имеется аккаунт в google и вы знаете, что такое инструменты для вебмастеров google (ваш блог туда уже добавлен). Ок. В общем после того, как вы нажали на кнопку «Опубликовать» статью на блоге, идем в те сами инструменты для вебмастеров Google Сканирование Посмотреть как Googlebot .

Там вводим свой url адрес в строку (заметьте адрес начинается с рубрики, то есть http://domain.ru/ указывать не надо) и жмем — Сканировать .

После того, как адрес просканируется и google выдаст статус проверки «Готово», то жмем кнопку "

Это все! Если у вас после публикации статьи в блог и сканировании Url адреса google выдаст, что адрес он не нашел, то возможно стоит почистить кеш блога, так же иногда google бывает сам глючит, но это очень редко.

Ну так же вдогонку можете еще и в аддурилку гугла закинуть ссылку вот здесь:

Тут уже вводите собственно url ссылку целиком в строку. Вот собственно и все на сегодня. Короткая, но полезная статейка для тех, кто не знал о такой фишке. Сейчас все мои статьи индексируются гуглом в среднем за 1 минуту, даже наверное меньше, что есть хорошо!

Ну и не забываем естественно о других способах улучшения индексации. Предлагаю вам для этого почитать вот эту статью о . Всем пока. Пользуйтесь этой штукой и у вас всегда будет молниеносная индексация в гугле.

Ну и в заключение статьи у меня для вас интересное объявление:

Первый русифицированный плагин социальных кнопок под WordPress — Uptolike Share Buttons . Установка в два клика, без заморочек с кодом, бесконечное количество вариантов стилей кнопок.

А также очень полезная статистика: лайки, шары, подписки, привлечение новых пользователей и многое другое.

С уважением. Александр Борисов

При запуске нового сайта первые дней 10 вебмастер вынужден ждать, пока его ресурс пройдет индексацию и попадет в выдачу поисковиков. Google обычно индексирует быстрее и качественнее Яндекса. Но все равно обход роботом всего сайта занимает несколько дней. Индексацию можно ускорить и сделать это проще, чем кажется.

Та же ситуация касается и случаев, когда вы вносите существенные изменения в уже работающий сайт. Например, меняете систему урлов или верстку. В таком случае нас будет интересовать переиндексация всех страниц.

Для начала нужно заставить поисковики “полюбить” ваш сайт. В нем не должно быть загадки. Лучший способ это создание карты сайта для удобной навигации.

Создайте Sitemap

Для начала заведите себе карту сайта (Sitemap.xml).

Sitemap это файл с данными о вашем сайте для поисковиков. Он содержит список страниц, которые нужно проиндексировать. Благодаря xml-разметке сайтмеп помогает поисковикам быстро определить структуру сайта, частоту его обновления и “вес” одних страниц в сравнении с другими.

Если вы не знаете о sitemap, это нестрашно. Есть множество онлайн-ресурсов, которые создают его за вас. Например:

  • MySiteMapGenerator (язык: русский, до 500 стр. бесплатно)
  • Web-Site-Map.com (язык: английский, полностью бесплатно)
  • xml-sitemaps.com (язык: английский, до 500 стр. бесплатно)

Все просто: вводите урл и код безопасности, остальные настройки трогать в 90% случаев не нужно.

После этого ждем, пока робот обойдет ваш сайт и добавит все найденные страницы в файл. Этот файл в результате можно будет скачать. Индексация обычно длится минут 10-15. Полученный файл лучше переименовать в sitemap.xml, его нужно загрузить в корневую папку вашего сайта.

Для корректной работы данные о карте сайта в robots.txt . Почитать о том, что это . Вам же для начала нужно просто добавить адрес sitemap в этот файл:

User-agent: *
Allow: /
Sitemap: http://сайт/sitemap.xml

Половина работы сделана. Так держать.

Зарегистрируйтесь в инструментах для веб-мастеров Google

У гугла есть Инструменты для веб-мастеров . Работать с ними просто. Добавляем адрес сайта:

Чтобы ваш сайт не могли отслеживать другие, права на него нужно будет подтвердить. Для этого есть несколько способов. Самый простой - поставить код Google Analytics в . Просто установите код счетчика и нажмите “Проверить”. Кстати, GA один из лучших способов следить за поведением посетителей на сайте. Поэтому рекомендую им активно пользоваться и интересоваться, чем занимаются гости у вас на сайте. И удобно ли им там.

Сайт подтвердили:

Загрузите Sitemap

Открывайте панель управления сайтом, в блоке “Сканирование” откройте “Файлы Sitemap”:

Указывайте адрес карты сайта:

После подтверждения дайте роботам время проверить файл на ошибки и внести список урлов в базу для индексации. Результаты можно будет увидеть позже в этом же разделе. В идеале количество отправленных урлов должно совпадать с количеством проиндексированных.

Упрощайте навигацию, ускоряйте сайт, генерируйте качественный контент. Так ваш сайт будет проиндексирован полностью. И не попадет под фильтр за копипаст.

Как ускорить индексацию

А теперь небольшая фишка, которую я увидел когда-то на англоязычном форуме. Вебмастер интересовался, как ускорить индексацию нового сайта. Sitemap он загрузил, но страницы все не попадали в выдачу. Совет был предельно прост: чтобы “заставить” google сразу запустить сканирование, нужно в панели управления запустить инструмент “Посмотреть как Googlebot”.

В появившейся форме нужно ввести адрес карты сайта. Добавленный файл появится в списке под формой. Жмем “отправить в индекс”. После этого робот гугла пройдется по всем ссылкам из карты сайта, приняв за исходную страницу карту сайта.

В примечании к форме указано, что Google не гарантирует, что все файлы сайта попадут в индекс. Тем не менее этот способ - самый простой, чтобы обратить на свой сайт внимание поисковика.

На сладкое

Когда сайт проиндексирован, можно и отдохнуть. Ну и на десерт для вас этот ролик о лете и активном отдыхе:

Тисни «Лайк», щоб читати нас у Фейсбуці

Проверка индексации сайта является тем мероприятием, которое позволяет предупредить снижение уровня заработка вебмастера. Дело в том, что существует такое понятие, как «выпадение» страниц, по разным причинам приводящее к потере трафика.

Недостаточное количество контента на странице, организационные моменты при «переселении» на другой домен, спам – эти и другие причины сводят на «нет» все усилия вебмастеров. Опытный оптимизатор ни за что не допустит такой ситуации, впрочем, как и понижения рейтинга у площадки, продающей «вечные» ссылки. Проверять индексирование веб-сайта – не прихоть, а вынужденная необходимость!

Существует несколько типов поисковых запросов Google, позволяющих увидеть проиндексирована страница или нет

Проиндексированные страницы сайта

Страницы сайта, прошедшие индексацию Google, можно просмотреть, воспользовавшись оператором «site:». Следует учитывать, что индексация является геозависимой, поэтому может выпадать разное число страниц в индексе для и google.com.

Итак, к указанному оператору добавляем нужный url, причем, между оператором и самой ссылкой на сайт не должно быть пробелов:

site: google.ru

Кроме того, можно провести поиск по целому домену или по отдельно взятому подкаталогу:

site: google.com/ webmasters

Для избирательного поиска с целью исключения ненужных страниц нужно поставить перед оператором знак «-». Наглядно это будет выглядеть так:

site:google.ru -site: adwords. google.com

Подобный поиск выдаст результат, в котором будут содержаться все проиндексированные страницы в домене google.ru, за исключением страниц adwords. google.ru.

link:google.ru или link:www

Кроме того, целенаправленный поиск ссылок на определенные страницы выполняется по запросу:

link:google.ru/webmasters

Текущий кэш вашего сайта

Оператор «cache:» информирует об архивированной копии страницы, которая проиндексирована Google. К примеру, cache:google.ru воссоздает новейшую проиндексированную версию главной сайта, а также выдает информацию о дате создания КЭШа, что дает возможность просмотра версии страницы с обычным текстом. Это чрезвычайно удобно, т.к. становится понятно, как именно робот Googlebot может увидеть страницу.

Используя команду «метатег noarchive», можно ограничить доступ пользователей в результатах поиска к кэшированной версии любой страницы. Между тем, страница будет сканироваться и индексироваться поисковиком Google:

Похожие страницы

Оператор «related:» позволяет увидеть ресурсы, подобные искомому сайту. Такой поиск применяется, как правило, для пересекающихся ресурсов.

В Google может быть использовано целый ряд показателей для выявления схожести, но качество возвращаемых сайтов никоим образом не влияет на процесс индексации страниц поисковой системой Google. Рекомендую почитать пост про гугла, там могут быть страницы которых нет в основном поиске.

Как оперативно узнать, попала ли важная для вас страница в индекс поисковых систем? Да и вообще, сколько страниц сайта «видят» поисковики? Я описал в этом посте способы, которые чаще всего используют SEO-специалисты, и приготовил бонус для читателей.

При индексировании страницы робот поисковой системы добавляет сведения о сайте в базу данных. Дальнейший поиск происходит по проиндексированным страницам. Не стоит путать индексацию и сканирование.

Робот может просканировать весь сайт быстро. А добавлять в индекс медленно, не добавлять часть страниц или удалять страницы из индекса.

1. Проверьте индексацию в панели вебмастеров

Это базовый способ проверки для вебмастера или владельца сайта.

Google . Необходимо зайти в Search Console и на вкладке «Индекс Google» выбрать «Статус индексирования».

Yandex . Проходим авторизацию в Яндекс.Паспорт, заходим в Яндекс.Вебмастер и переходим по пути «Индексирование сайта» — «Страницы в поиске». Еще один вариант: «Индексирование сайта» — «История» — «Страницы в поиске». Здесь можно посмотреть динамику изменения количества страниц в поиске.

Чтобы использовать этот метод, у вас должен быть определенный уровень доступа в панель вебмастера. Пример хорошего индексирования сайта. Количество качественных страниц растет, и они добавляются в индекс.
Проблемы с индексацией выглядят так:

На скриншоте — сайт, закрытый от индексации в файле robots.txt

Хотите узнать больше о поисковом продвижении? Подписывайтесь на рассылку:

Отправить

Наши подписчики всегда получают больше.

2. Используйте операторы в поисковых запросах

Поисковые операторы позволяют уточнять результаты поиска. Оператор «site:» выдает информацию о приблизительном количестве проиндексированных страниц. Для проверки в строке поиска Google или Яндекс введите «site:».

Например, сайт cubing.com.ua находится под фильтром АГС.

Используя дополнительные инструменты поиска, можно узнать данные об индексации за определенный период времени. Так, за последний час в индексе Google появились 49 страниц русскоязычной Википедии:

3. Используйте плагины и букмарклеты

Плагины и букмарклеты (небольшие javascript-программы, сохраняемые как браузерные закладки) — автоматизированный вариант проверки. В данном случае не надо открывать поисковик отдельно и вводить что-либо в поиск.

Это делают плагины и скрипты:

Netpeak Spider позволяет просканировать весь сайт. Плюс в том, что вы получаете не только информацию о количестве страниц в индексе, но и список этих страниц, а также много дополнительных данных: каноникал, код ответа, название, заголовки, метаописания, мета роботс, robots.txt, редиректы, внутренние и внешние ссылки и другие. Также программа предупреждает об ошибках в этих данных.

Как только список всех URL сайта был получен, его можно загрузить в Netpeak Checker и уже проверить непосредственно на факт индексации поисковыми системами.

Почему не индексируется сайт?

1. Новый сайт . Иногда нужно просто подождать. Страницы в индекс не попадают все и сразу. Часто этот процесс растягивается на несколько месяцев.

2. Нет карты сайта (sitemap) . Качественная карта сайта поможет поисковым роботам быстрее просканировать и проиндексировать ваш сайт. Ссылку на карту нужно добавить в панель вебмастеров.

3. Ошибки на сайте . Панели вебмастеров регулярно оповещают владельцев сайтов об ошибках. Заметили проблему в индексации? Смотрите, какие ошибки находит робот, и исправляйте их.

Частая ошибка при несознательном изменении настроек CMS или хостинга. В коде страниц сайта появляется следующая строка:

5. Ошибка с robots.txt . Часто советуют закрывать в robots.txt всё ненужное. Особенность файла robots.txt в том, что один лишний символ может открытый для индексации сайт превратить в закрытый. Даже если вы правильно закрыли часть сайта, ненароком можно было зацепить нужные вещи, которые находятся глубже. Ваш сайт закрыт от индексации, если вы видите у себя в robots.txt эту конструкцию:

User-agent: * Disallow: /

Выводы

Цель владельца сайта — чтобы все страницы, открытые для индексации, были в индексе поисковой системы. Достичь этого сложно. К тому же важно следить за процессом занесения страниц в индекс: резкие изменения в положительную или отрицательную сторону — сигнал о проблеме. Мы описали четыре способа проверки индексации страниц сайта:

  1. В панелях вебмастеров Google и Яндекс.
  2. С помощью поискового оператора «site:».
  3. С помощью плагинов, вроде RDS bar, и буркмарклетов.
  4. В специальных сервисах, например, Netpeak Spider.

Часто дело не в индексации, а в подходе к оптимизации. Хотите индексироваться и ранжироваться — отвечайте на запрос пользователя лучше всех. В таком случае все описанное выше понадобится только для фиксации хорошего результата.

P.S. Бонус для тех, кто дочитал :)

Держите таблицу , с помощью которой я работаю с индексацией сайтов. Как работать с таблицей?

  1. Сделать копию.
  2. Выбрать доменную зону.
  3. Загрузить в столбец А список URL-адресов.
  4. Подождать результатов (чем больше адресов, тем дольше надо ждать).

В итоге получаем приблизительно такую картину:

Затем можно выделить столбцы B, C и скопировать данные на соседние два столбца. Так вы сохраните результаты на текущую дату для сравнения с результатами индексации через определенное время. А вот еще одна таблица для фиксации результатов выдачи по оператору «site:» для Yandex. Инструкция проста:

  1. Выбрать доменную зону.
  2. Выбрать регион.
  3. Ввести запрос (адрес сайта).
  4. Поставить «1», если хотите получить адрес и заголовок.
  5. Ввести количество страниц выдачи, которые вы хотите сохранить (от 1 до 100).

С помощью этой таблички я не раз находил проблемные Title или лишние страницы в индексе.

Лучшие статьи по теме