Поисковый робот

Поисковый робот

Поиско́вый ро́бот («веб-пау́к», краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный браузер. Он анализирует содержимое страницы, сохраняет его в некотором специальном виде на сервере поисковой машины, которой принадлежит, и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Также многие поисковые системы предоставляют пользователю возможность самостоятельно добавить сайт в очередь для индексирования. Обычно это существенно ускоряет индексирование сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью указать на его существование.

Ограничить индексацию сайта можно с помощью файла robots.txt, однако некоторые недобросовестные боты могут игнорировать наличие этого файла. Полная защита от индексации может быть обеспечена другими механизмами, например установкой пароля на странице либо требованием заполнить регистрационную форму перед тем, как получить доступ к содержимому.

См. также

Ссылки



Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Поисковый робот" в других словарях:

  • поисковый агент — поисковый робот автомат агент паук Специальная программа, которая постоянно обходит сеть и собирает информацию с веб страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска …   Справочник технического переводчика

  • Робот (программа) — У этого термина существуют и другие значения, см. Робот (значения). См. также: Бот Робот, или бот, а также интернет бот, www бот и т. п. (англ. bot, сокр. от англ. robot)  специальная программа, выполняющая автоматически… …   Википедия

  • Робот (программное обеспечение) — У термина «робот» существуют и другие значения. У термина «бот» существуют и другие значения. Робот или бот, а также интернет бот, www бот и т.п. (англ. bot, сокр. от англ. robot) специальная программа, выполняющая автоматически и/или по… …   Википедия

  • Google — (Гугл) Крупнейшая поисковая система Google, сервисы и инструменты Google История создания поиска Google, собственники и руководство Google, Google Apps, Google Maps, Google Chrome, Google Earth ,Picasa, Google Video, Google Images Google+,… …   Энциклопедия инвестора

  • Google — У этого термина существуют и другие значения, см. Google (значения). Google …   Википедия

  • Бот (программа) — У термина «робот» существуют и другие значения. У термина «бот» существуют и другие значения. Робот или бот, а также интернет бот, www бот и т.п. (англ. bot, сокр. от англ. robot) специальная программа, выполняющая автоматически и/или по… …   Википедия

  • Googlebot — Тип Поисковый робот Автор Google Сайт GoogleBot FAQ Googlebot поисковый робот компании Google, используемый для сканирования мировой сети и пополнения поискового индекса системы Google …   Википедия

  • Google (поисковая система) — У этого термина существуют и другие значения, см. Google. Google (произносится /ˈguːgl/, «гугл»)  первая по популярности (77,04 %[1]) в мире поисковая система, обрабатывающей 41 млрд 345 млн запросов в месяц (доля рынка… …   Википедия

  • Поисковая система — – (англ. search engine, синонимы: искалка, поисковый сервер, поисковая машина) – Инструмент для поиска информации в Интернете. Как правило, работа поисковой машины состоит из двух этапов. Специальная программа (поисковый робот, автомат, агент,… …   Энциклопедический словарь СМИ

  • МегаФон — У этого термина существуют и другие значения, см. Мегафон (значения). Координаты: 55°44′42.44″ с. ш. 37°37′20.86″ в. д. / 55.745122° с. ш. 37.622461° в. д.  …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»