Поисковый интернет
Опрос
Рекомендуем:
|
| ПОИСКОВЫЕ СИСТЕМЫ |
|
Страница 1 из 2 Вес «готовые» подборки ссылок, независимо от их размера и структуры, пригодны лишь в качестве инструментов для грубого поиска. Подумайте — ведь чаше всего мы с вами ищем в Сети не абстрактный сайт, будь он хоть трижды специализированным конкретную информацию, участок текста, содержащий нужные нам сведения. Но выход есть — воспользоваться поисковыми системами, которые не ждут, пока пользователь внесет сайт в их каталог, а сами периодически обшаривают вес пространство Сети. Иногда эти системы называют «поисковыми роботами» или даже «пауками». Ползая по хитрым переплетениям Сети, «пауки» ежедневно и даже ежечасно заползают практически на все доступные страницы и заносят их в специальный индекс, громадную базу данных, по которой впоследствии и ведется поиск. Эта база данных обновляется гораздо чаше, чем в каталогах — примерно раз в месяц производится се персиндсксация. Конечно, даже при такой частоте обновления в базах поисковиков со временем образуются залежи «мертвых» ссылок, зато по сравнению с каталогами их доля в несколько раз меньше. А уж об объеме информации и вовсе не приходится говорить — если большинство поисковиков знакомо только с небольшой долей содержимого Сети, то поисковым роботам доступен каждый ее уголок, каждая страничка. Не проводится здесь и цензуры, селекции — а значит, поисковики гораздо более беспристрастны, чем тс же каталоги. Поисковый робот, в отличие от человека, беспристрастен и равнодушен к рекламным завлекалочкам. Его задача проста: «сфотогра-фировать» содержимое каждой странички на сайте и занести его в общий индекс. Создатели сайтов «пауков» уважают и даже заискивают перед ними, поднося мохнатому чудишу готовый список кодовых слов, определяющих тематику сайта. Например, страничка книжного издательства может содержать кодовые слова: «книги», «литература», «издания», «детективы», «фантастика», «книга — почтой»... Однако поисковые роботы редко полагаются только на внутренний «индекс» странички. Нередки случаи, когда авторы сайтов намеренно заполняли «индекс» словечками типа «секс», «порно» и им подобными. Разумеется, в результате наблюдался необъяснимо высокий интерес к этим, в общем-то невинным и чаше всего неинтересным страничкам. Поэтому большинство серьезных поисковых систем не ограничиваются взглядом в индекс, а добросовестно сканируют всю страничку — на всякий случай. Что происходит потом? Пользователь, зайдя на страничку «поисковика», вводит слово, по которому должен будет осуществляться поиск. А затем лицезреет долгожданный результат — гору полезных и бесполезных ссылок. Увы, осуществлять поиск по отдельным словам — работа весьма неблагодарная. Особенно трудно совладать с разбушевавшимся конем-поисковиком тем, кому нужно задать поиск по очень специфической теме, оперируя при этом самыми простыми словами. Например, автор является давним поклонником группы Software, работающей в жанре «электронной симфонии». Понятно, что слово software для поисковика может ассоциироваться со многим по только в последнюю очередь с музыкальной группой. Если же добавить к запросу еще и electronic music — возникнет объясненная выше информационная каша. Именно для решения этой проблемы на большинстве серверов введен так называемый «сложный поиск». Часто для его рсализации применяются «расширенные» формы запроса — на них можно выйти, выбрав меню Сложный поиск или Расширенный поиск на любом поисковом сервере. Впрочем, «матерые» ветераны интернет-поиска относятся к готовым «формам» весьма критически — и поражают воображение новичков, самостоятельно составляя сложные запросы-формулы с использованием специальных команд-операторов. Этим нехитрым искусством можете овладеть и вы — если, конечно, прочтете главы этого раздела AltaVista, Яндекс. Апорт! Большинство все же пользователей предпочитает ограничиваться простыми запросами. Поисковикам приходится лишь признавать этот прискорбный факт и самим делать шаг навстречу незадачливым искателям. Сегодня большинство поисковых машин оснашены сложным механизмом сортировки, который позволяет частично отфильтровать заведомый мусор и оттеснить его в конец списка результатов. А на первые места в нем будут претендовать странички, обладающие большей степенью релевантности, то есть ожидаемой степени соответствия странички запросу пользователя. Мы помним, что индексируя страницу, поисковик работает сразу с несколькими элементами ее содержания:
|
Опрос
Интернет-провайдер "Неаполь" © 2010 All Rights Reserved