logo

Опрос

Какой вид доступа в интернет, Вы сейчас используете?
 

Рекомендуем:


ПОИСКОВЫЕ СИСТЕМЫ
Вес «готовые» подборки ссылок, независимо от их размера и структуры, пригодны лишь в качестве инструментов для грубого поиска. Подумайте — ведь чаше всего мы с вами ищем в Сети не абстрактный сайт, будь он хоть трижды специализированным конкретную информацию, участок текста, содержащий нужные нам сведения.
 
Но выход есть — воспользоваться поисковыми системами, которые не ждут, пока пользователь внесет сайт в их каталог, а сами периодически обшаривают вес пространство Сети. Иногда эти системы называют «поисковыми роботами» или даже «пауками».
 
Ползая по хитрым переплетениям Сети, «пауки» ежедневно и даже ежечасно заползают практически на все доступные страницы и заносят их в специальный индекс, громадную базу данных, по которой впоследствии и ведется поиск. Эта база данных обновляется гораздо чаше, чем в каталогах — примерно раз в месяц производится се персиндсксация. Конечно, даже при такой частоте обновления в базах поисковиков со временем образуются залежи «мертвых» ссылок, зато по сравнению с каталогами их доля в несколько раз меньше. А уж об объеме информации и вовсе не приходится говорить — если большинство поисковиков знакомо только с небольшой долей содержимого Сети, то поисковым роботам доступен каждый ее уголок, каждая страничка. Не проводится здесь и цензуры, селекции — а значит, поисковики гораздо более беспристрастны, чем тс же каталоги.
 
Поисковый робот, в отличие от человека, беспристрастен и равнодушен к рекламным завлекалочкам. Его задача проста: «сфотогра-фировать» содержимое каждой странички на сайте и занести его в общий индекс. Создатели сайтов «пауков» уважают и даже заискивают перед ними, поднося мохнатому чудишу готовый список кодовых слов, определяющих тематику сайта. Например, страничка книжного издательства может содержать кодовые слова: «книги», «литература», «издания», «детективы», «фантастика», «книга — почтой»...
 
Однако поисковые роботы редко полагаются только на внутренний «индекс» странички. Нередки случаи, когда авторы сайтов намеренно заполняли «индекс» словечками типа «секс», «порно» и им подобными. Разумеется, в результате наблюдался необъяснимо высокий интерес к этим, в общем-то невинным и чаше всего неинтересным страничкам. Поэтому большинство серьезных поисковых систем не ограничиваются взглядом в индекс, а добросовестно сканируют всю страничку — на всякий случай.
 
Что происходит потом? Пользователь, зайдя на страничку «поисковика», вводит слово, по которому должен будет осуществляться поиск. А затем лицезреет долгожданный результат — гору полезных и бесполезных ссылок.
 
Увы, осуществлять поиск по отдельным словам — работа весьма неблагодарная. Особенно трудно совладать с разбушевавшимся конем-поисковиком тем, кому нужно задать поиск по очень специфической теме, оперируя при этом самыми простыми словами. Например, автор является давним поклонником группы Software, работающей в жанре «электронной симфонии». Понятно, что слово software для поисковика может ассоциироваться со многим по только в последнюю очередь с музыкальной группой. Если же добавить к запросу еще и electronic music — возникнет объясненная выше информационная каша. Именно для решения этой проблемы на большинстве серверов введен так называемый «сложный поиск». Часто для его рсализации применяются «расширенные» формы запроса — на них можно выйти, выбрав меню Сложный поиск или Расширенный поиск на любом поисковом сервере.
 
Впрочем, «матерые» ветераны интернет-поиска относятся к готовым «формам» весьма критически — и поражают воображение новичков, самостоятельно составляя сложные запросы-формулы с использованием специальных команд-операторов. Этим нехитрым искусством можете овладеть и вы — если, конечно, прочтете главы этого раздела AltaVista, Яндекс. Апорт!
 
Большинство все же пользователей предпочитает ограничиваться простыми запросами. Поисковикам приходится лишь признавать этот прискорбный факт и самим делать шаг навстречу незадачливым искателям. Сегодня большинство поисковых машин оснашены сложным механизмом сортировки, который позволяет частично отфильтровать заведомый мусор и оттеснить его в конец списка результатов. А на первые места в нем будут претендовать странички, обладающие большей степенью релевантности, то есть ожидаемой степени соответствия странички запросу пользователя.
 
Мы помним, что индексируя страницу, поисковик работает сразу с несколькими элементами ее содержания:
  • Заголовок страницы.
  • Перечень «ключевых слов», составленный ее автором.
  • Краткое описание странички, также содержащееся в се теле. Для пользователей эта информация, как и список ключевых слов, остается невидимой.
  • Собственно содержимое странички.

 



 

Опрос

Каким провайдером вы пользуетесь?
 

Интернет-провайдер "Неаполь" © 2010 All Rights Reserved