|
Webcrawler - старейшина среди полнотекстовых поисковых систем. Webcrawler осуществляет поиск не только в WWW, он является интерфейсом
к поиску Gopher и поиску по FTP. Интерфейс у Webcrawler очень простой и понятный. Он несколько напоминает Excite. На основной странице
помимо поля ввода запроса присутствуют: список каналов (рубрик каталога), четыре кнопки для получения помощи, отправки E-Mail и т.д., а
также несколько "новостей дня". Каталог у Webcrawler по структуре схож с каталогом на Excite, хотя и имеет больше разделов, существует и
аналогичная Excite возможность настройки, создания "своего канала", где будут выводиться только интересующие пользователя новости и т.д.
Система поддерживает не только запросы с полным набором логических операций над словами, но и запросы на естественном языке. Объем индекса
на Webcrawler меньше чем у других рассмотренных систем, однако, на простые запросы Webcrawler выдает гораздо больше релевантных
результатов, чем, например, Altavista. При составлении запроса для Webcrawler следует помнить, что по умолчанию он использует логический
оператор ИЛИ, т.е. запрос "Экономическая теория" интерпретируется как "Экономическая или теория" - на странице должно
присутствовать хотя бы одно из этих слов. Хотя документы, в которых присутствуют оба слова, появляются первыми, такой подход
снижает релевантность результатов. Результаты поиска на Webcrawler по умолчанию выдаются в очень компактной форме - выводится только
заголовок страницы, являющийся гиперссылкой на нее и процент релевантности. Для того чтобы изменить вид вывода результатов, надо
перейти на отдельную страницу, эту операцию приходится повторять после каждого поиска. Если критерию поиска удовлетворяют страницы из
каталога, то возле ссылки на страничку появляется ссылка "обзор" ("review"). Кроме того, в правой части страницы с результатами поиска
выводится несколько иконок, нажав на которые, можно поискать ключевые слова в базе данных книг, просмотреть карту (если было упомянуто
географическое название) и т.д. Поиск русскоязычных ресурсов на Webcrawler теоретически возможен, но количество проиндексированных
страниц очень мало.
Способы увеличения релевантности страницы:
1. Наиболее весомо оцениваются ключевые слова в заголовке страницы (тэг <title> ).
2. Ключевые слова в тексте страницы, причем чем ближе к началу текста страницы – тем лучше.
3. Ключевые слова в alt тэгах (описания к графике страницы).
|