Infoseek & Hotbot

Volltextsuche möglich

Hotbot (http://www.hotbot.com) ist seit Frühjahr 1996 im Internet verfügbar und gehört ebenfalls zu den großen Suchmaschinen für das Internet. Hotbot ermöglicht eine Volltextsuche, da die WWW-Dokumente vollständig invertiert werden. Die Reihenfolge, in der Treffer einer Recherche angezeigt werden, wird durch eine Trefferquote (Scoring Agorithmus) bestimmt. Bei Hotbot gehen folgende Hauptfaktoren in die Auswahl ein:

Die Häufigkeit, mit der Suchbegriffe im Dokument vorkommen: Dieser Faktor wird zum einen noch damit gewichtet, wie speziell beziehungsweise allgemein ein gesuchter Ausdruck ist. Allgemeine Begriffe tragen weniger zum Score bei als spezifische. Überdies geht die Länge des Dokumentes in die Bewertung ein: Sind die häufig vorkommenden Suchbegriffe in einem kurzen Dokument enthalten, erhöht dies die Trefferquote, bei einem längeren Dokument verringert sie sich. Dokumente, bei denen der Suchbegriff im Titel eines Dokumentes vorkommt, werden höher bewertet, als wenn er im Text enthalten ist. Ist ein Suchbegriff als Keyword im Meta-Tag enthalten, dann wird die Seite höher bewertet, als wenn er im Text vorkommt. Steht er jedoch im Titel eines Dokumentes, hat dies wiederum höhere Priorität.

Präzise Suchbegriffe nötig

Bei der Eingabe der Suchbegriffe spielt die Groß- und Kleinschreibung keine Rolle - bis auf eine Ausnahme (case insensitive search). Worte, die außer dem Anfangsbuchstaben weitere Großbuchstaben enthalten (zum Beispiel die Computerfirma NeXT), werden exakt in der eingegebenen Schreibweise gesucht (case sensitive search), weil man dahinter eine eindeutige Bedeutung vermutet.

Eine Wortstammsuche ist mit Hotbot bisher nicht möglich. Eine Besonderheit ist allerdings, daß allgemeine Begriffe wie of oder the bei der Suche wie Wildcarts behandelt werden. Das heißt, eine Recherche nach end of the world findet Dokumente, in denen die Begriffe in der exakten Reihenfolge vorkommen. Zusätzlich werden aber auch Dokumente mit end comes to world angezeigt. Daher sollte der Benutzer möglichst präzise und aussagekräftige Begriffe verwenden.

Hotbot unterscheidet zwischen einem Standardmodus und einem Expertenmodus. Im Standardmodus werden die in die Suchmaske eingegebenen Ausdrücke als AND-Verknüpfung gesucht (all the words). Alternativ kann über das Popup-Menü eine OR-Verknüpfung veranlaßt werden (any of the words).

Außerdem ermöglicht Hotbot eine Näherungssuche, bei der die Begriffe nebeneinanderstehend gesucht werden (the phrase). Eine andere Syntax für diese Form besteht darin, die Termini in Hochkommata zu fassen (Eingabe: "online marketing").

Ferner können Benutzer nach zwei weiteren speziellen Informationen forschen:

the person sucht nach Personennamen. Die Abfrage wird als Näherungssuche durchgeführt (Eingabe: Dwight D Eisenhower findet "Dwight D Eisenhower", "Dwight Eisenhower" oder "Eisenhower, Dwight") link to this URL erlaubt eine Suche, bei der eine URL in das Fenster eingetragen wird (Eingabe: http:// www.fh-regensburg.de/index.html). Als Ergebnis zeigt das System WWW-Seiten an, die einen Link auf die angegebene URL enthalten. Überdies kann der Anwender auch mit expliziten Booleschen Operatoren (the Boolean expression) arbeiten. Hierbei lassen sich auch Klammern verwenden, um die Abarbeitung der Operatoren zu strukturieren (Eingabe: online and (marketing or markets)). Der Standardmodus gestattet außerdem, die Zahl der Dokumente (Standard: Return 10) beziehungsweise das Format der Ausgabe (full description, brief description, URLs only) zu bestimmen.

Hotbot bietet ferner die Gelegenheit, die ursprüngliche Suchmaske zu erweitern, indem man einen eingegebenen Suchschritt durch einen Mausklick auf die Modify-Option verändert.

Mit dem erweiterten Menü lassen sich zusätzliche Begriffe (words) oder Begriffskombinationen (phrase) hinzufügen oder ausschließen:

Die Must-Option macht den eingetragenen Begriff zwingend zum Bestandteil für ein Trefferdokument (AND-Verknüpfung). Die Should-Variante gibt den Dokumenten, die das Suchwort enthalten, eine höhere Bewertung als solche, in denen es nicht vorkommt. Diese Dokumente sind zwar ebenfalls in der Treffermenge enthalten, bekommen aber ein niedrigeres "Ranking" (ANDOR-Verknüpfung). Die Must-Not-Version schließt Dokumente aus, die die gesuchte Bezeichnung enthalten (NOT-Verknüpfung).

Mit einem Mausklick auf open all wechselt Hotbot in einen Expertenmodus. Diese Art der Abfrage stellt unter anderem weitere Möglichkeiten der Eingrenzung über formale Kriterien zur Verfügung:

Date erlaubt es, einen Zeitpunkt (after/before) beziehungsweise Zeitraum (within) für die Trefferdokumente anzugeben. Die Standardeinstellung ist whenever - also keine zeitliche Begrenzung der Trefferdokumente. Location ermöglicht eine geographische Einschränkung der Suche. Diese Rechercheform bietet noch weitere Unterscheidungen: So steht Anyplace für keine geographische Eingrenzung (Standardeinstellung), Cyberplace für eine Beschränkung auf bestimmte Domains (zum Beispiel mit .de auf deutsche Webserver), auf bestimmte Kategorien von Servern (zum Beispiel mit .com auf Commercial-Server, also Firmen-Webserver) oder Geoplace für eine Begrenzung auf bestimmte Regionen (beispielsweise bei Nordamerika auf com, edu, org et cetera). Media Type gestattet, die zu suchenden Dokumente auf bestimmte Arten (zum Beispiel in Java geschriebene Dokumente) oder bestimmte Dateiformate (Grafikformate wie .gif) zu limitieren.

Im nächsten Teil dieser Serie werden die Suchmaschinen Lycos und Magellan ausführlich erläutert.

(cep)