Infoseek & Hotbot

Das rasante Wachstum des World Wide Web führt zu einem immer komplexer und umfassender werdenden Informationsangebot. Laut Forrester Research kommen täglich mehr als 170000 Seiten dazu. Um sich in dem Dschungel der Web-Seiten zurechtzufinden, sind ausgefeilte Suchsysteme nötig.

Von: Ernst-Gerd vom Kolke

Infoseek (http://www.infoseek.com) gehört wie Altavista, Excite oder Hotbot zu den bekanntesten Suchmaschinen im Internet. Das System indexiert den vollständigen Inhalt der aufgenommenen WWW-Seiten und ermöglicht somit eine Volltextrecherche. Infoseek bietet unter den Namen "Ultrasmart" und "Ultraseek" zwei unterschiedliche Suchmöglichkeiten an, die sich beide auf den gleichen Datenbestand beziehen. Ultrasmart stellt die Standardform der Suche dar. Ultraseek bietet in vordefinierten Suchmasken erweiterte Suchmöglichkeiten.

Daneben offeriert Infoseek unter der Bezeichnung news center nach Kategorien gegliederte aktuelle Schlagzeilen. Diese können auch - ähnlich wie bereits für Excite beschrieben - "personalisiert" werden, so daß der Nutzer bei jedem "Besuch" bei Infoseek eine nach seinen Interessen definierte Auswahl an Nachrichten vorfindet. Optional lassen sich diese Informationen auch per EMail oder durch "BackWeb" bereitstellen. Smart info liefert Suchmöglichkeiten nach speziellen Informationen wie etwa EMail-Adressen, Börsendaten, Telefonnummern oder Unternehmensprofile.

Mit Ultrasmart kann der Benutzer auch andere Informationsressourcen im Internet anzapfen. Dazu gehören: Usenet Newsgroups: Infoseek durchforscht die Artikel der einzelnen Internet-Newsforen. News Wires: Die "Timely-News"-Dokumente enthalten Schlagzeilen, Weltnachrichten sowie Nachrichten aus Wirtschaft, Politik und Sport. Die Sammlung wird täglich auf den neuesten Stand gebracht. Premier News: Hier findet man tagesaktuelle Nachrichten von sieben größeren amerikanischen Nachrichtenorganisationen, unter ihnen CNN, die New York Times oder die Washington Post. EMail-Adressen: Hierbei werden EMail-Adressen auf WWW-Seiten aufgespürt. Company Directory: Diese Kategorie von Dokumenten ermöglicht eine spezielle Recherche nach Firmeninformationen (zum Beispiel Homepage eines Unternehmens, Adresse, Telefon, Tickersymbol et cetera) Web FAQs: Suche in der Liste der Frequently Asked Questions (FAQs), die in der Newsgroup news.answer enthalten sind. Die Informationen beziehen sich auf unterschiedliche Wissensbereiche, die von Sport und Hobby bis zu technischen Spezifikationen und Standards reichen.

Die Reihenfolge der Treffer wird - wie bei fast allen bisher beschriebenen Suchmaschinen - anhand eines Bewertungsschemas (Scoring Algorithm) bestimmt, das die Dokumente nach ihrem Score sortiert.

Ein Treffer wird durch folgende Faktoren definiert: Die Position der gesuchten Einzelwörter oder zusammenhängenden Wörter (phrases) im Text, zum Beispiel am Anfang oder im Titel. Die Häufigkeit, mit der die gesuchten Begriffe im Dokument vorkommen. Allgemeine Begriffe wie Computer oder game erhalten eine vergleichsweise niedrige Bewertung, da sie in vielen Seiten des WWW gefunden werden und somit zur Identifizierung von Seiten mit relevanten Informationen wenig geeignet sind. Umgekehrt erhalten spezifischere Suchworte, etwa Joystick oder Gamepad, höhere Bewertungen, da sie nicht auf vielen Seiten vorkommen.

Obgleich eine ANDOR-Verknüpfung vorgenommen wird - wie bei einer Reihe von Internet-Suchmaschinen üblich -, erhalten Dokumente, die beide Begriffe enthalten, keine höhere Bewertung. Die interne Reihenfolge wird dadurch bestimmt, wie häufig einzelne Ausdrücke vorkommen.

Suche nach Personennamen

Schreibt man die Suchbegriffe klein, werden die Worte klein- und großgeschrieben gesucht. Eigenschaftsnamen wie etwa Personennamen sollten daher mit Großbuchstaben am Anfang eingegeben werden. Personennamen (Vor- und Nachname) werden dabei nebeneinanderstehend gesucht (Eingabe: Bill Clinton). Sucht ein Benutzer mehrere Namen als ODER-Verknüpfung, sollte er sie durch Komma trennen (Eingabe: Bill Clinton, Al Gore).

Wie bereits erwähnt, stehen mit Ultrasmart und Ultraseek zwei unterschiedliche Suchmöglichkeiten zur Verfügung. Ultrasmart sucht einen Begriff zunächst im gesamten Datenbestand. Die Eingabe mehrerer Suchwörter führt dabei zu einer ANDOR-Verknüpfung. Es werden somit sowohl Dokumente erfaßt, in denen mehrere/alle Begriffe vorkommen, wie auch Dokumente, in denen die Begriffe allein vorkommen.

Jede weitere Suchanfrage bezieht Ultrasmart nur noch auf das vorherige Suchergebnis, was die Trefferauswahl reduziert. Das bedeutet, daß jede weitere Suchanfrage durch AND mit der vorausgegangenen Suche verknüpft wird.