Wer richtig sucht, braucht keine Ordnung

07.02.2003
Suchmaschinen fürs interne Netz gelten als Alternative zu komplexen Dokumentenmanagement-Systemen. Ihr Vorteil ist, dass sie in bestehende Arbeitsabläufe und technische Strukturen kaum eingreifen. Außerdem lassen sie sich oft einfacher implementieren.

Von: Dr. Johannes Wiele

In Unternehmensnetzen steckt geballtes Wissen. Man müsste die Schätze nur heben können. Die verstreute Ablage auf Clients und Servern in unterschiedlichen Abteilungen und Filialen und die Formatvielfalt mit Office-Dokumenten, E-Mails, HTML-Seiten und PDFs macht es schwierig, im Wust der Informationsbruchstücke die jeweils wichtigen Fragmente zu finden und zusammenzusetzen.

Der bekannteste Lösungsansatz für dieses Problem heißt "Dokumentenmanagement". Die angebotenen Softwareprodukte sind unterschiedlich aufgebaut, aber die meisten Systeme weisen ein gemeinsames Arbeitsprinzip auf: Wenn ein Dokument entsteht, wird es in ein konsequent durchstrukturiertes Ablagesystem eingeordnet. Je nach Produkt erfordert dies entweder auf der Ebene des Endanwenders oder im Bereich der Technik deutliche Änderungen jenes Vorgangs, den der User gewöhnlich als einfaches "Abspeichern" seines neuesten Dokuments kennt. Im Einzelfall muss der Anwender nach der Einführung eines Dokumentenmanagement-Systems beim Ablegen seiner Datei zusätzliche Informationen eintippen oder Entscheidungen treffen und Fragen beantworten: Ist das Dokument schon "reif" fürs Management-system? In welcher Abteilung ist es entstanden? Wer darf es einsehen? Zu welcher Dokumentkategorie gehört es?

Manche dieser Vorgänge lassen sich auch automatisieren, wenn beispielsweise die Software automatisch alle Dateien indiziert und die "Eigenschaften" von Office-Dokumenten auswerten kann. Dennoch bedeutet die Arbeit mit Dokumentenmanagement-Systemen generell, dass der Aufwand für den Ablagevorgang steigt. Wo es wichtig ist, vorhandene Datenbestände verzögerungsfrei auszuwerten, treten diese Nachteile allerdings in den Hintergrund.

Internet-Technik fürs interne Netz

Anders sieht es zum Beispiel dann aus, wenn nur gelegentlich eine Recherche nach intern gespeicherten Daten stattfindet oder wenn nur sichergestellt werden muss, dass alle Dateien auf bestimmten Servern auf Stichwörter hin untersucht werden. In diesem Fall lohnt es sich, über den Einsatz von Suchmaschinentechnik oder einfache Suchtools als Alternative nachzudenken. Muss ein Netzverantwortlicher lediglich prinzipiell eine Möglichkeit schaffen, Dokumente im Unternehmensnetz einer globalen Suche zugänglich zu machen, wird die Implementierung einer Suchmaschine wahrscheinlich weniger Aufwand und Kosten verursachen als der Einstieg ins komplexe Dokumentenmanagement - ein Argument, das vor allem für mittelständische und kleine Unternehmen oder auf Abteilungsebene von Bedeutung ist.

Viele Dateiformate

Suchwerkzeuge und Search Engines, wie man sie aus dem Internet kennt, setzen kein ausgefeiltes Ablagesystem voraus. Nach den Vorgaben des Anwenders arbeiten sie sich als "Crawler" durch die Datenbestände freigegebener Ordner und scannen sowohl Dateinamen als auch Dateiinhalte auf Stichwörter hin. Das Repertoire der Dateiformate ist dabei meist groß genug, alle gängigen Office-Formate und darüber hinaus weitere Standarddateitypen zuverlässig zu öffnen: Word, Office und Powerpoint in allen Varianten, RTF, TXT, HTML, XML und häufig auch PDF stellen für viele Produkte kein Problem mehr dar. Die Suche kann gewöhnlich mit mehr oder weniger ausgefeilten Boole’schen Operationen verfeinert werden, und die gefundenen Dateien lassen sich zumeist direkt aus dem Ergebnisfenster heraus öffnen. Die Zahl und Qualität der Funktionen zur Verfeinerung einer Suche und die Vielfalt der Formate sind dabei diejenigen Eigenschaften, mit denen sich die Spezialprogramme auch jetzt noch von den Windows-Bordmitteln abheben.

Client-Programm oder Indexserver

Generell problematisch ist, dass die Suche selbst normalerweise deutlich mehr Zeit kostet als in der geordneten Welt der Dokumentenmanagement-Systeme. Abhilfe schaffen Suchwerkzeuge, die auf den Unternehmenseinsatz vorbereitet sind und mit einem zentralen Indexserver arbeiten, der seine Volltextindizes selbstständig regelmäßig auf den neuesten Stand bringt. Dieser Ansatz löst auch das Problem, dass auf Clients installierte Suchmaschinen die Leistung des jeweiligen Anwender-PCs spürbar in Anspruch nehmen können - was wiederum keinen Nachteil darstellt, wenn das Suchen an einem bestimmten PC die Hauptaufgabe darstellt. Nur auf schnellen Rechnern lohnen sich reine Client-Programme, die selbst Indizes erstellen. Darüber hinaus können Volltextindizes zu großen Dateien anwachsen, wenn ein Anwender viele textlastige Dokumente in verschiedenen Sprachen speichert.

Zwei typische Beispiele für intern verwendbare Suchsoftware stellen die Produkte "Cool Find" von Nihuo Software als einfaches Client-Programm und "Enterprise Search" von Copernic als servergestütztes System mit automatischer Indizierung dar.

Cool Find ist ein simples Programm, dass alle von einem Client aus erreichbaren Laufwerke nach Informationen in Dateinamen und Dateiinhalten scannt. Als Business-Tool für gelegentliche Recherchen eignet sich das System deshalb, weil es neben typischen Standard-, Multimedia- und Webdateitypen alle Office-Formate durchsuchen kann, und zwar auch in gepackten Archiven. Im Repertoire ist auch das PDF-Format des Adobe-Acrobat-Systems. Ein sinnvolles Feature ist die Möglichkeit, einmal zusammengestellte Suchabfragen - etwa die zu durchsuchenden Dateiformate und die mit Boole’scher Logik kombinierten Suchwörter - für die spätere Verwendung abzuspeichern. Der Implementierungsaufwand beschränkt sich auf die Client-Installation. Informationen über ein weiteres Suchprogramm, "Superior Search", finden Sie in dieser Ausgabe auf Seite 31.

Das Copernic-System ist für höhere Anforderungen konzipiert, wobei der Katalog der Dateitypen und die Verfeinerungsfunktionen ähnlich sind. Das Produkt arbeitet servergestützt, wobei die Hardwareanforderungen moderat sind: Ein Pentium-II-Rechner mit 512 MByte RAM und 800 MHz Taktfrequenz unter Windows 2000 oder NT 4 reicht, allerdings sollte genug Platz für die Indizes zur Verfügung stehen. Enter-prise Search durchkämmt Intranets, Extranets und Windows-Dateisysteme und indiziert alle Dateien automatisch, die dort neu auftauchen oder verändert werden. Die Update-Startzeiten für die Indizes lassen sich individuell einstellen. Die Anwender rufen den Server als Intranet-Server auf und geben ihre Suchanfragen in eine Webmaske ein, die der Administrator individuell modifizieren und mittels ASP-Technik in bestehende Unternehmensportale einbinden kann. Auf Wunsch kann die Suche auf E-Mails und Anhänge in Exchange-Servern und aufs Internet ausgedehnt werden.