Revolution von unten

11.05.2001

Das Internet eröffnet neue Welten für die Kommunikation. Auf den Siegeszug der E-Mail folgen Peer-to-Peer-Konzepte, die eine effiziente Zusammenarbeit und die bessere Nutzung vorhandener Ressourcen versprechen.

Von: Christoph Lange

Die Verheißung klingt verlockend: Mit Peer-to-Peer-Computing (P-to-P) sollen sich die im Überfluss vorhandenen Prozessor- und Speicherkapazitäten von PCs für zusätzliche Aufgaben nutzen lassen. Unternehmen könnten auf die Anschaffung neuer Hardware verzichten, Privatanwender via Internet ungenutzte Rechnerkapazitäten gegen Entgelt bereitstellen.

Nikos Drakos, Senior Analyst der Gartner Group, hält es sogar für möglich, dass das P-to-P-Modell Rechenzentren überflüssig macht, da die Skalierbarkeit von Distributed Computing - mehrere verteilte Rechner arbeiten gemeinsam an einer Aufgabe - immens sei. Auch würden dezentrale Backup-Konzepte, welche die Sicherungsdaten auf den Anwender-PCs speichern, Flaschenhälse bei Servern und Storage-Systemen beseitigen.

Das Konzept einer direkten Kommunikation zwischen Rechnern ist so neu nicht. Dass es derzeit einen wahren Hype erlebt, hängt vor allem mit den Möglichkeiten zusammen, die das Internet eröffnet. So nutzt die Musiktauschbörse Napster das P-to-P-Modell, damit Endanwender Songs direkt miteinander austauschen könnnen. Erfolg versprechend ist auch die teamorientierte Zusammenarbeit über das Internet, für die P-to-P-Anwendungen die benötigten Ressourcen vorhalten und verwalten.

Die von IT-Schwergewichten wie Microsoft, Sun oder HP angestrebten dezentralen Web-Services werden ebenfalls eine starke Peer-Komponente implementieren. Das .Net-Framework von Microsoft dient als Plattform, um P-to-P-Applikationen zu entwickeln. Dazu zählen beispielsweise Web-Services für Registrierung und Auffinden von Peers und Inhalten. Das Microsoft-Forschungsprojekt "Farsite" beschäftigt sich mit verteilten Speicherumgebungen in Verbindung mit einem serverlosen verteilten File-System. Sun hat vor kurzem die JXTA-Initiative angekündigt: Sie soll Entwicklern über einen Softwarelayer Basisfunktionen für Peer-Anwendungen bereitstellen (siehe Ticker oben rechts). Zusätzlichen Schwung erhält die P-to-P-Entwicklung durch die von Intel im August 2000 ins Leben gerufene Peer-to-Peer Working Group, welche die Standardisierung vorantreiben soll. Derzeit zählt sie 22 Mitglieder, darunter IBM und HP.

Verschiedene Peer-Konzepte

Für Peer-to-Peer-Computing gibt es unterschiedliche Definitionen (siehe Kasten). Allen P-to-P-Anwendungen gemeinsam ist, dass die Beteiligten eine spezielle Client-Software verwenden. Diese richtet einen Bereich der Festplatte für den Datenaustausch mit den Peers ein. Die Partner-Computer greifen direkt auf die hier abgelegten Dateien zu. Die Kommunikation erfolgt meist über Instant Messaging.

Bei der "reinsten" Form des P-to-P-Computing tauschen ausschließlich die Clients Informationen miteinander aus, wobei auch Server als Peer-Client agieren können. Der Kontakt zu den Peers wird entweder über bekannte Adressen (IP, MAC, E-Mail) oder mithilfe von Broadcasts hergestellt, die jedoch viel Bandbreite verschlingen. Ein Nachteil ist, dass sich die Peer-Suche nicht anhand von Inhalten oder der Identität von Anwendern steuern lässt.

Abhilfe schaffen Client-Applikationen mit File- und Content-Sharing. Sie ermöglichen es, dass Client-PCs ihre Daten fortlaufend indexieren und automatisch zugänglich machen, sobald ein Peer sich mit ihnen verbindet. Das Index-Verzeichnis wird zwischen den Clients repliziert, ein zentraler Server ist deshalb nicht nötig.

Das servergestützte P-to-P-Modell erlaubt die zentrale Suche nach Gleichgesinnten und den von ihnen öffentlich zugänglich gemachten Inhalten. Der Server stellt hierfür ein Adressverzeichnis und einen Index mit den derzeit online verfügbaren Peer-Inhalten bereit. Einige Anwendungen beschränken sich darauf, das Verzeichnis mit den Peers vorzuhalten. Sobald ein Client mithilfe des Servers den gewünschten Partner lokalisiert hat, kommunzieren die beiden Peers direkt miteinander.

Die am stärksten zentralisierte P-to-P-Methode ist das Distributed Computing, bei dem mehrere PCs ihre Ressourcen via Intra- oder Internet für Rechenaufgaben zur Verfügung stellen. In der wissenschaftlichen Forschung wird dieses Verfahren bereits seit Jahren genutzt. Ein Master-Server kontrolliert die beteiligten Rechner und koordiniert die verschiedenen Jobs. Er sammelt die Einzelergebnisse ein und setzt sie zu einem Ganzen zusammen. Auf diese Weise lassen sich komplexe Berechnungen durch kostengünstige PCs erledigen. Mit einer großen Rechnerzahl sind Leistungen möglich, die an Supercomputer heranreichen.

Die Übergänge zwischen den verschiedenen P-to-P-Konzepten sind fließend. Sie unterscheiden sich vor allem anhand der Aufgabenteilung zwischen Client und Server.

Einsatzgebiete für P-to-P

Zu den derzeit interessantesten Nutzungsmöglichkeiten von Peer-to-Peer-Anwendungen in Unternehmen zählt der so genannte Collaboration-Bereich. Damit ist die teamorientierte Zusammenarbeit über das Intra- und Internet mithilfe von Instant Messaging, Chat und Dokumentenbearbeitung gemeint. Der gemeinsame Zugriff auf die jeweils aktuelle Version von Dateien erhöht die Produktivität, da sich die Zeit für das Sichten von Projektunterlagen reduziert und alle Mitarbeiter mit denselben Versionen arbeiten. Gruppen können standortunabhängig effizient zusammenarbeiten. Collaboration-Lösungen reduzieren den E-Mail-Verkehr, da Dateien nicht mehr an jedes Mitglied der Projektgruppe verschickt werden müssen. Dies entlastet zudem die Speichersysteme. Ein weiterer Vorteil: Das Unternehmen benötigt keine aufwändigen Virtuellen Privaten Netze, da die Teamarbeit bereits verschlüsselt über das Internet erfolgt.

Der wohl bekannteste Vorreiter bei Collaboration-Software ist der "Vater" von Lotus Notes, Ray Ozzie, mit seiner neuen Firma Groove Networks. Das Produkt "Groove" ist bereits bei den ersten Pilotkunden im Einsatz. Etwa zur Jahresmitte soll die Software auf den Markt kommen. Das 10 MByte große Client-Tool bringt die Peers über E-Mail oder Instant Messaging zusammen. Die Kommunikation erfolgt über einen dedizierten Festplattenbereich der Client-Rechner. Groove unterstützt Voice- und Textnachrichten, Chat-Diskussionen, Zeichen- und Textverarbeitungs-Tools sowie gemeinsame Dateizugriffe. Die Software bietet zudem eine Entwicklungsplattform, um eigene Tools und Applikationen zu bauen.

Das Serverelement "Groove Network Services" stellt Softwareverteilung, Benutzerverwaltung und Sicherheits-Policies bereit. Die so genannten Relay Services erlauben es, offline zu arbeiten. Bei erneuter Peer-Verbindung synchronisieren sie die geänderten Dateien und spielen - falls erforderlich - Softwareupdates auf. Dateien verschlüsselt die Software, bevor sie diese speichert. Datenübertragungen sichert sie mit einer 192-Bit-Verschlüsselung. Etwa Ende dieses Jahres sollen Dokumentenmanagement, Workflow, Projektmanagement sowie XML-Konnektoren zur Integration mit ERP-, CRM- und SCM-Systemen hinzu kommen.

Im Unterschied zu Groove arbeitet Mangosoft mit einer zentralen Serverkomponente als Speicherort für die Daten. Der "Mangomind"-Service stellt den an der Peer-Gruppe beteiligten Mitarbeitern einen gemeinsam genutzten Festplattenbereich über das Internet zur Verfügung. Alle berechtigten Peers können auf Dateien zugreifen und sie bearbeiten. Anders als bei bisherigen Internet-Storage-Lösungen muss der Anwender keine lokale Kopie der Datei erstellen, sondern kann sie online bearbeiten. Mangosoft erreicht dies über ein eigenes Dateisystem, das auf dem Windows-32-File-System basiert (siehe Abbildung Ticker links). Damit können mehrere Anwender von beliebigen Orten aus gleichzeitig mit Dateien arbeiten. Sobald eine Datei geöffnet wird, kopiert das Tool sie in den Cache des lokalen Systems. Anschließend synchronisiert Mangomind sie mit der im Internet gespeicherten Version. Damit erledigt sich auch das Problem der Datensicherung von mobilen Geräten: Bei jeder Verbindung mit dem Internet wird automatisch die aktuelle Version zentral gespeichert.

Durch die Gewährung von Schreib- und Lesezugriffen stellt die Software sicher, dass Änderungen konsistent vollzogen werden. Nehmen zwei Anwender parallel offline Änderungen an einer Datei vor, speichert Mangomind beide Versionen und benachrichtigt die User, dass ein Konflikt vorliegt. Zugriffsrechte für Dateien lassen sich auf File- und Directory-Ebene setzen. Eine 128-Bit-Verschlüsselung sorgt dafür, dass Daten sicher übertragen und gespeichert werden. Die meisten Windows-Applikationen arbeiten laut Hersteller ohne Anpassungen mit Mangomind zusammen. Für sie erscheint das Laufwerk wie ein im lokalen Netzwerk freigegebenes Volume.

Die Einsatzmöglichkeiten von Distributed Computing in Unternehmen sind begrenzt. Standardaufgaben wie Buchführung, Bestellwesen oder Lagerverwaltung lassen sich mit herkömmlichen Methoden besser erledigen. Für Spezialaufgaben wie Data Mining kann dieser Ansatz jedoch Vorteile bieten, zum Beispiel, um aus sehr großen Datenmengen wie Kreditkarteninformationen oder Liefermengen auffällige Muster herauszufinden. Eine interessante Spezialform sind Lasttests von Web-Servern. Anstelle der bisher üblichen Simulationen werden die Maschinen mithilfe der freien Ressourcen von echten Clients unter Stress gesetzt.

Gute Aussichten

Die Zusammenarbeit via Internet-Collaboration bietet greifbare Vorteile gegenüber E-Mail-basierenden Groupware-Ansätzen. Für Backup-Strategien eröffnet das P-to-P-Konzept ebenfalls interessante Perspektiven - sei es mit Produkten wie Mangomind, die das Problem der Sicherung mobiler Geräte lösen, sei es mit Lösungen für verteilte Backups, die freie PC-Festplattenressourcen nutzen. Distributed Computing hat seine Fähigkeiten in der Forschung bereits nachhaltig unter Beweis gestellt. Für Unternehmen dürften vor allem die damit möglichen "echten" Web-Site-Lasttests interessant sein. Gründe genug also, um zu prüfen, wo sich durch Peer-to-Peer-Computing Kosten einsparen lassen.