Faktor 10

16.10.1998

Das Internet droht am eigenen Erfolg zu ersticken, denn allzu oft sind die Pipelines verstopft. "SiliconTCP", ein einfaches und dennoch wirkungsvolles Verfahren könnte viele Probleme lösen und die Performance verzehnfachen.

Von: Jürgen Fey

Die Bay Area südlich von San Francisco, das Silicon Valley, gilt zu Recht als das Herz der Computerindustrie. Kaum eine Entwicklung, die nicht hier ihren Ursprung hatte oder dessen Potential hier erst so richtig ausgeschöpft und zur Serienreife entwickelt wurde. Eine junge Firma will dort jetzt mit einer neuen Technik die nächste Runde der Internet-Kommunikation einläuten. Gegründet von den BSD-Unix-Veteranen Bill und Lynne Greer Jolitz sowie unterstützt von dem "Vater des Internet" und MCI Senior Vice President for Data Architecture Vinton Cerf, der als "Member of the Board" aktiv am Geschehen beteiligt ist, sagt das Unternehmen Interprophet mit einer Technik namens "SiliconTCP" den protokollspezifischen Verzögerungen im Internet den Kampf an.

SiliconTCP verspricht bei voller Einhaltung der Kompatibilität zu bestehenden Internet-Protokollen eine Steigerung des Durchsatzes im Netzwerk um den Faktor drei bis zehn. Dies könnte ob der plötzlich zur Verfügung stehenden Bandbreite bei zugleich deutlich sinkenden Latenzzeiten eine Innovationslawine bei IP-Netzen auslösen und in der Folge zu vollkommen neuen Applikationen und Geräteklassen führen. Dabei klinkt sich die neue Technik nahtlos in die bestehende weltweite Infrastruktur ein, ohne eine Hürde der Inkompatibilität aufzubauen. Mit SiliconTCP ausgestattete Endgeräte können untereinander sofort in den Genuß der höheren Performance kommen, während der Rest der Devices-Welt wie bisher kommuniziert. SiliconTCP nutzt hierbei keine Tricks, die dem TCP/IP-Protokoll widersprechen, um die Kompatibilität zu sichern und Insellösungen zu vermeiden.

Wo liegt die Magie der neuen Technik? Das TCP/IP-Protokoll nutzt zur Übertragung das sogenannte CSMA/CD-Verfahren (Carrier Sense Multiple Access with Collision Detection). Hierbei werden die zu sendenden Datenpakete auf das Netzwerk losgelassen, ohne daß die Netzwerk-Hardware vorher überprüft, ob nicht bereits im gleichen Moment ein Transfer stattfindet. Ist dies der Fall, so überlagern sich die Pakete. Es tritt zwangsläufig eine Datenkollision (Congestion Collision) auf, die alle aktiven Transfers ungültig macht. Alle beteiligten Endpunkte stellen diesen Fehler über die einzelnen Layer des Netzwerk-Stacks und die CSMA/CD-Fehlererkennung fest, warten eine lokal zufällig ausgewählte Zeit und beginnen den letzten Transfer von vorne.

Latenzzeiten drastisch senken

Dieses einfache und dennoch sichere Verfahren konnte sich in der Vergangenheit bewähren, hat aber den Nachteil, daß bei steigendem Netzwerkverkehr die Anzahl der Kollisionen automatisch zunimmt. Damit sind jedoch auch immer mehr Retransmit-Aktivitäten notwendig. Diese führen wiederum zur Belastung der Infrastruktur und lassen damit den Nettodurchsatz in die Knie gehen.

Für den Anwender, der sich gerade Daten vom Internet lädt, macht sich dieser Effekt so bemerkbar, daß plötzlich die Übertragung für Sekunden stockt. Dies hängt damit zusammen, daß die Kommunikationsendpunkte den Transfer, der bei der Kollision beteiligt ist, von neuem beginnen müssen. Auf diese Weise geht wertvolle Zeit verloren, da die zwischengeschalteten Stationen - bis auf die, an der die Kollision stattfand - ihre Arbeit ja richtig machten.

Die Transferpattern im Internet sind überhaupt nicht vorhersagbar und alles andere als kontinuierlich. So kann die angeschlossene Hardware, so leistungsfähig diese auch sein mag, nicht vorausschauend agieren und ist zum Reagieren verdammt. "Das Fatale ist, daß man die Situation einer Congestion erst dann bemerkt, wenn ein Datenpaket nicht ankommt und das kann schon einmal sechs Sekunden dauern. Das ganze System kann erst dann reagieren, auch wenn der High-Speed-Switch, der das Problem längst hätte lösen können, nur 100 ms entfernt um die Ecke gelangweilt auf Arbeit wartet," bringt es Bill Jolitz auf den Punkt. Für den Endanwender stellt sich damit das Internet als unzuverlässig dar. Für Jolitz steht außer Frage, daß die Latenzzeit im Internet deutlich sinken und zugleich die Bandbreite spürbar erhöht werden muß: "Natürlich geht alles ganz schnell, wenn ich mal Zeit habe, aber wehe ich muß noch schnell wichtige Daten für eine Präsentation laden, dann geht gar nichts mehr. Oft ist das Internet so langsam, daß die Anwender mitten im Transfer abbrechen." Damit kommt der Entwickler zum Kern seiner Technik. Bisher wurde die Kontrolle im Fehlerfalle oft genug auf den Anwender abgewälzt, der einen Transfer einfach abbricht, sobald dieser zu lange dauert oder "hängt". Jolitz will die Kontrolle direkt in die Infrastruktur verlegen, um damit wertvolle Zeit zu sparen und die Bandbreite für alle zu erhöhen.

Seit den Arbeiten am BSD-Unix im Herzen der Computer Systems Research Group der University of Berkeley, kennt Jolitz das TCP/IP-Protokoll bis ins kleinste Detail und hat dieses seither als Consultant für große Firmen oft genug analysiert und Lösungen entwickelt -- vom Treiber für das von ihm entwickelte 386BSD-Unix bis hin zu Clusterlösungen für einen Workstation-Hersteller.

Kommunikation auf Layer 4

Die Aufgabenstellung, die es diesmal zu lösen galt, war einfach: Es mußte eine Möglichkeit gefunden werden, um den Transfer im Falle des Falles nur zwischen den Stationen, die den Fehler auslösten beziehungsweise entdeckten, neu zu initieren, während die "restliche Strecke" weiterhin vollkommen unabhängig vom lokalen Problem Datenpakete verschickt. Da das TCP/IP-Protokoll keine fortlaufende Nummerierung der Datenpakete garantiert, sind alle Systeme auf "Out-of-Order-Pakete" vorbereitet und können damit umgehen.

Jolitz nutzt bei seinem zum Patent angemeldeten System das sogenannte Layer-4-Switching und entgeht damit dem üblichen Overhead im Layer**1 und Layer**2. Die Endpunkte sowie alle angebundenen Relaisstation auf der gesamten Strecke kommunizieren also jetzt direkt auf der Layer-4-Ebene. Tritt ein Fehler auf, so übernehmen die beteiligten Relaistationen über das "Meta-Transport-Layer" direkt selbst die Kontrolle. Sie sorgen für einen "lokalen" Retransmit (im Gegensatz zum sonst üblichen "globalen" Retransmit) und nutzen damit die theoretisch mögliche Bandbreite der Netzwerk-Infrastruktur wesentlich besser aus.

Fehler erkennt das System damit automatisch in Millisekunden statt in Sekunden. Bill Jolitz: "Das Netzwerk bietet damit eine bereits implizit eingebaute Quality-of-Service-Garantie in der Art und Weise, wie das System die Daten bearbeitet und bietet damit eine Verdrei- bis Verzehnfachung des Durchsatzes ohne Veränderungen der Infrastruktur wie Verkabelung et cetera."

Transfer in Mikrosekunden

Das Kunststück liegt nun darin, daß auf beiden Seiten die zum Patent angemeldete SiliconTCP-Hardware verfügbar sein muß, die intern die fehlenden Synchronisations- und Kontrollfunktionen der übergangenen Layer in Echtzeit nachrechnen, also die fehlenden Layer simulieren muß. Zwischen den einzelnen Stationen erfolgt der Transfer dann im Bereich von etwa 7 Mikrosekunden.

Die Firma Interprophet will sich jedoch nicht aktiv am Hardware-Geschäft beteiligen. Um die Verbreitung der eigenen Technik voranzutreiben steht Lynne Greer Jolitz mit potentiellen Lizenznehmern in Verbindung: "Wir lizenzieren die von uns entwickelte Hard- und Software, so wie es beispielsweise auch Rambus macht, direkt an die Hersteller. Der Markt ist so riesig, da würden eigene Endprodukte unseren Blick vom Wesentlichen abbringen".

In entsprechenden Netzwerkchips schlummert SiliconTCP vollkommen transparent ohne mit dem Rest der Hardware zu kollidieren, bis ein am Netzwerk angeschlossenes Endgerät ebenfalls über die gleiche Funktion verfügt. Transfers zwischen diesen beiden Systemen werden dann über die "aktive" Level-4-Fehlerbehandlung abgewickelt und sind damit deutlich schneller. Jedes weitere Endgerät auf dem Pfad der Daten von A nach B erhöht den absoluten Durchsatz über die gesamte Strecke direkt, da zwischen diesen Stationen die verkürzte Fehlerkorrektur mit der spürbar verringerten Latenzzeit zum Tragen kommt. Den Versuch mancher Firmen, den Transfer im Layer 3 zu optimieren kann Jolitz nicht so recht nachvollziehen: "Die derzeitigen Lösungen, über das Layer 3 mehr aus der Infrastruktur herauszuholen, nutzen insgeheim schon einige Level-4-Features. Warum arbeitet man dann nicht gleich komplett in diesem Layer"?

Doch Interprohet sieht nicht nur im Internet das Potential für die eigene Technik. In Intranets lassen sich auf die gleiche Weise deutliche Performancesteigerungen erzielen, ohne daß der Netzwerkverantwortliche gleich die gesamte Hardware im Unternehmen umstrukturieren muß. Bill Jolitz schlägt vielmehr vor: "Üblicherweise beginnt man im Intranet mit der Verbindung der einzelnen Server untereinander. Dann folgen die Clients mit dem größten Performancebedarf." Vom Oracle-Parallel-Datenbankserver über ein Wolfpack-NT-Cluster bis zu Tier-2-Anwendungen wie SAP reicht die Palette der möglichen Einsatzgebiete. Da in den vertikalen Lösungen Client und Server mit speziell angepaßten und optimierten Treibern auf Tier-1-Ebene direkt miteinander "reden" könnten, sei eine spürbar verringerte Latenzzeit zu erwarten, die etwa einer SAP-Lösung ohne große Investitionen neues Leben einhaucht. Jolitz geht noch einen Schritt weiter: "Der Vorteil einer Solaris-basierenden Workstation liegt heute einzig und alleine in der geringen Latenzzeit. Mit unserer Technik schlägt ein NT-Server jede Sun-Workstation. Das könnte eine Lawine auslösen".

Das Internet als lokaler und globaler Bus

Von Cisco kam der Entwicklungsingenieur Todd Lawson. Dort arbeitete er an Gigabit- und Switching-Produkten und hat hierbei wertvolle Erfahrungen gesammelt, die er jetzt beim Gate-Array-Design nutzen kann. Bei Interprophet sieht Todd seine große Chance gekommen - kann er doch den Erfolg der Firma durch seine direkte Aktienbeteiligung auch in seinen Erfolg ummünzen. Als erstes Referenzdesign entsteht derzeit beim Unternehmen Interprophet ein PCI-basierender Netzwerkkontroller mit bis zu vier Kanälen, der beispielsweise als Netzwerkcontroller (NIC) für einen Intranet-Server zum Einsatz kommen könnte. Da die Anbindung an den Server deutlich schneller wird, sieht Jolitz auch die Möglichkeit, entfernte Gebäude einfach über TCP/IP an den zentralen Server anzuschließen. Entfernungen von mehreren Kilometern per Glasfaser seien ohne spürbare Verzögerungen zu realisieren. Lokale und landesweit operierende Internet Service Provider könnten SiliconTCP als Zusatzservice anbieten, um Firmennetze miteinander zu koppeln oder lokale Videostreams zu übertragen.

Intelligente Kommunikationseinrichtungen aber auch "dumme" Endgeräte könnten in den Genuß der neuen Technik kommen. Denkbar sind Lösungen, die ohne lokale Intelligenz auskommen und das Internet oder eine lokale Intranet-Lösung als schnellen Datenbus nutzen. Das Transportverfahren selbst wäre wie ein direkter Link zwischen zwei Endgeräten zu verstehen. "Stellen Sie sich vor, Sie hätten Zugriff auf eine beliebige Bandbreite und könnten ihre Applikation zu jeder Zeit auf ihr lokales System laden, ohne sich über Ladezeiten Gedanken machen zu müssen. Vollkommen neue Anwendungen sind denkbar, sobald man nicht mehr über diese alten Einschränkungen nachdenken muß", schwärmt Jolitz.

Dabei wäre es mit der Interprophet-Technik möglich, in Endgeräte ohne eigene CPU TCP-Funktionalität einzubauen. Es hätte jedoch auch niedrigere Einstiegskosten für "intelligente" Devices zur Folge. Denkbar ist beispielsweise eine zentrale Set-Top-Box im Haushalt, die dumme (CPU-lose) Clients wie einen Toaster, beliebige Küchengeräte oder die Unterhaltungselektronik nach dem Einschalten mit den zum Betrieb notwendigen Daten versorgt. In diesem Konzept entsprächen die Clients normalen I/O-Devices, die über den "TCP-Bus" mit einer zentralen Intelligenz verbunden sind.

TCP für "dumme" Clients

Den Java-Devices steht Bill Jolitz in diesem Zusammenhang etwas skeptisch gegenüber: "Fehlertoleranz ist wichtig, zumal die Produkthaftung bei Konsumgütern sehr wichtig ist. Im Unix-Umfeld kann es schon einmal passieren, daß ein Prozeß eine Betriebssystem-Panic-Meldung und damit den Stillstand des Systems auslöst. Ich kann mir keinen Toaster vorstellen, der mitten in der Arbeit mit ,Panic’ abbricht und einen Brand auslöst. Diese Lektion muß die Java-Gemeinde noch lernen". Die zentrale Intelligenz könnte die Kontrolle übernehmen und im Falle des Falles für einen "geordneten Rückzug" sorgen.

Venture-Kapital statt Übernahme

Aber auch die kommende Welle der Java-basierenden Devices, vom PDA bis zur intelligenten Fernbedienung, könnten effektiver arbeiten, da die Transfers vom und zum Server wesentlich schneller ablaufen. Neue Appletversionen, große Parameterfelder für die Heizungssteuerung oder das Tagesprogramm für die TV-Fernbedienung könnten sofort nach dem Einschalten des Gerätes zur Verfügung stehen. Ohne gute Kontakte geht im Valley kaum noch etwas. Zu viele neue Techniken konkurrieren um die Aufmerksamkeit von Venture-Kapital-Gebern, von Herstellern und letztendlich Anwendern. Auch hier hat Interprophet anscheinend seine Hausaufgaben gemacht. Einen einflußreichen Internet-Veteranen wie Vinton Cerf für die eigene Sache zu gewinnen, war für Lynne Greer Jolitz ganz wichtig: "Vinton hatte die Vision vom TCP - fähigen Endgerät in jedem Haushalt - in jeder Ecke, kurz: überall. Nachdem er sich unsere Ideen genau angesehen hat, war es für ihn klar, als Board-Mitglied aktiv am Erfolg mitzuarbeiten. Schließlich garantiert unserer Erfolg auch den Erfolg seiner Vision". Bill Jolitz konnte zudem bei Tandem wichtige Erfahrungen bei der Vorbereitung des Aufkaufes interessanter Firmen sammeln. Die Kenntnisse um die Tricks der "anderen", das heißt geldgebenden Seite, sind für ihn heute unbezahlbar. Interprophet erhielt die erste siebenstellige Finanzspritze im November 1997 - unter anderem vom TCP/IP-Veteranen der siebziger und achziger Jahre und heutigen privaten Venture-Kapitalgeber Dan Lynch. Gerade hat die Firma Interprophet die zweite Finanzierungsrunde abgeschlossen. Ein erstes Übernahmeangebot eines großen Anbieters lehnte man dankend ab. (gob)