Neuronale Netze für die Geisteswissenschaften

04.07.2007 von Dr. Klaus Holthausen und PD Dr. Paul Ziche
In Zusammenarbeit mit der Schelling-Kommission der Bayrischen Akademie der Wissenschaften hat ein Wirtschaftsunternehmen eine assoziative Suchmaschine auf Basis eines neuronalen Netzwerks entwickelt. Es soll Geisteswissenschaftlern helfen, Texte richtig zu interpretieren und einzuordnen.

Wann wurde ein undatierter Text verfasst? Wer ist Autor eines anonym publizierten Werks? Welche Entwicklungen durchläuft das Denken eines Autors? Die Klärung solcher Fragen gehört zum klassischen Aufgabenfeld eines Philologen und Editors; sie verlangt in besonderer Weise nach dem Verfahren der Interpretation und nach der hermeneutischen Tugend des semantischen Urteilsvermögens.

Neuronen: Darstellung von Neuronen aus histologischen Präparaten (van Gehuchten 1892)

Neu entwickelte Computermodelle für neuronale Netze eignen sich für solche Forschungen als flexibles Werkzeug, dessen Möglichkeiten weit über die Suche nach Zeichenketten oder die Abfrage von Datenbanken hinausgehen. Assoziative neuronale Netze analysieren Datenbestände nicht auf der Grundlage von Worthäufigkeiten oder der Ähnlichkeit von Zeichenketten, sondern entwickeln selbst semantische Kategorien. Damit können, ohne externe Vorgaben, assoziative Beziehungen zwischen Texten und Begriffen hergestellt und so nachweisbar fundierte Interpretationshypothesen aufgestellt werden.

Klassische Editorik und innovative Informationstechnologie

Für die Philosophie Schellings stellen sich die eingangs genannten Fragen in besonderer Schärfe: So hat Schelling 1802/3 im Kritischen Journal der Philosophie eine ganze Reihe von Texten gemeinsam mit Hegel verfasst, ohne dass die Autorschaft für alle Texte nach dem Kriterium, ob diese eher zum sonstigen Werk Schellings oder zu dem Hegels passen, eindeutig festgestellt werden könnte; Schellings Philosophie scheint so viele Wandlungen durchzumachen, dass man ihn als „Proteus“ der Philosophie bezeichnet hat, was die Frage nach dem Ausmaß solcher Wandlungen und dem Grad des Zusammenhangs seines OEuvres in voller Schärfe akut werden lässt; eine Reihe zentraler Texte Schellings sind nur als nicht datierte Nachlasstexte verfügbar bzw. wurden von späteren Herausgebern in nicht kontrollierbarer Weise zu größeren Werkkomplexen zusammengefügt: Hier wäre es dringlich, über gut begründete Kriterien zur Ordnung dieses Textcorpus zu verfügen.

Zur Klärung solcher Fragen nutzt die Schelling-Kommission seit Ende 2006 im Rahmen eines von der Akademie geförderten Drittmittelprojekts mit Unterstützung der Stiftung zur Förderung der Wissenschaften in Bayern, der an dieser Stelle ausdrücklich gedankt sei, eine innovative Computertechnologie: Zum Einsatz kommt eine Content Network Technology (CNT), die von der Dr. Holthausen GmbH in Bocholt entwickelt wurde und auf der Anwendung assoziativer neuronaler Netze beruht. Grundlage dieser Zusammenarbeit mit der Wirtschaft ist der Versuch, die in anderen Bereichen, etwa für komplexe Suchaufgaben, gut erprobte CNT-Technologie für Fragestellungen der klassischen Editorik und Textinterpretation einzusetzen und damit in ein Forschungsszenario einzubinden, das aus einer langen Tradition heraus eigene hochdifferenzierte Methoden zum Umgang mit historisch überlieferten Texten entwickelt hat. Resultate der Computer-Analysen können damit in ihrer Relevanz unmittelbar kritisch bewertet werden, was für beide Seiten zu einer Vertiefung des Verständnisses der Möglichkeiten und Grenzen ihrer jeweiligen Verfahren führen kann.

Assoziative neuronale Netze

Computerbasierte neuronale Netze bilden wichtige Strukturmerkmale realer neuronaler Systeme, allen voran des menschlichen Gehirns, ab. Aufgebaut sind sie aus vereinfachten mathematischen Modellen für Neuronen, die mit anderen Modell-Neuronen nach dem Vorbild der Verbindung von Nervenzellen über Synapsen in Kontakt stehen. Im Beispiel des neuronalen Netzes, das zur Arbeit an Schelling verwendet wird, bilden die Einheiten des Textes – aus praktischen Gründen wurden die Seiten der Werkausgabe als Einheiten gewählt – die Modell-Neuronen, die über alle in ihnen enthaltenen Worte mit anderen Seiten verknüpft sind. Die Worte entsprechen also den Synapsen im Gehirn. Wird ein Neuron im Modell „aktiviert“, so verteilt sich diese Erregung nach Maßgabe der Stärke der Verknüpfungen an andere Neuronen weiter und aktiviert diese ebenfalls. Verfolgt man diese Aktivitätsausbreitung im Netz, so kann man Texteinheiten über Begriffe miteinander verbinden, nach dem Modell der Verbindung von Neuronen über aktivitätsvermittelnde Synapsen. Die so gewonnenen Verbindungen entsprechen im Modell den assoziativen Verknüpfungen zwischen Nervenzellen.

Eine wichtige Eigenschaft dieses mathematischen Modells des Assoziationsvermögens ist ein Informationsmaß, das auf dem Logarithmus relativer Worthäufigkeiten basiert. Dies erlaubt es, für eine Netzwerkstruktur – in diesem Fall für die Vernetzung von Begriffen und Dokumenten – subjektive, d. h. aus den jeweiligen Kontexten und nicht durch äußerlich vorgegebene Bedingungen bestimmte Information zu definieren [1], [2]. Die Verknüpfung zweier Begriffe wird in diesem Modell als eine plastische Synapse abgebildet, die mit jedem neuen Text, der in das System eingegeben wird, eine Veränderung erfährt. Es sind somit auch Projektionen auf ausgewählte Textbereiche möglich, die – ähnlich einem Kaleidoskop – neue Assoziationen aufzeigen. Dies erfolgt ohne externe Vorgaben oder Regeln; insbesondere ist kein manuell erstellter Thesaurus erforderlich. Auch große Datenmengen können so, unter völligem Verzicht auf einschränkende Vorannahmen, in einer Weise strukturiert werden, die den Frageinteressen der geisteswissenschaftlichen Forschung entgegenkommt.

Schelling im Computernetz: Assoziative Begriffsforschung

Konkret wurde der Text von Schellings Sämmtlichen Werken als ein derartiges neuronales System abgebildet. Man erhält damit ein neuronales Netz (ein „Content Network“), in dem jede Seite der Sämmtlichen Werke mit allen anderen durch alle vorkommenden Begriffe, gewichtet nach dem kontextdefinierten Informationsgehalt der Begriffe, verknüpft ist. Dieses Netz kann nun von jedem einzelnen Begriff aus aktiviert werden und liefert dann, über die Synapsen, die diese Ausgangsaktivierung weiterleiten, die Assoziationen zu diesem Begriff, gestuft nach der Stärke der Assoziation. Bereits eine solche Suche geht über die Leistungsfähigkeit herkömmlicher Suchmaschinen weit hinaus; Begriffe können einander assoziativ zugeordnet werden, auch wenn sie im Werk Schellings gar nicht in unmittelbarem Zusammenhang auftreten.

Assoziationen: Begriffe, die assoziativ jeweils zwischen „Geist“ und „Körper“ bzw. „Leib“ und „Seele“ vermitteln und klar die semantische Differenz in der Beziehung beider Begriffspaare zeigen. Auffällig ist auch, wie viel reichhaltiger das Assoziationsgefüge für „Leib“ und „Seele“ ausfällt.

Die Suche im assoziativen Netzwerk ist nicht auf die Betrachtung des assoziativen Umfelds einzelner Begriffe beschränkt. Es können auch diejenigen Begriffe ermittelt werden, die im Schelling-Netzwerk die Beziehung zwischen zwei Ausgangsbegriffen erzeugen. Ein aufschlussreiches Beispiel liefert der Vergleich der vermittelnden Begriffe, durch die die Begriffspaare „Geist-Körper“ und „Leib-Seele“ verknüpft werden. In der philosophischen Umgangssprache stehen beide Paare praktisch unterschiedslos für dasselbe Problem, das im Englischen durch den einzigen Terminus „mind-body-problem“ bezeichnet ist. Die Untersuchung der assoziativen Verknüpfung dieser Begriffe im Werk Schellings zeigt aber sofort, dass zwei ganz verschiedene semantische Felder involviert sind: „Geist“ und „Körper“ sind wesentlich durch Begriffe aufeinander bezogen, die dem Bereich des Naturalen bzw. der Naturphilosophie zuzurechnen sind, während das Paar „Leib“ und „Seele“ um klassisch-metaphysische Begriffe zentriert ist.

Assoziationsstärken: Die Assoziationen zum Ausgangsbegriff „Geist“, mit den jeweiligen Assoziationsstärken (durch die kleinen Tortendiagramme vor den assoziierten Begriffen angegeben). Obwohl der Terminus „Geisteswissenschaft“ bei Schelling nicht belegt ist, lässt sich ein gewichtiger Zusammenhang zwischen „Geist“ und „Wissenschaft“ nachweisen (zur Darstellung wird die Software Mind- Manager® der Firma Mindjet® verwendet).

Dieses Beispiel zeigt unmittelbar, dass hochgradig differenzierte semantische Verknüpfungen, die im gegenwärtigen philosophischen Sprachgebrauch gar nicht mehr unbedingt reflektiert sind, im Netzwerk sehr präzise abgebildet werden. Die assoziative Struktur bleibt nicht statisch, sondern liefert Denkpfade, die über eine Betrachtung der verknüpfenden Synapsen, also der einzelnen Begriffe, sichtbar gemacht und – wie in den vorigen Beispielen – in Form einer Mind Map visualisiert werden können (visualisiert mit Hilfe der Software MindManager® der Firma Mindjet®). Damit entstehen komplexe Abbildungen von intratextuellen Bezügen, die unmittelbar neue Forschungshypothesen für die interpretierende Arbeit am Text liefern.

Automatisierter semantischer Textvergleich: Anwendung für geisteswissenschaftliche Großkategorien

Auch ganze Texte bzw. beliebig definierte Textstücke können auf dieser Grundlage hinsichtlich ihrer Ähnlichkeit nach semantischassoziativen Kriterien verglichen werden. Klassische philologischhistorische Fragen wie die Datierung und Abfolge von Texten oder die Autorschaft anonym tradierter Texte können so durch einen Vergleich mit bekannten Texten geklärt werden.

Beispiel für eine Auswertung der Assoziationen zur Textdatierung

Bruno (1802)

Freiheitsschrift (1809)

Philosophie u. Religion (1804)

Weltalter (1813)

Würzb. System (1804)

Bruno (1802)

x

8

23,2

12,6

55,7

Freiheitsschrift (1809)

14,4

x

16,5

44,7

24,0

Philosophie u. Religion (1804)

29,3

21,5

x

12,3

36,4

Weltalter (1813)

25,9

39,4

13,3

x

20,5

Würzburger System (1804)

55,2

14,8

22,1

7,4

x

Clara

30,4

13,6

12,9

33,3

8,6

Übersicht über die Assoziationen zwischen Schellings undatiertem, aus dem Nachlass herausgegebenen Gespräch „Clara, oder über den Zusammenhang der Natur mit der Geisterwelt“ mit Vergleichstexten aus der Zeit zwischen 1802 und 1813. Die stärksten Assoziationen verweisen auf das Weltalter-Fragment von 1813, was wichtige Hinweise zur Datierung des Textes gibt.

Diese Option bildet typische Arbeitsweisen des interpretierenden Umgangs mit Texten ab: Welche Textstücke sind unter semantischen Gesichtspunkten einander ähnlich? Welche weiteren Textstellen im Opus Schellings gehören direkt in das Umfeld einer bestimmten vorgegebenen Textstelle und geben damit unter Umständen Aufschluss über die genetische Zusammengehörigkeit der Texte?

Beispiel für die Asymmetrie von Assoziationen: Verglichen werden die Assoziationen zu zwei Stellen, an denen jeweils von „Vergeistigung“ die Rede ist. Geht man von einer Stelle des Frühwerks aus, in der diese Formulierung in einem naturphilosophischen Zusammenhang („Vergeistigung der Naturgesetze“) thematisch ist (SW I,3,340), erhält man vornehmlich Textstellen aus dem direkten Umkreis; wählt man umgekehrt eine später verfasste Stelle, an der derselbe Terminus in einem metaphysischen Kontext auftritt (SW I,9,4), wird man auch auf das Frühwerk geführt.

Auch hier gehen die Anwendungsmöglichkeiten über die bloße Konstatierung von assoziativen Zuordnungen hinaus. Die durch Assoziationen erzeugten Relationen sind nicht statisch: So sind die Bezugsstellen, die von einer bestimmten Passage im Werk Schellings aus assoziativ aufgefunden werden, nicht unbedingt umgekehrt wiederum symmetrisch mit der Ausgangspassage assoziiert. Hieraus ergibt sich ein subtiles Mittel zur Analyse der Kohärenzverhältnisse innerhalb des Schellingschen Gesamtwerkes: Wählt man Stellen aus Schellings frühen Schriften zum Ausgangspunkt, sind diese typischerweise mit Stellen aus ihrem engeren zeitlichen Umfeld assoziiert und verweisen nur selten auf seine spätere Philosophie, nicht einmal dort, wo sogar wörtlich dieselben Termini auftauchen. Umgekehrt aber finden Stellen des Spätwerks auch die entsprechenden Stellen aus den früheren Texten; das Spätwerk kann deshalb – so die sich daraus ergebende Hypothese – als Integration von früheren Positionen Schellings verstanden werden, ohne dass umgekehrt das Frühwerk bereits hinreichend erkennen ließe, in welche Richtung sich Schellings Philosophie entwickeln würde.

Der Computer als Interpret?

Ein Einsatz von Computertechnologie in den Geisteswissenschaften sieht sich immer wieder dem Vorbehalt ausgesetzt, hier würde eine komplexe, in besonderer Weise „geistige“ Tätigkeit mechanisiert und auf ein simples binäres Denken reduziert. Assoziative Strukturen gehorchen jedoch von vornherein keiner binären Logik. Da alle weiteren Analyseschritte der CNT-Technologie auf den zunächst ermittelten assoziativen Strukturen aufgebaut sind, liefern auch die Zuordnungsvorschläge für ganze Textstücke nur Hypothesen für die weitere Interpretation, wobei das Zustandekommen der Assoziationen bis hinab auf die Ebene der vermittelnden Begriffe verfolgt und bewertet werden kann. Zudem dürfen, wie gerade das letzte Beispiel illustriert, die Resultate der CNT-Analyse nicht in Isolation betrachtet werden. Der CNT-Einsatz macht den interpretierenden Zugriff nicht überflüssig, sondern stattet ihn umgekehrt mit einer sehr viel umfangreicheren, aber zugleich transparent strukturierten Datenbasis aus.

Literaturangaben

[1]

J. Jost; K. Holthausen; O. Breidbach (1997): On the mathematical foundations of a theory of neural representation. In: Theory in Biosciences 116, p. 125-129.

[2]

M. Khaikine and K. Holthausen (2000): A General Probability Estimation Approach for Neural Computation. In: Neural Computation 12(2), p. 433-450.

Diesen Beitrag haben wir aus der Zeitschrift Akademie Aktuell 01/2007 der Bayerischen Akademie der Wissenschaften übernommen. Der Autor Dr. Klaus Holthausen ist Gründer und Gesellschafter der Dr. Holthausen GmbH aus Bocholt (www.dr-holthausen.de), PD Dr. Paul Ziche ist wissenschaftlicher Mitarbeiter der Schelling-Kommission der Bayerischen Akademie der Wissenschaften.