Die Texttechnologie teilt sich mit der allgemeinen Sprachwissenschaft bzw. der Computerlinguistik den gemeinsamen Untersuchungsgegenstand: die natürlicher Sprache. Allerdings konzentriert sie sich dabei auf deren elektronische Manifestation in Form digitaler Texte, d.h. semistrukturierter Daten. Das Erkenntnisinteresse betrifft gleichermaßen Syntax, Bedeutung und Verwendung: Wie lassen sich Textstrukturen und Referenzbeziehungen präzise beschreiben, welche Repräsentationsmodelle (Dokumentgrammatiken) und Algorithmen unterstützen eine effiziente Informationsextraktion usw. Entsprechend breit gefächert und praxisnah sind die Anknüpfungspunkte an andere linguistische Teildisziplinen.

Die Sprachwissenschaft profitiert auf mehreren Ebenen vom Einsatz texttechnologischer Methoden und textnaher Techniken: Der Einsatz von XML-basierten Markup-Sprachen bei der Anreicherung digitaler Textkorpora um linguistische Meta-Informationen oder bei der Strukturierung/Vernetzung von Wörterbücher erhöht gleichermaßen deren wissenschaftlichen und praktischen Nutzwert, erleichtert die statistische Auswertung von Korrelationen und ermöglicht dadurch die Evaluierung von Theorien. Elektronische Thesauri, Wort- und Wissensnetze sowie Ontologien befördern darüber hinaus die (terminologische) Konsistenz und Erschließung textueller Daten.

Verwandte wissenschaftliche bzw. wissenschaftspraktische Disziplinen neben der Text- und Computerlinguistik sind die Informationswissenschaft - besonders das hypermediale Dokumentenmanagement und das Information Retrieval - sowie die praktische Informatik mit den Schwerpunkten Data Mining/Text Mining sowie Markup- und Datenbanktechnologie.

Literatur

Studiengänge

Projekte

Institutionen

    Betreut von: Dr. Roman Schneider, IDS Mannheim