Portal Computerlinguistik : Textual Entailment

Einführung

Textual Entailment (Textuelle Inferenz oder Textuelles Schließen) ist ein Gebiet, das sich mit der Modellierung von Folgerungsbeziehungen befasst. Diese werden in Form binärer Relationen zwischen zwei textuellen Einheiten (z.B. Sätzen), ausgedrückt, die man als Text bzw. Hypothese bezeichnet.

"Klassische" Forschung im Bereich der formalen Semantik ist im Allgemeinen repräsentationszentriert: Es werden geeignete formale Sprachen zur Bedeutungsrepräsentation entwickelt, und Beziehungen zwischen textuellen Einheiten werden über Beziehungen ihrer formalen Repräsentationen definiert. Im Gegensatz dazu definiert Textual Entailment den Folgerungsbegriff bewusst auf der Ebene der natürlichen Sprache und durch menschliches Urteil: "Eine Hypothese H folgt aus einem Text T, wenn ein Leser von T mit hoher Wahrscheinlichkeit annehmen würde, dass H wahr ist." (Dagan et al. 2005).

Eine wichtige Konsequenz davon ist, dass Textuelles Schliessen auch Folgerungsbeziehungen umfasst, die nicht zwingend sind, aber die ein Mensch ziehen würde, weil sie sehr plausibel sind. Ein Beispiel:

Text: Durch den Klimawandel schmilzt immer mehr Eis in der Arktis.
Hypothese Die Arktis wird wärmer.

Hier besteht eine textuelle Folgerungsbeziehung zwischen Text und Hypothese: Unter der Annahme, dass T wahr ist, ist H außerordentlich plausibel. Dass es Umstände geben könnte, unter denen T wahr und F falsch ist (wenn z.B. das Eis durch Sonneneinstrahlung schmilzt, das Wasser aber im Durchschnitt kälter wird), spielt keine Rolle.

Eine weitere wichtige Konsequenz liegt auf der Verarbeitungsseite, wo Textual Entailment nicht auf bestimmte Strategien festgelegt ist: Jeglicher Algorithmus, der als Eingabe zwei textuelle Einheiten T und H nimmt und entscheidet, ob H aus T folgt, kann als Textal Entailment-Verfahren verwendet werden. Die Bandbreite reicht dabei von sehr flachen, wissensarmen Verfahren bis hin zu voller logikbasierter Semantikkonstruktion. Damit stellt Textual Entailment auch ein interessantes Szenario für die Evaluation semantischer Verarbeitungsverfahren dar.

Eine große Attraktivität von Textual Entailment für die maschinelle Sprachverarbeitung liegt darin, dass die semantische Verarbeitung vieler Anwendungen zumindest zum Großteil auf die Entscheidung textueller Folgerungsbeziehungen zurückgeführt werden kann. Ein Beispiel ist die Evaluierung der Ausgabe maschineller Übersetzungssysteme gegen eine Referenzübersetzung: Die Ausgabe ist dann vollständig und korrekt, wenn aus ihr die Referenz folgt und umgekehrt.

Literatur

Androutsopoulos/Malakasiotis: A Survey of Paraphrasing and Textual Entailment Methods (2010)

Einführung

Literatur

Veranstaltungen

Ressourcen

Projekte

Themen