NLP: Satzsyntax

Dozent: Timm Lichte
Veranstaltungsart: Proseminar
Raum: A302
Termin: Mittwoch, 10:15–11:45

Campus-Link
Ilias-Link

Beschreibung

In der Linguistik versteht man unter Syntax die (Lehre von der) Zusammensetzung von Sätzen und Phrasen aus Worten, Phrasen und Teilsätzen. Beispielsweise besteht der Satz Peter repairs the fridge aus den (unmittelbaren) Komponenten Peter als dem Subjekt, repairs als dem Verb und the fridge als dem Objekt, wobei die Nominalphrase the fridge wiederum aus dem Artikel the und dem Nomen fridge besteht. Üblicherweise wird diese “Konstituentenstruktur” in einer geklammerten binarisierten Notation aufgeschrieben:

(S
  (NP Peter)
  (VP repairs
    (NP
      (ART the)
      (N fridge))))

Im Rahmen der maschinellen Sprachverarbeitungen (Natural Language Processing, NLP) besteht dann die Herausforderung darin, diese Repräsentation der Satzsyntax automatisch zu ermitteln — ein Verfahren, das Parsing genannt wird. Neben dem ganz eigenen Reiz dieser Herausforderung hat das Parsing aber auch einen praktischen Nutzen: Die ermittelten syntaktischen Informationen sind essentiell für alle NLP-Anwendungen, die auf Sätzen operieren, sei es die automatische Rechtschreibkorrektur oder Dialogassistenzsysteme.

Das Proseminar soll einen Überblick über prominente Konzepte, Ressourcen und Verfahren in diesem zentralen Bereich der NLP verschaffen und setzt keine linguistischen oder computerlinguistischen Kenntnisse voraus. Vorausgesetzt werden aber Kenntnisse in der praktischen und theoretischen Informatik (insb. formale Sprachentheorie). Das Proseminar richtet sich daher an fortgeschrittene Bachelorstudierende der Informatik.

Qualifikationsziel des Proseminars ist die Fähigkeit, Sachthemen anhand von wissenschaftlicher Literatur zu präsentieren und zu diskutieren. Dafür werden wir in jeder Sitzung einen wissenschaftlichen Text behandeln (ggf. begleitet durch ein Referat), wobei erwartet wird, dass die Teilnehmerinnen und Teilnehmer die Sitzung durch die Lektüre des Textes vorbereitet haben. Die Studien- und Prüfungsleistungen werden durch eine aktive Teilnahme, durch ein Referat und durch eine schriftliche Hausarbeit erbracht.