CLS-Hausaufgabe 2 (Abgabe 07.06.2018)

Die zweite Hausaufgabe widmet sich der Verwendung des Lesk-Algorithmus zur Disambiguierung von Word-Token in einem Satz mithilfe von WordNet.

Installation

Benötigt werden wieder:

  1. Python 3.6 mit nltk-Paket
  2. ein Jupyter-Server

Beides ist zum Beispiel in der Python-Distribution Anaconda enthalten, die sich kostenlos  herunterladen und einfach installieren lässt.

Jupyter-Notebook und Eingabedatei

Außerdem benötigen Sie:

  1. ein von uns vorgereitetes Jupyter-Notebook für die Python-Programmierung
    (CLS-Hausaufgabe-Lesk-07-06-2018.ipynb)
  2. eine Datei mit Wortformen
    (words.txt)
  3. eine Datei mit Sätzen
    (sentences.txt)

Beides wird auf der PhilCloud zur Verfügung gestellt; den dafür nötigen Link sollten Sie von mir per Email erhalten haben. Laden Sie beides auf Ihren Computer herunter.

Weiteres Vorgehen

  1. starten Sie Jupyter (der Jupyter-Client sollte automatisch im Browser gestartet werden);
  2. öffnen Sie im Jupyter-Client das heruntergeladene Jupyter-Notebook (CLS-Hausaufgabe-Lesk-07-06-2018.ipynb);
  3. bearbeiten Sie Aufgabe 1 und Aufgabe 2 im Jupyter-Notebook;
  4. geben Sie das bearbeitete Jupyter-Notebook bis zum Kurs am 07.06.2018 per Email ab.