Versuch 10: Kontextabhängiges Training

Im letzten Versuch werden nun die geballten kontextabhängigen Modelle trainiert.

Aufgabe 10: Passen Sie die entsprechenden Skripte aus den jeweiligen Versuchen an, um folgende Schritte durchzuführen:

  • Training der LDA Matrix
  • Codebücher mit K-means erzeugen
  • Testen der erzeugten Codebücher
  • Schreiben neuer Labels
  • Viterbi Training entlang Labels
  • Testen der Viterbi Gewichte

Aufgrund der verhältnismäßig geringen Anzahl an Trainingsdaten ist die Kontextballung noch zu grob. Wiederholen Sie Schritt 12, wobei Sie die Mindestanzahl an Trainingsbeispielen pro Modell auf 3000 setzen sollten. (dss configure -minCount 3000).

 

Hand-In

 

Schicken Sie bis zum Abgabetermin die Word Accuracies der getesteten Systeme (auch die der vorherigen Schritte) an Sebastian Stüker.