Versuch 10: Kontextabhängiges Training
Im letzten Versuch werden nun die geballten kontextabhängigen Modelle trainiert.
Aufgabe 10: Passen Sie die entsprechenden Skripte aus den jeweiligen Versuchen an, um folgende Schritte durchzuführen:
- Training der LDA Matrix
- Codebücher mit K-means erzeugen
- Testen der erzeugten Codebücher
- Schreiben neuer Labels
- Viterbi Training entlang Labels
- Testen der Viterbi Gewichte
Aufgrund der verhältnismäßig geringen Anzahl an Trainingsdaten ist die Kontextballung noch zu grob. Wiederholen Sie Schritt 12, wobei Sie die Mindestanzahl an Trainingsbeispielen pro Modell auf 3000 setzen sollten. (dss configure -minCount 3000).
Hand-In
Schicken Sie bis zum Abgabetermin die Word Accuracies der getesteten Systeme (auch die der vorherigen Schritte) an Sebastian Stüker. |