Versuch 10: Kontextabhängiges Training

Im letzten Versuch werden nun die geballten kontextabhängigen Modelle trainiert.

Aufgabe 10: Passen Sie die entsprechenden Skripte aus den jeweiligen Versuchen an, um folgende Schritte durchzuführen:

Training der LDA Matrix
Codebücher mit K-means erzeugen
Testen der erzeugten Codebücher
Schreiben neuer Labels
Viterbi Training entlang Labels
Testen der Viterbi Gewichte

Aufgrund der verhältnismäßig geringen Anzahl an Trainingsdaten ist die Kontextballung noch zu grob. Wiederholen Sie Schritt 12, wobei Sie die Mindestanzahl an Trainingsbeispielen pro Modell auf 3000 setzen sollten. (dss configure -minCount 3000).

Hand-In

Schicken Sie bis zum Abgabetermin die Word Accuracies der getesteten Systeme (auch die der vorherigen Schritte) an Sebastian Stüker.