Versuch 8: Kontextabhängigkeit
Polyphone
Schauen Sie sich die Erklärung von Polyphonen sowie die Beschreibung von step 10 des Janus-Tutoriums an.
|
Aufgabe 8.1 a): Führen Sie Schritt 10 des Tutorium aus und stellen Sie fest, wieviele Triphone in der Tutoriumsdatenbasis vorkommnen.
Aufgabe 8.1 b): Modifizieren sie das Polyphonesammelscript so, daß es jetzt auch Quintphone (Kontext +-2) sammelt. Wieviele Quintphone kommen in der Datenbasis vor? Bestimmen Sie auch die Anzahl der Polyphone mit kontextbreiten (+-3, +-4 und +-5). Welche Verbesserungen in der Erkennungsleistung wüerden Sie nach diesen Zahlen von einem Erkenner erwarten, der Quintphone statt Triphone verwendet? Aufgabe 8.1 c): Stellen Sie eine Statistik darüber auf, welches Phonem wieviele verschiedene Triphon-Kontexte hat. Aufgabe 8.1 d): Welches Triphon kommt in der Datenbasis am häufigsten vor?
|
Training
Das Training des kontexxtabhängigen Erkenners funktioniert genau so wie das eine kontextunabhängigen. Es ist in step 11 des Janus-Tutoriums beschrieben. Wir bleiben bei den Triphonen.
Aufgabe 8.2 a): Trainieren sie die Mixturgewichteverteilungen, wie im Janus-Tutorium beschrieben.
Aufgabe 8.2 b): Stellen Sie fest, welches Modell (d.h. welches Subtriphon) die meisten, bzw. zweitmeisten Trainingsdaten abgekriegt hat (steht zum Beispiel in den Distribution-Akkumulatoren, oder ist auch mit dss.item(1234) configure -count herauszufinden). Ignorieren Sie dabei den kleinen "Floor-Value", der zu jedem "Count" dazuaddiert wird. Aufgabe 8.2 c): Stellen Sie fest, wieviele Modelle nach der zweiten Iteration gar kein Training abgekriegt haben. Was haben diese Modelle gemein, und wie erklären Sie sich daß sowas überhaupt vorkommen kann?
|
Hand-In
Schicken Sie bis zum Abgabetermin die die Antworten auf die Fragen aus Aufgabe 8.1 a) bis d) und aus Aufgabe 8.2 b) bis d) sowie das Script zur Erstellung der Statistik von Aufgabe 8.1 c) an Sebastian Stüker. |