Versuch 1: Einführung
Ziel des ersten Versuchstages ist es sich mit der Rechnerumgebung, wie sie während des Praktikums benutzt wird, vertraut zu machen.
Sollten sie noch nicht mit UNIX gearbeitet haben, so finden Sie einige Informationen unter Hilfen auf der Übersichtsseite dieser Praktikumsanleitung.
Arbeitsumgebung
Richten Sie sich zunächst Ihre Arbeitsumgebung ein. Erzeugen Sie in Ihrem Praktikums-Heimatverzeichnis die folgenden Verzeichnisse:
tools stepsTippen Sie dazu in einem XTerminal mkdir tools usw. ein. |
Tutorium
Auch wenn es für die erste Aufgabe noch nicht nötig ist, wollen wir Ihnen kurz das JANUS-Tutorium vorstellen, mit dessen Hilfe die meisten hier gestellten Aufgaben gelöst werden sollen. In der dort zu findenden "introduction-to-Janus 5" werden die grundlegenden Konzepte zu JANUS erläutert.
Im Tutorium finden Sie ausserdem einen alphabetischen Index (tutorial index page), der Ihnen ein leichtes Auffinden von Seiten zu einem bestimmten Thema ermöglicht.
Das Tutorium besteht aus drei verschiedenen Hauptteilen:
discussion thread | Allgemeine Betrachtungen zu einem bestimmten Thema. |
scripts thread | Eine Sammlung von Janus/Tcl-Scripten. |
do-it-yourself thread | Versuche zur Entwicklung eines Spracherkennersystems mit Hilfe der Skripten. Diese werden im Rahmen des Praktikums, z.T. etwas variiert, durchgeführt. |
Die für die Versuche benötigten Sprachdaten u. a. brauchen Sie sich nicht in Ihr Verzeichnis zu kopieren. Machen Sie einfach einen Link zu dem bereits bestehenden data-Verzeichnis:
> cd steps > ln -s ../../../islpra0/data . |
Tcl
Übung: Wie Sie in der "introduction-to-Janus 5" nachlesen können, sind Kenntnisse in der Skriptsprache Tcl Voraussetzung um mit Janus arbeiten zu können. Machen Sie daher zunächst die Beispiele in Tcl basics in 5 minutes durch (Sie finden den entsprechenden Link auch unter "Hilfen" in der Übersichtsseite), auch wenn es etwas länger als 5 Minuten dauern sollte.
|
Aufgabe 1.1: Versuchen Sie nun mit dem soeben Erlernten die Aufgabe 1.1 zu lösen. Dazu brauchen Sie evt. auch Kommandos für Listen und Arrays, die sie unter "Ok, another 5 minutes" finden.
Frage 1.1: Was passiert, wenn Sie als Textfile (Eingabedatei) für das soeben erstellte Programm count.tcl die Datei ~/steps/data/dict verwenden? Es handelt sich hierbei übrigens um ein Aussprachewörterbuch. |
Aufgabe 1.2: In der Aufgabe 1.2 soll das oben erstellte Programm erweitert werden.
Frage 1.2: Wieviele Bigramme mit einer Wahrscheinlichkeit größer gleich 0.5 gibt es in ~/steps/data/transcripts? |
Lösungen
Schicken sie per e-mail die Antwort auf Frage 1.1 und die entsprechende Ausgabe, sowie die Antwort auf Frage 1.2 an Sebastian Stüker. Dies soll jeweils bis ein Tag vor dem nächsten Praktikumstermin geschehen. Die Lösungen werden jeweils am Beginn des nächsten Termins besprochen und sind dann auch in der Praktikumsdokumentation verfügbar. |