Versuch 1: Einführung

Ziel des ersten Versuchstages ist es sich mit der Rechnerumgebung, wie sie während des Praktikums benutzt wird, vertraut zu machen.
Sollten sie noch nicht mit UNIX gearbeitet haben, so finden Sie einige Informationen unter Hilfen auf der Übersichtsseite dieser Praktikumsanleitung.

 

Arbeitsumgebung

Richten Sie sich zunächst Ihre Arbeitsumgebung ein. Erzeugen Sie in Ihrem Praktikums-Heimatverzeichnis die folgenden Verzeichnisse:
 tools steps 
Tippen Sie dazu in einem XTerminal mkdir tools usw. ein.

 

Tutorium

Auch wenn es für die erste Aufgabe noch nicht nötig ist, wollen wir Ihnen kurz das JANUS-Tutorium vorstellen, mit dessen Hilfe die meisten hier gestellten Aufgaben gelöst werden sollen. In der dort zu findenden "introduction-to-Janus 5" werden die grundlegenden Konzepte zu JANUS erläutert.

Im Tutorium finden Sie ausserdem einen alphabetischen Index (tutorial index page), der Ihnen ein leichtes Auffinden von Seiten zu einem bestimmten Thema ermöglicht.

Das Tutorium besteht aus drei verschiedenen Hauptteilen:

discussion thread Allgemeine Betrachtungen zu einem bestimmten Thema.
scripts thread Eine Sammlung von Janus/Tcl-Scripten.
do-it-yourself thread Versuche zur Entwicklung eines Spracherkennersystems mit Hilfe der Skripten. Diese werden im Rahmen des Praktikums, z.T. etwas variiert, durchgeführt.
Die für die Versuche benötigten Sprachdaten u. a. brauchen Sie sich nicht in Ihr Verzeichnis zu kopieren. Machen Sie einfach einen Link zu dem bereits bestehenden data-Verzeichnis:
> cd steps > ln -s ../../../islpra0/data . 

Tcl

Übung: Wie Sie in der "introduction-to-Janus 5" nachlesen können, sind Kenntnisse in der Skriptsprache Tcl Voraussetzung um mit Janus arbeiten zu können. Machen Sie daher zunächst die Beispiele in Tcl basics in 5 minutes durch (Sie finden den entsprechenden Link auch unter "Hilfen" in der Übersichtsseite), auch wenn es etwas länger als 5 Minuten dauern sollte.
Tip zur Übung: Sie können die Tcl-Kommandos einfach mit der Maus abziehen und sie in Tcl ausführen. Wir raten jedoch dazu alles selbst einzutippen, da so der Lerneffekt verstärkt wird.
Tip zur Übung: Bennutzen Sie janus statt tcl für die Beispiele, denn so können Sie die Eingabezeile editieren und mit der Pfeil-Hoch-Taste wie in der UNIX-Shell die zuvor eingegebenen Kommandos wiederholen.
Aufgabe 1.1: Versuchen Sie nun mit dem soeben Erlernten die Aufgabe 1.1 zu lösen. Dazu brauchen Sie evt. auch Kommandos für Listen und Arrays, die sie unter "Ok, another 5 minutes" finden.

Frage 1.1: Was passiert, wenn Sie als Textfile (Eingabedatei) für das soeben erstellte Programm count.tcl die Datei ~/steps/data/dict verwenden? Es handelt sich hierbei übrigens um ein Aussprachewörterbuch.

Aufgabe 1.2: In der Aufgabe 1.2 soll das oben erstellte Programm erweitert werden.

Frage 1.2: Wieviele Bigramme mit einer Wahrscheinlichkeit größer gleich 0.5 gibt es in ~/steps/data/transcripts?

Lösungen

Schicken sie per e-mail die Antwort auf Frage 1.1 und die entsprechende Ausgabe, sowie die Antwort auf Frage 1.2 an Sebastian Stüker. Dies soll jeweils bis ein Tag vor dem nächsten Praktikumstermin geschehen.

Die Lösungen werden jeweils am Beginn des nächsten Termins besprochen und sind dann auch in der Praktikumsdokumentation verfügbar.