Robbie der Empfangsroboter - Projekt Labor

Transcrição

Robbie der Empfangsroboter - Projekt Labor
Robbie der Empfangsroboter - Projekt
Labor Aktives Sehen
Sommersemester 2003
Projektvorstellung
Teilnehmerliste
Ablauf
• Vorträge
Konzept vorbereiten und präsentieren.
• Realisierung des Roboters
Voraussetzungen
• Gute Programmierkenntnisse, vorzugsweise C/C++
• LATEX-Kenntnisse
• Vorzugsweise abgeschlossenes Vordiplom
Anforderungen
• 20 - 30 Min. Vortrag mit Folien und Handout mit Literaturreferenzen
• Aktive Teilnahme an den Diskussionen (jeweils max. 10 Min.)
• 1 Woche vor Vortrag Vorbesprechung des Vortrags mit den Betreuern
• Slides und Handout werden mit einer LATEX-Vorlage erstellt
http://www.uni-koblenz.de/agas/lehre/ss03/robbie/template.zip
• Aktive Teilnahme am Projekt
• Kooperative Software-Entwicklung
• Erfolgreiche Schlusspräsentation des Projektes
Gruppen
• Hardware
– Beschaffung und Ansteuerung des Mikrofons und der USB-Kamera
– Robotersteuerung über serielle Schnittstelle
– Festlegung der Software-Schnittstelle zur Motorsteuerung
– Roboter unter Linux lauffähig bekommen
– Batterieladung (optional)
– Literatur: [PDR+ 00, Abschnitt 3.3]
• Worterkennung
– Verwendung des Mikrofons als Eingabemedium
– Einfache Worterkennung (entweder Eigenbau oder aus dem Web)
– Einfache Dialoge (Sprachsynthese oder -konserve)
– Personenunabhängige Erkennung und möglichst adaptiv
– Literatur: [EN69], [WSM+ 81], [KKN+ 90], [NBH+ 84], [NBM+ 85],
[NBE+ 88], [SKST87], [SEK+ 88], [ST87], [ST89], [Sch95], [PH03,
Kapitel 22]
• Navigation
– Landmarkenerkennung (ggf. selber an die Decke anbringen)
– Topologische Karte des Flurs (automatisch vs. manuell)
– Hinderniserkennung und Wegplanung
– Literatur: s. Uni BW München, Graefe
• Eskorte
– Warten an der Treppe
– Erkennen einer eintreffenden Person
– Initialisierung des Dialogs und der Wegplanung
– Eskorte zur Tür
– Verabschiedung und Warten an der anderen Treppe
– Literatur: [Sch99],
http://www.unibw-muenchen.de/campus/LRT6/staff/graefe.htm
• Integration
– Zeitplanung und Festlegen von Meilensteinen
– Software-Schnittstellen-Kontrolle
– Management (Raum- und Beamerreservierung)
– Administration (CVS)
– Beschaffung und Finanzen
– Dokumentation (Beiträge anfordern)
– Literatur: [Bal98], CVS (http://www.cvshome.org/)
Literatur
[Bal98]
H. Balzert. Lehrbuch der Software-Technik, Bd. 2 SofwareManagement, Software-Qualitätssicherung und Unternehmensmodellierung. Spektrum Akademischer Verlag, ???, 1st edition,
1998.
[EN69]
G. Ernst and A. Newell, editors. GPS: A case study in generality
and problem solving. Academic Press, New York, 1969.
[KKN+ 90] T. Kuhn, S. Kunzmann, E. Noeth, S. Rieck, and E. SchukatTalamazzini. Iterative optimization of the data driven analysis in
continuous speech. Berlin, 1990. NATO ASI Speech Recognition
and Understanding, Springer-Verlag. To appear.
[NBE+ 88] H. Niemann, A. Brietzmann, U. Ehrlich, S. Posch, P. Regel,
G. Sagerer, R. Salzbrunn, and G. Schukat-Talamazzini. A knowledge based speech understanding system. 2(2):321–350, 1988.
[NBH+ 84] H. Niemann, A. Brietzmann, H. Hein, R. Mühlfeld, P. Regel,
and G. Schukat. A system for understanding continuous german
speech. Information Sciences, 33:87–113, 1984.
[NBM+ 85] H. Niemann, A. Brietzmann, R. Mühlfeld, P. Regel, and E.G.
Schukat. The Speech Understanding and Dialog System EVAR.
In R. De Mori and S.Y. Sun, editors, New Systems and Architectures for Automatic Speech Recognition and Synthesis. NATO
Series F 16, volume 16, pages 271 – 302. Springer-Verlag, Berlin,
Heidelberg, New York, Tokyo, 1985.
[PDR+ 00] D. Paulus, C. Drexler, M. Reinhold, M. Zobel, and J. Denzler.
Active computer vision system. In V. Cantoni and C. Guerra,
editors, Computer Architectures for Machine Perception, pages
18–27, Los Alamitos, California, USA, 2000. IEEE Computer Society.
[PH03]
D. Paulus and J. Hornegger. Applied pattern recognition: A practical introduction to image and speech processing in C++. Advanced Studies in Computer Science. Vieweg, Braunschweig, 3nd
edition, 2003.
The basic description of the programming environment
and its principles which are applied in the projects of
the LME. Contains image filtering, segmentation, and
principles of image analysis. Speech filtering, spectral
features for speech, speech understanding principles.
[Sch95]
E.G. Schukat–Talamazzini.
Vieweg, Wiesbaden, 1995.
Automatische Spracherkennung.
[Sch99]
R. Schug.
Probabilistische Personenlokalisierung und eskortierung mittels einer autonomen mobilen Plattform. Technical report, Diplomarbeit, Institut für Mathematische Maschinen und Datenverarbeitung, Friedrich-Alexander-Universität
Erlangen-Nürnberg, 1999.
[SEK+ 88] G. Sagerer, U. Ehrlich, F. Kummert, H. Niemann, and E. G.
Schukat-Talamazzini. A Flexible Control Strategy with Multilevel Judgements for a Knowledge Based Speech Understanding
System. In 9th International Conference on Pattern Recognition,
pages 788–790, Rom, 1988.
[SKST87] G. Sagerer, F. Kummert, and E. G. Schukat-Talamazzini. Flexible steuerung eines sprachverstehenden systems mit hilfe mehrkomponentiger bewertungen. In E. Paulus, editor, Mustererkennung 87, 9. DAGM-Symposium Braunschweig, InformatikFachberichte, pages 123–127. Springer-Verlag, Berlin, 1987.
[ST87]
E. G. Schukat-Talamazzini. Generierung von Worthypothesen in
kontinuierlicher Sprache, volume 141 of Informatik Fachberichte.
Springer Verlag, Berlin, Heidelberg, New York, Tokyo, 1987.
[ST89]
E. G. Schukat-Talamazzini. Akustisch-phonetisches netzwerk zur
verifikation von wörtern und wortketten. Interne Arbeitsunterlage, Lehrstuhl für Informatik 5 Mustererkennung, Universität
Erlangen-Nürnberg, 1989.
[WSM+ 81] Dieter Wunderlich, Gerd Schank, Dieter Metzing, Uwe Hein,
Albrecht Fauser, Richard J.D. Power, Genevieve Berry-Rogghe,
Guenther Goerz, and Maria Nowakowska. Dialogmuster und Dialogprozesse, volume 32 of Papiere zur Textlinguistik. Helmut Buske Verlag, Hamburg, 1981.