Robbie der Empfangsroboter - Projekt Labor
Transcrição
Robbie der Empfangsroboter - Projekt Labor
Robbie der Empfangsroboter - Projekt Labor Aktives Sehen Sommersemester 2003 Projektvorstellung Teilnehmerliste Ablauf • Vorträge Konzept vorbereiten und präsentieren. • Realisierung des Roboters Voraussetzungen • Gute Programmierkenntnisse, vorzugsweise C/C++ • LATEX-Kenntnisse • Vorzugsweise abgeschlossenes Vordiplom Anforderungen • 20 - 30 Min. Vortrag mit Folien und Handout mit Literaturreferenzen • Aktive Teilnahme an den Diskussionen (jeweils max. 10 Min.) • 1 Woche vor Vortrag Vorbesprechung des Vortrags mit den Betreuern • Slides und Handout werden mit einer LATEX-Vorlage erstellt http://www.uni-koblenz.de/agas/lehre/ss03/robbie/template.zip • Aktive Teilnahme am Projekt • Kooperative Software-Entwicklung • Erfolgreiche Schlusspräsentation des Projektes Gruppen • Hardware – Beschaffung und Ansteuerung des Mikrofons und der USB-Kamera – Robotersteuerung über serielle Schnittstelle – Festlegung der Software-Schnittstelle zur Motorsteuerung – Roboter unter Linux lauffähig bekommen – Batterieladung (optional) – Literatur: [PDR+ 00, Abschnitt 3.3] • Worterkennung – Verwendung des Mikrofons als Eingabemedium – Einfache Worterkennung (entweder Eigenbau oder aus dem Web) – Einfache Dialoge (Sprachsynthese oder -konserve) – Personenunabhängige Erkennung und möglichst adaptiv – Literatur: [EN69], [WSM+ 81], [KKN+ 90], [NBH+ 84], [NBM+ 85], [NBE+ 88], [SKST87], [SEK+ 88], [ST87], [ST89], [Sch95], [PH03, Kapitel 22] • Navigation – Landmarkenerkennung (ggf. selber an die Decke anbringen) – Topologische Karte des Flurs (automatisch vs. manuell) – Hinderniserkennung und Wegplanung – Literatur: s. Uni BW München, Graefe • Eskorte – Warten an der Treppe – Erkennen einer eintreffenden Person – Initialisierung des Dialogs und der Wegplanung – Eskorte zur Tür – Verabschiedung und Warten an der anderen Treppe – Literatur: [Sch99], http://www.unibw-muenchen.de/campus/LRT6/staff/graefe.htm • Integration – Zeitplanung und Festlegen von Meilensteinen – Software-Schnittstellen-Kontrolle – Management (Raum- und Beamerreservierung) – Administration (CVS) – Beschaffung und Finanzen – Dokumentation (Beiträge anfordern) – Literatur: [Bal98], CVS (http://www.cvshome.org/) Literatur [Bal98] H. Balzert. Lehrbuch der Software-Technik, Bd. 2 SofwareManagement, Software-Qualitätssicherung und Unternehmensmodellierung. Spektrum Akademischer Verlag, ???, 1st edition, 1998. [EN69] G. Ernst and A. Newell, editors. GPS: A case study in generality and problem solving. Academic Press, New York, 1969. [KKN+ 90] T. Kuhn, S. Kunzmann, E. Noeth, S. Rieck, and E. SchukatTalamazzini. Iterative optimization of the data driven analysis in continuous speech. Berlin, 1990. NATO ASI Speech Recognition and Understanding, Springer-Verlag. To appear. [NBE+ 88] H. Niemann, A. Brietzmann, U. Ehrlich, S. Posch, P. Regel, G. Sagerer, R. Salzbrunn, and G. Schukat-Talamazzini. A knowledge based speech understanding system. 2(2):321–350, 1988. [NBH+ 84] H. Niemann, A. Brietzmann, H. Hein, R. Mühlfeld, P. Regel, and G. Schukat. A system for understanding continuous german speech. Information Sciences, 33:87–113, 1984. [NBM+ 85] H. Niemann, A. Brietzmann, R. Mühlfeld, P. Regel, and E.G. Schukat. The Speech Understanding and Dialog System EVAR. In R. De Mori and S.Y. Sun, editors, New Systems and Architectures for Automatic Speech Recognition and Synthesis. NATO Series F 16, volume 16, pages 271 – 302. Springer-Verlag, Berlin, Heidelberg, New York, Tokyo, 1985. [PDR+ 00] D. Paulus, C. Drexler, M. Reinhold, M. Zobel, and J. Denzler. Active computer vision system. In V. Cantoni and C. Guerra, editors, Computer Architectures for Machine Perception, pages 18–27, Los Alamitos, California, USA, 2000. IEEE Computer Society. [PH03] D. Paulus and J. Hornegger. Applied pattern recognition: A practical introduction to image and speech processing in C++. Advanced Studies in Computer Science. Vieweg, Braunschweig, 3nd edition, 2003. The basic description of the programming environment and its principles which are applied in the projects of the LME. Contains image filtering, segmentation, and principles of image analysis. Speech filtering, spectral features for speech, speech understanding principles. [Sch95] E.G. Schukat–Talamazzini. Vieweg, Wiesbaden, 1995. Automatische Spracherkennung. [Sch99] R. Schug. Probabilistische Personenlokalisierung und eskortierung mittels einer autonomen mobilen Plattform. Technical report, Diplomarbeit, Institut für Mathematische Maschinen und Datenverarbeitung, Friedrich-Alexander-Universität Erlangen-Nürnberg, 1999. [SEK+ 88] G. Sagerer, U. Ehrlich, F. Kummert, H. Niemann, and E. G. Schukat-Talamazzini. A Flexible Control Strategy with Multilevel Judgements for a Knowledge Based Speech Understanding System. In 9th International Conference on Pattern Recognition, pages 788–790, Rom, 1988. [SKST87] G. Sagerer, F. Kummert, and E. G. Schukat-Talamazzini. Flexible steuerung eines sprachverstehenden systems mit hilfe mehrkomponentiger bewertungen. In E. Paulus, editor, Mustererkennung 87, 9. DAGM-Symposium Braunschweig, InformatikFachberichte, pages 123–127. Springer-Verlag, Berlin, 1987. [ST87] E. G. Schukat-Talamazzini. Generierung von Worthypothesen in kontinuierlicher Sprache, volume 141 of Informatik Fachberichte. Springer Verlag, Berlin, Heidelberg, New York, Tokyo, 1987. [ST89] E. G. Schukat-Talamazzini. Akustisch-phonetisches netzwerk zur verifikation von wörtern und wortketten. Interne Arbeitsunterlage, Lehrstuhl für Informatik 5 Mustererkennung, Universität Erlangen-Nürnberg, 1989. [WSM+ 81] Dieter Wunderlich, Gerd Schank, Dieter Metzing, Uwe Hein, Albrecht Fauser, Richard J.D. Power, Genevieve Berry-Rogghe, Guenther Goerz, and Maria Nowakowska. Dialogmuster und Dialogprozesse, volume 32 of Papiere zur Textlinguistik. Helmut Buske Verlag, Hamburg, 1981.