Embodied Conversational Agents

Transcrição

Embodied Conversational Agents
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Embodied Conversational Agents
(nach Cassell, Sullivan, Prevost & Churchill 2000)
u Computer-generierte Figuren, die ähnliche Eigenschaften
wie Menschen in „face-to-face“-Konversationen aufweisen,
inkl. Fähigkeiten verbaler und nonverbaler Kommunikation.
6 Intelligente Systeme
15. Vorlesung: Embodied Conversational Agents
u Sie können gesehen werden als
l
Methoden der KŸnstlichen Intelligenz
Bernhard Jung
Ê
l
WS 2001/2002
l
multimodales Interface mit natürlichen Modalitäten wie gesprochener Sprache, Gesichtsausdrücken, Handgesten und Körperhaltung
Software-Agenten, indem sie den Computer in der Interaktion mit
einem Menschen repäsentieren oder ihre menschlichen Benutzer in
einer virtuellen Umgebung (z.B. als Avatare) verkörpern
Dialog-Systeme, wobei sowohl verbale als auch nichtverbale
Komponenten den Mensch-Maschine-Dialog abwickeln.
15. Vorlesung
UniversitŠt Bielefeld
Methoden der KŸnstlichen Intelligenz
2
UniversitŠt Bielefeld
STEVE Ð Ein pŠdagogischer Agent
COSMO Ð Ein pŠdagogischer Agent
(Rickel & Johnson, 1998, 2000)
(Lester et al, 2000)
u SOAR Training Expert for Virtual Environments
u „Internet Advisor“:
Situiert in Lernumgebung
u Pädagogischer Agent: Vormachen
für Routing von Internetpaketen
von Prozeduren (Bedienung,
u Beobachtet Lernende und
Wartung von Maschinen)
gibt Ratschläge
u Beantwortung von Fragen /
Erklärung von Prozeduren
u Multimodale Kommunikation:
Sprache, Gestik, Blickrichtung
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
3
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
4
UniversitŠt Bielefeld
UniversitŠt Bielefeld
REA Ð Ein ãReal Estate AgentÒ
Architektur des REA-Systems
(Beispiel eines Embodied Conversational Agent am MIT Media Lab)
Hardwired Reaction
u Abwicklung eines Dialogs zwischen Wohnungsmaklerin REA und Benutzer
Deliberative Module
Knowledge
Base
Discourse
Model
Decision Module
Input
Devices
Interactional
Processing
Input
Manager
Understanding
Module
Speech
Gaze
Gesture
Body Position
...
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
5
UniversitŠt Bielefeld
15. Vorlesung
Propositional
Processing
Generation
Module
speech &
gesture
generation
Action
Scheduler
Response
Planner
Methoden der KŸnstlichen Intelligenz
Output
Devices
Speech
Gaze
Gesture
Body Position
...
6
UniversitŠt Bielefeld
Conversational Agents: Aspekte
Funktionen nonverbalen Verhaltens
(Krämer & Kopp, 2000)
Metapher der face-to-face
Konversation im InterfaceDesign:
u „mixed initiative“-Dialog
u auch nichtverbale
Kommunikation
u körperliche Anwesenheit
u Regeln für den
Kontrolltransfer
u Modeling functions
Einzelgesichtspunkte:
u Persönlichkeit
l
l
l
l
Expertisegebiet
Interessenprofil
audiovisuelle Erscheinung
u Performative
u konversationale
Funktionen
u Emotion
z.B. Vormachen von Prozeduren
u Discourse functions
l
Nonverbales Verhalten ergänzt / ersetzt Sprache
u Dialogue functions
l
turn-taking und back-channel Signale
u Relational functions
l
soziale Rollen, emotionales Klima
KI-Aspekt: Planung nonverbalen Verhaltens von ECAs
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
7
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
8
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Artikulierter Kommunikator
Instrukteur-Konstrukteur-Dialog
AG WBS
Kinematisches Skelett mit 43
degrees of freedom (DOF) in
29 Gelenken für den Körper
und 20 DOF für jede Hand.
Kooperation beim
gemeinsamen Bau
eines Flugzeugmodells
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
9
UniversitŠt Bielefeld
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
10
UniversitŠt Bielefeld
Generierung natŸrlicher Gesten
Artikulierter
Sprechrhythmus (stress timing)
Kommunikator
(in germanischen Sprachen)
• Betonung ("stress") durch zeitliche Dehnung
einzelner – und Verdichtung anderer – Silben:
Beschreibung einer Geste des Greifens
oder Heranwinkens in einer um Zeitconstraints erweiterten HamNoSys-Notation
–––––––––––––––––––––––––––––––––––––––––
Der
Die
Die
Der Inter-
Z ug
nach
Z ü-ge nach BerE i - s e n -b a h n n a c h
C i-ty nach B ad
Köln
lin
Altona
S egeberg
–––––––––––––––––––––––––––––––––––––––––
=> relativ konstante Dauer zwischen betonten
Silben, unabhängig von Silbenanzahl
(beim gleichen Sprecher unter gleichen Bedingungen)
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
11
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
12
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Zeitliche Kopplung
bei Sprache und Gestik
Diplomarbeit
Dirk Stößel
u Der oft zu beobachtende abrupte Stopp im
„Gesten-Schlag“ sprachbegleitender Gesten
korreliert mit betonten Silben im Sprechen.
u Das „Zwischenbetonungsintervall“ (interstress interval:
Zeit zwischen aufeinanderfolgenden betonten Silben)
beträgt bei flüssigem Sprechen ca. 1/2 sec.
u Die Antizipation der zeitlichen Struktur (Sprechrhythmus)
erleichtert die Äußerungs-Segmentierung beim Hörer
Rezipienten wie auch das „turn-taking“.
In unserem
Text-to-Speech
System (TTS)
lassen sich
prosodische
Funktionen
steuern
(pitch scaling,
time scaling)
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
13
UniversitŠt Bielefeld
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
14
UniversitŠt Bielefeld
ãMAXÒ
ãGilbert und GeorgeÒ
Cassell et al, 1994
Projektseminar, AG WBS, Uni Bielefeld
• Koordinierte Generierung von Sprache + nonverbalem Verhalten
(keine Interaktion mit Benutzer)
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
15
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
16
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Gesichtsmimik / Emotion...
Gesichtsmimik / Emotion...
Werden sich Emotionen modellieren und durch mimische Merkmale
darstellen lassen? Für die sechs Grundemotionen Glück und Trauer,
Überraschung, Angst/Furcht, Ekel/Abscheu und Zorn scheint es
universelle mimische Ausdrucksgestalten zu geben. [nach Ekman]
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
17
UniversitŠt Bielefeld
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
18
UniversitŠt Bielefeld
Gesichtsmimik / Emotion...
ECAs im Internet
Kismet-Roboter, MIT AI Lab
Chase Walker, Interface-Agent
www.headpedal.com
Cor@, virtuelle Beraterin der Deutschen Bank,
laut Eigenauskunft "künstlich intelligent"
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
19
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
20
UniversitŠt Bielefeld
Quellenhinweis:
u Cassell et al. (Eds.):
„Embodied Conversational
Agents“ (MIT Press, 2000)
15. Vorlesung
Methoden der KŸnstlichen Intelligenz
21

Documentos relacionados