Grundlagen der Künstlichen Intelligenz

Transcrição

Grundlagen der Künstlichen Intelligenz
KI – Wintersemester 2013/2014
Grundlagen der Künstlichen Intelligenz
Marc Toussaint
Machine Learning & Robotics Lab
Universität Stuttgart
[email protected]
http://ipvs.informatik.uni-stuttgart.de/mlr/marc/
Vorlesungen IS
Vorlesungen der Abteilung MLR
 Bachelor:
– Grundlagen der Künstlichen Intelligenz (3+1 SWS)
 Master: Vertiefungslinie Intelligente Systeme
– gemeinsam angeboten mit Andres Bruhn (Computer Vision)
 Vorlesungen der Vertiefungslinie IS:
– Mathematics for Intelligent Systems (Nathan Ratliff)
–
Introduction to Robotics (Toussaint)
–
SS: Machine Learning (Toussaint)
–
SS: Optimization (Toussaint)
–
Reinforcement Learning (Ngo)
 Hauptseminare:
– Advanced Machine Learning (Toussaint)
–
SS: Advanced Robotics (Toussaint)
3
Vorlesungen IS
Weitere Veranstaltungen von Andres Bruhn
 Vorlesungen der Vertiefungslinie IS:
– Computer Vision (Bruhn)
–
SS: Correspondence Problems in Computer Vision (Bruhn)
 Hauptseminare:
– Recent Advances in Computer Vision (Bruhn)
4
Organisatorisches (1)
Welche Voraussetzung werden empfohlen?
 Mathematik für Informatiker und Softwaretechniker
 außerdem hilfreich:
 Algorithmen und Datenstrukturen
 Theoretische Informatik
7
Organisatorisches (4)
Prüfungsmodalitäten
 Schriftliche Prüfung, 90 Minuten
 keine Hilfsmittel erlaubt
 Anmeldung: Im LSF / beim Prüfungsamt
 Prüfungszulassung: 50% der Punkte der Übungsaufgaben
 Vorrechnen:
 bis zu zwei mal im Semester möglich
 gibt die Hälfte der Aufgabenpunkte zusätzlich
Registrierung und Skript
 Webseite zur Vorlesung:
https://ipvs.informatik.uni-stuttgart.de/mlr/marc/teaching/
 das Skript wird dort zu jeder Vorlesung online gestellt
(passwortgeschützt)
8
Inhalt (1)
Inhalt
 Grundlagen der KI:
– Lösungs-Suche, Spiele, Logik, Inferenz
Nicht
 Mustererkennung (Computer Vision, Sprache)
 Lernen (Maschinelles Lernen, Reinforcement Lernen)
13
Inhalt (2)
Kapitel-Nummerierung wie Russel-Norvig
1. Einführung
2. Intelligente Agenten
3. Problemlösen durch Suchen
4. Heuristische Suche
5. Probleme mit Rand- oder Nebenbedingungen
6. Adversariale Suche
7. Logik-basierte Agenten
8. Prädikatenlogik
9. Prädikatenlogische Inferenz
16
Inhalt (3)
Kapitel-Nummerierung wie Russel-Norvig
13. Unsicherheit
14. Probablistisches Schließen
15. Inferenz über die Zeit
16. Rationale Entscheidungen
17. Komplexe Entscheidungen
17
Inhalt (4)
1. Einführung
 Intelligenz
 Definitionen der KI
 Rationalität
18
Inhalt (5)
2. Intelligente Agenten
 Agenten
 Umgebungen
 Agententypen
Schematischer Aufbau eines Agenten
19
Inhalt (6)
3. Problemlösen durch Suchen





Problemtypen
Problemformulierung
Beispielprobleme
Suchbäume
Suchstrategien
Routenplanung
Routenplanung als Suchproblem
20
Inhalt (7)
4. Heuristische Suche
 Informierte Suche
 Lokale Suchalgorithmen
 Nichtdeterministische Suche
Routenplanung mit Luftlinien-Heuristik
21
Inhalt (8)
5. Probleme mit Rand- oder Nebenbedingungen
 Constraint Satisfaction Problems (CSPs)
 Backtracking, Variablen und Werteauswahl,
Sackgassenvorhersage, Vorteilhafte Spezialfälle
 Lokale Suche
Lösung des Einfärbeproblems mit drei Farben
22
Inhalt (9)
6. Adversariale Suche






Spiele
Minimax für zwei Spieler
α-β Pruning
Minimax für mehrere Spieler
Nicht-deterministische Spiele
Kartenspiele
Suchbaum für Spiel mit Würfelkomponente
Schach bzw. Kartenspiel
23
Inhalt (10)
7. Logik-basierte Agenten






(   )  (    )
Wissens-basierte Agenten
Wumpus Welt
Inferenzregel für Bikonditional
Aussagenlogik
Inferenzregeln, Modus Ponens, Resolution
Vorwärtsverkettung, Rückwärtsverkettung
Inferenz durch Vorwärtsverkettung
Wumpus Welt
24
Inhalt (11)
8. Prädikatenlogik





Prädikatenlogik vs. Aussagenlogik
Quantoren
Anwendung der Prädikatenlogik
Wissensreprästentation in Prädikatenlogik
Repräsentation von Veränderungen
Prädikatenlogik
Represäntation von
Veränderungen
25
Inhalt (12)
9. Prädikatenlogische Inferenz






Instantiierung
Reduktion auf aussagenlogische Inferenz
Generalisierter Modus Ponens
Unifikation
Vorwärtsverkettung, Rückwärtsverkettung
Resolution
 x König(x)  Gierig(x)  Böse(x)
König(John)
 y Gierig(y)
Bruder(Richard,John)
Prädikatenlogische Inferenz
26
Inhalt (13)
13. Unsicherheit






Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Inferenz
Unabhängigkeit
Bedingte Unabhängigkeit
Bayes’sche Regel
Gemeinsame Wahrscheinlichkeiten
P(loch | zahnschmerzen) =
P(loch  zahnschmerzen) / P(zahnschmerzen)* =
(0.016+0.064) / (0.108 + 0.012 + 0.016 + 0.064) = 0.4
Berechnung bedingter Wahrscheinlichkeiten
27
Inhalt (14)
14. Probabilistisches Schließen
 Bedingte Wahrscheinlichkeitstabellen
 Bayes-Netze
Bayes-Netz
28
Inhalt (15)
15. Inferenz über die Zeit






Markov-Prozesse
Inferenz: Filterung, Vorhersage, Glättung, wahrsch. Erklärung
Hidden Markov Modelle
Kalman Filter
Dynamische Bayes-Netze
Spracherkennung
Hidden Markov Modell (HMM)
Kalman-Filterung von Trajektorien
29
Inhalt (16)
16. Rationale Entscheidungen





Rationale Prioritäten
Nutzenfunktion
Geld
Entscheidungsnetzwerke
Wert von Information
Lotterie/Aktion mit rationalem Ergebnis
MEN-Prinzip:
Wähle die Aktion A, die zur Maximierung des Erwarteten Nutzens führt.
EU(A | E) = i P(Resultati(A) | A, E) U(Resultati(A)).
Berechnung des erwarteten Nutzens
30
Inhalt (17)
17. Komplexe Entscheidungen




Sequentielle Entscheidungen
Markov Entscheidungsprozesse
Optimale Taktik
Wert- und Taktikiteration
Konvergenz von Nutzen und Taktik
Optimale Taktik (Handlungsschema) für Markov Entscheidungsprozess
31
Organisation der Übungen


Wir werden ca. 5 Probleme definieren:
–
Kürzester Weg in einer Karte [Suchmethoden]
–
CSP Probleme wie Sudoku und map coloring
–
Wumpus Welt (geplant)
–
Spam Filter mit Naive Bayes
–
Samplingmethoden
–
Schach/TicTacToe oder andere Spiele mit MCTS/UCT
Problem-orientierte Herangehensweise
32
Organisation der Übungen
 Eine gemeinsame Übung, 14-tägig, Donnerstag 11:30
 Die meisten Aufgaben werden Programmieraufgaben sein
– In den Übungsstunden besprechen wir den Lösungen und code
–
Einzelne Nicht-Programmier-Aufgaben werden hier in der
Präsenz-Übungen diskutiert
 Lösungen können in Gruppen
abgegeben werden
 Lösungen werden an einen gitlab server eingecheckt und automatisch
getestet
 Generische Programmiersprache: Python
33
Literatur
Hauptliteratur
●
Stuart Russell & Peter Norvig: Artificial Intelligence – A
Modern Approach (Pearson)
34

Documentos relacionados