2. Definition
Maschinelles Lernen ist der elementare Bereich
künstlicher Intelligenz
Es ist die Konstruktion von Systemen die aus
Daten selbstständig lernen können
“Field of study that gives computers the ability to
learn without being explicitly programmed”
~ Arthur Samuel, 1959
3. Anwendungsbeispiele
Solche Lernsysteme werden benutzt für:
Spam-filter für Emails (zB yahoo-mail)
Texterkennung (zB Handyhandschrifterkennung)
Spracherkennung (zB Telefonroboter)
Diagnoseverfahren (zB Krebs-wahrscheinlichkeit)
Google (zB die Nachrichten-kategorisierung auf News)
Viele weitere Bereiche […]
4. Typen der Lernalgorithmen
Überwachtes Lernen (supervised learning)
Lernt aus gegeben „richtigen“ Ein & Ausgaben
zB „Bei einer Person mit dem Alter 95 (input) war
Krebs vorhanden (richtiger output)“
Unüberwachtes Lernen (unsupervised learning)
Findet Strukturen in Daten. Es werden keine
„richtigen“ Antworten für die Inputs gegeben
zB „Es gibt eine krebskranke Person mit einem Alter von
95 Jahren und einem Haustier“ (Finde Zusammenhänge!)
Bestärkendes Lernen (reinforcement learning)
Lernen durch Belohnung/Bestrafung
zB „Gegen eine Wand fahren ist schlecht,
schnell fahren gut“
5. Typen der Ausgabe
Regression: „durchgehende“ Ausgabe
Für jeden Input liefert das Modell einen durchgehenden Wert
zB für das Voraussagen eines Wohnungspreises nach Wohnungsgröße
(Bei überwachtem Lernen)
6. Classification: bestimmte Ausgabe
Für jeden Input liefert das Modell einen von speziellen Werten
zB für das Erkennen ob eine Email Spam ist (1) oder nicht (0)
8. Das Training Set
Besteht (bei überwachtem Lernen) aus den Daten
durch die gelernt werden soll
zB eine Excel Tabelle mit 250 Spalten mit je einer Zeile
pro Wohnung (Trainingsbeispiel)
und 3 Spalten, wobei die 1. Spalte die
Wohnungsgrößen (x1) beinhaltet, die 2. die Anzahl von
Badezimmern (x2) und die 3. den Wohnungspreis (y -
die „richtige“ Antwort)
Das Training Set sollte so angepasst sein dass alle
Trainingsbeispiele sich in ähnlichem Zahlenbereich
befinden. Dazu verwendet man „Feature Scaling“ und
„Mean Normalization“.
9. Der Lernalgorithmus
Der Lernalgorithmus erstellt die bestmögliche
Hypothese anhand des gegebenen Training Sets
Mit der „Cost-function“ (J) findet man heraus wie „gut“ eine
Hypothese ist (anhand des Training Sets).
Hierbei wird der Abstand der Voraussagen zu den
tatsächlichen „richtigen Antworten“ gemessen.
Mit dem Lernalgorithmus probiert man diese zu optimieren.
Hierbei verändert man die Hypothese und je
niedriger das Ergebnis der Cost-function desto besser
die Hypothese
Ein vielbenutzter Lernalgorithmus ist
Gradient Descent
10. Die Hypothese
Die Hypothese ist das „fertige, befragbare“ Modell.
Man liefert Daten (beispielsweise in Form einer Excel
Tabelle) und bekommt die gewünschte Antwort (zB
einen voraussichtlichen Wohnungspreis)
Form einer Beispielhypothese: hΘ(x) = Θ0 + Θ1 * x
Hierbei ist x die gelieferten Daten
Die Θ („theta“) sind die „Knöpfe“ mit denen die Hypothese
angepasst wird. Diese werden mittels Gradient Descent
verändert um die beste Hypothese zu liefern.
11. Gradient Descent
Hiermit passt man die (thetas der) Hypothese
schrittweise an.
Erst initialisiert man die thetas mit einem Wert (zB 0)
Dann legt man die Schrittgröße (α) fest (zB 0.1)
Dann passt man die thetas schrittweise an bis die
Cost-function den besten (kleinsten) Wert liefert.
14. Octave ist eine gute, freie Software um dies praktisch
umzusetzen
Ein guter Einstieg zu Maschinellem Lernen ist der
kostenlose Kurs auf
https://www.coursera.org/course/ml
(auch Quelle für diese Präsentation)