Künstliche Intelligenz - Maschinelles Lernen - Grundlagen

Definition
 Maschinelles Lernen ist der elementare Bereich
künstlicher Intelligenz
 Es ist die Konstruktion von Systemen die aus
Daten selbstständig lernen können
“Field of study that gives computers the ability to
learn without being explicitly programmed”
~ Arthur Samuel, 1959

Anwendungsbeispiele
Solche Lernsysteme werden benutzt für:
 Spam-filter für Emails (zB yahoo-mail)
 Texterkennung (zB Handyhandschrifterkennung)
 Spracherkennung (zB Telefonroboter)
 Diagnoseverfahren (zB Krebs-wahrscheinlichkeit)
 Google (zB die Nachrichten-kategorisierung auf News)
 Viele weitere Bereiche […]

Typen der Lernalgorithmen
 Überwachtes Lernen (supervised learning)
Lernt aus gegeben „richtigen“ Ein & Ausgaben
zB „Bei einer Person mit dem Alter 95 (input) war
Krebs vorhanden (richtiger output)“
 Unüberwachtes Lernen (unsupervised learning)
Findet Strukturen in Daten. Es werden keine
„richtigen“ Antworten für die Inputs gegeben
zB „Es gibt eine krebskranke Person mit einem Alter von
95 Jahren und einem Haustier“ (Finde Zusammenhänge!)
 Bestärkendes Lernen (reinforcement learning)
Lernen durch Belohnung/Bestrafung
zB „Gegen eine Wand fahren ist schlecht,
schnell fahren gut“

Typen der Ausgabe
 Regression: „durchgehende“ Ausgabe
Für jeden Input liefert das Modell einen durchgehenden Wert
zB für das Voraussagen eines Wohnungspreises nach Wohnungsgröße
(Bei überwachtem Lernen)

 Classification: bestimmte Ausgabe
Für jeden Input liefert das Modell einen von speziellen Werten
zB für das Erkennen ob eine Email Spam ist (1) oder nicht (0)

Funktionsweise des
Überwachten Lernens

Das Training Set
Besteht (bei überwachtem Lernen) aus den Daten
durch die gelernt werden soll
 zB eine Excel Tabelle mit 250 Spalten mit je einer Zeile
pro Wohnung (Trainingsbeispiel)
 und 3 Spalten, wobei die 1. Spalte die
Wohnungsgrößen (x1) beinhaltet, die 2. die Anzahl von
Badezimmern (x2) und die 3. den Wohnungspreis (y -
die „richtige“ Antwort)
 Das Training Set sollte so angepasst sein dass alle
Trainingsbeispiele sich in ähnlichem Zahlenbereich
befinden. Dazu verwendet man „Feature Scaling“ und
 „Mean Normalization“.

Der Lernalgorithmus
Der Lernalgorithmus erstellt die bestmögliche
Hypothese anhand des gegebenen Training Sets
 Mit der „Cost-function“ (J) findet man heraus wie „gut“ eine
Hypothese ist (anhand des Training Sets).
Hierbei wird der Abstand der Voraussagen zu den
tatsächlichen „richtigen Antworten“ gemessen.
 Mit dem Lernalgorithmus probiert man diese zu optimieren.
Hierbei verändert man die Hypothese und je
niedriger das Ergebnis der Cost-function desto besser
die Hypothese
 Ein vielbenutzter Lernalgorithmus ist
Gradient Descent

Die Hypothese
Die Hypothese ist das „fertige, befragbare“ Modell.
Man liefert Daten (beispielsweise in Form einer Excel
Tabelle) und bekommt die gewünschte Antwort (zB
einen voraussichtlichen Wohnungspreis)
 Form einer Beispielhypothese: hΘ(x) = Θ0 + Θ1 * x
 Hierbei ist x die gelieferten Daten
 Die Θ („theta“) sind die „Knöpfe“ mit denen die Hypothese
angepasst wird. Diese werden mittels Gradient Descent
verändert um die beste Hypothese zu liefern.

Gradient Descent
Hiermit passt man die (thetas der) Hypothese
schrittweise an.
 Erst initialisiert man die thetas mit einem Wert (zB 0)
 Dann legt man die Schrittgröße (α) fest (zB 0.1)
 Dann passt man die thetas schrittweise an bis die
Cost-function den besten (kleinsten) Wert liefert.

 Octave ist eine gute, freie Software um dies praktisch
umzusetzen
 Ein guter Einstieg zu Maschinellem Lernen ist der
kostenlose Kurs auf
https://www.coursera.org/course/ml
(auch Quelle für diese Präsentation)

Danke für Ihre Aufmerksamkeit

Künstliche Intelligenz - Maschinelles Lernen - Grundlagen

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Andere mochten auch

Andere mochten auch (20)

Künstliche Intelligenz - Maschinelles Lernen - Grundlagen