Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung

Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Basisinformationstechnologie II
Sommersemester 2014
04. Juni 2014 – Algorithmen der Bildverarbeitung II: Computervision – Vorverarbeitung

Maschinelles Sehen / Computer Vision
 Problemstellung: Algorithmische sinnliche
Wahrnehmung?
 Vorverarbeitung: Verbesserung des Quellmaterials
 Punktoperationen
 Binarisierung
 Histogrammausgleich
 Binarisierung, Schwellwertausgleich
 Filter
 Medianfilter
 Geometrische Operationen
 Merkmalsextraktion: Kantendetektion
 Algorithmische „kognitive“ Wahrnehmung:
 Künstliche Neuronale Netze
Themenüberblick

Welches Verfahren würden Sie
wählen, um die Binärfolge
0000 0011 1111 0000
zu komprimieren?
Erläutern Sie Ihre Wahl.

Welches Verfahren würden Sie wählen,
um die Binärfolge
0000 0011 1111 0000
zu komprimieren?
Erläutern Sie Ihre Wahl.
 z.B.: (6, 0) (6, 1) (4, 0)

Erläutern Sie ausführlich die
Funktionsweise der Huffman-
Kodierung anhand der Zeichenkette
„torokokorot“
(ohne Anführungszeichen).

Bildverarbeitung und
maschinelles Sehen

Sinnliche Wahrnehmung
Photorezeptorenschicht der
Netzhaut:
~ 6 Millionen Zapfen
~ 120 Millionen Stäbchen

„Alles […], was ich bisher am ehesten für wahr
angenommen, habe ich von den Sinnen oder durch
Vermittelung der Sinne empfangen. Nun aber bin
ich dahinter gekommen, daß diese uns bisweilen
täuschen, und es ist ein Gebot der Klugheit, niemals
denen ganz zu trauen, die auch nur einmal uns
getäuscht haben.“
(Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und
Erwiderungen. Hamburg: meiner, 1994. S. 12)

…und Algorithmen / Computer / Rechner?

rot, rot, grün, grün, grün, grün, grün,
rot, rot, rot, grün, rot, rot, rot, rot,
rot, grün, rot, rot, grün, rot, rot, rot,
rot, rot, grün, rot, rot, rot, rot, blau,
rot, blau, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, blau, rot, rot,
rot, rot, rot, blau, rot, rot, rot, blau,
rot, rot, rot, blau, rot, rot, rot, rot,
rot, blau, blau, blau, rot, rot, rot

Maschinelles Sehen /
Computer Vision

Von der Rastergrafik zur Merkmalsextraktion –
Algorithmen & Co.
 Vorbereitung bzw. Vorverarbeitung
 Punkt-Operationen
 Histogramm
 Filter
 Geometrische Operationen
 Drehung, Streckung, Verschiebung des Bildes
 Merkmalsextraktion
 Clustering
Maschinelles Sehen

Betrachtung / Veränderung eines Pixels unabhängig
von seinen Nachbarpixeln
Vorverarbeitung I: Punkt-Operationen

Gonzalez und Woods, 2008: „We can summarize by saying that RGB is ideal
for image color generation (as in image capture by a color camera or image
display in a monitor screen), but its use for color description is much more
limited.”
Zu viel Information: Umwandlung in Graustufenbild

Das IHS-Farbsystem (auch HSI, HSV Farbsystem):
 Leuchtstärke (Intensity): Maßeinheit der Helligkeit,
resultiert aus dem Durchschnitt der Farbwerte
 Sättigung (Saturation): Beschreibt die Farbreinheit
 Farbton (Hue): Proportional zur durchschnittlichen
Wellenlänge der Farbe; basiert auf Abbildung der
Farben in einem Polarkoordinatensystem:

Relevant für Umwandlung in Graustufenbild:
Leuchtstärke (Intensity)
Algorithmus:
 Betrachte jedes Pixel P der Rastergrafik
 Weise jedem Farbkanal des betrachteten Pixels P die Summe
der Werte der einzelnen Farbkanäle R, G und B zu und
dividiere anschließend durch die Anzahl der drei:

𝑃 = 𝑟𝑔𝑏(
𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵
3
,
3
,
3
)

Histogramm
Das Histogramm eines Bildes dokumentiert über eine Liste von 256
Elementen (bei einem 8-Bit Graustufenbild) die Anzahl (y-Achse) der
Pixel des Bildes, die mit dem entsprechenden Graustufenwert belegt
sind.

Histogramm
Das Histogramm eines Bildes dokumentiert über eine Liste von 256
Elementen (8-Bit Graustufenbild) die Anzahl der Pixel des Bildes, die
mit dem entsprechenden Farb- bzw. Graustufenwert belegt sind.
?

Algorithmus:
 Speichere den Graustufenwert des Pixels in einem
assoziierten Array:
// Initialisiere jede Speicherstelle des Arrays mit 0
array histogram[0-255] = 0;
// Iteriere über jedes Pixel des Bildes
array histogram[ PR ] += 1;
Histogrammerstellung – so funktioniert‘s

Histogrammausgleich (automatisch)
Z.B.: Lisani, Petro, Sbert 2012: Color and
Contrast Enhancement by Controlled
Piecewise Affine Histogram Equalization
Vgl. http://www.ipol.im/pub/art/2012/lps-pae/

Wie lässt sich (algorithmisch) eine Aufhellung des
Graustufenbildes vornehmen?
Übung: Bildaufhellung?

Wie lässt sich (algorithmisch) eine Aufhellung des
Graustufenbildes vornehmen?
Übung: Bildaufhellung?

Algorithmus:
 Betrachte jedes Pixel des Bildes
 Für jedes dunkle Pixel: Vermindere den Grauwert
 Für jedes helle Pixel: Erhöhe den Grauwert
Kontrastverstärkung

Zu viel Information II: Binarisierung
Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich
Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form
des Elephanten) zu zerstören?

Binarisierung mit konstantem Schwellenwert – so funktioniert‘s
Zwei Pixelklassen:
Algorithmus:
 Vergleiche den Farb-/Grauwert jedes Pixels mit dem
Schwellenwert T.
 Ist der Wert kleiner als der Schwellenwert, so wird es
schwarz eingefärbt (a).
 Ist der Wert größer oder gleich dem Schwellenwert, so wird
es weiß eingefärbt (b).

Filter: Betrachtung / Veränderung eines Pixels in
Abhängigkeit seiner Nachbarpixel
Achtung: Weil Originalpixel für das Ergebnis der
Filterung relevant (und unabdingbar) ist: Nutzung eines
Zwischenbildes als Ausgabe- oder Eingabepuffer.
Filter

 Lineare Filter (LSI-Filter, linear shift-invariant
filters): Jedes Pixel im Verarbeitungsfenster wird
mit einem vordefinierten Wert aus einer Faltungs-
bzw. Filtermatrix multipliziert.
 Nichtlineare Filter: U.a. heuristische Ansätze
Heuristik (vgl. Prechtl / Burkard): „Lehre bzw. Theorie der Verfahren zum Finden von Neuem und Problemlösen.“
Filter

 Berechnet einfachen arithmetischen Mittelwert der
Pixelwerte in der Nachbarschaft unter der
Filtermaske
 Faltungsmatrix 𝑀 =
1
9
1 1 1
1 1 1
1 1 1
 Pro / Contra:
 Rauschen reduziert
 Glättung / „Blurring“
 Kanten verwischen
Einfacher Mittelwertfilter
Quelle: Handels 2009: Medizinische Bildverarbeitung.

Einfacher Mittelwertfilter: 3x3 Pixel „Hotspot“

Einfacher Mittelwertfilter – so schaut‘s aus

Algorithmus Medianfilter (Rangordnungsfilter):
 Rangordnungsfilter betrachten die Nachbarschaftspixel
jedes Pixels, speichern die gefundenen Farb- bzw.
Graustufenwerte und sortieren die so gewonnenen Werte
in aufsteigender Reihenfolge.
 Aus einer 3x3 Pixelmatrix resultiert eine Liste, bestehend
aus insgesamt neun Werten. Relevant für das
Medianfilter ist das Element, das sich in der Mitte der
sortierten Liste der Pixelwerte befindet.
 Das Medianfilter selektiert den Pixelwert des fünften
Listenelements und weist dem Pixel in der Mitte der
Matrix den Median, d.h. den fünften Wert der Liste zu.
Beispiel Nichtlinearer Filter: Medianfilter

Medianfilter: Anwendungsbeispiele
Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Medianfilterp.png&filetimestamp=20070810172335

Medianfilter: Anwendungsbeispiele
Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Cydonia_medianrp.jpg&filetimestamp=20050313005105

Merkmalsextraktion:
Kantendetektion

Sobel-Operator
Vgl.:
http://de.wikipedia.org/wiki/Sobel-Operator
http://old.hki.uni-koeln.de/teach/ws0405/VIP/tag7/index.html

“Same Same But Different – Comparing Rendering Environments for Interactive
Digital Objects” (Guttenbrunner, Rauber, Thaller, Wieners): http://www.euromed2010.eu/e-
proceedings/content/full/140.pdf

 Künstliche Neuronale Netze, z.B. Hopfield-Netz
 Clustering
Beispiel: Selbstorganisierende Karte
…eine Portion KI…

 Filter & Co. Mit HTML5 und JavaScript:
http://www.html5rocks.com/en/tutorials/canvas/imagefi
lters/?redirect_from_locale=de
 OpenCV (Open Source Computer Vision):
http://opencv.org/
 OCRopus(tm) open source document analysis and
OCR system: www.code.google.com/p/ocropus/
 Framework (PC) für Playstation „Move“:
http://code.google.com/p/moveframework/
 Kinect for Windows SDK:
http://www.microsoft.com/en-
us/kinectforwindows/develop/developer-
downloads.aspx
Weiterführendes

Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (10)

Mehr von Institute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung

Hinweis der Redaktion