SlideShare ist ein Scribd-Unternehmen logo
1 von 69
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Basisinformationstechnologie II
Sommersemester 2014
04. Juni 2014 – Algorithmen der Bildverarbeitung II: Computervision – Vorverarbeitung
Maschinelles Sehen / Computer Vision
 Problemstellung: Algorithmische sinnliche
Wahrnehmung?
 Vorverarbeitung: Verbesserung des Quellmaterials
 Punktoperationen
 Binarisierung
 Histogrammausgleich
 Binarisierung, Schwellwertausgleich
 Filter
 Medianfilter
 Geometrische Operationen
 Merkmalsextraktion: Kantendetektion
 Algorithmische „kognitive“ Wahrnehmung:
 Künstliche Neuronale Netze
Themenüberblick
Übungsaufgaben
Kompression
Welches Verfahren würden Sie
wählen, um die Binärfolge
0000 0011 1111 0000
zu komprimieren?
Erläutern Sie Ihre Wahl.
Welches Verfahren würden Sie wählen,
um die Binärfolge
0000 0011 1111 0000
zu komprimieren?
Erläutern Sie Ihre Wahl.
 z.B.: (6, 0) (6, 1) (4, 0)
Erläutern Sie ausführlich die
Funktionsweise der Huffman-
Kodierung anhand der Zeichenkette
„torokokorot“
(ohne Anführungszeichen).
Bildverarbeitung und
maschinelles Sehen
Sinnliche Wahrnehmung
Photorezeptorenschicht der
Netzhaut:
~ 6 Millionen Zapfen
~ 120 Millionen Stäbchen
„Alles […], was ich bisher am ehesten für wahr
angenommen, habe ich von den Sinnen oder durch
Vermittelung der Sinne empfangen. Nun aber bin
ich dahinter gekommen, daß diese uns bisweilen
täuschen, und es ist ein Gebot der Klugheit, niemals
denen ganz zu trauen, die auch nur einmal uns
getäuscht haben.“
(Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und
Erwiderungen. Hamburg: meiner, 1994. S. 12)
…und Algorithmen / Computer / Rechner?
rot, rot, grün, grün, grün, grün, grün,
rot, rot, rot, grün, rot, rot, rot, rot,
rot, grün, rot, rot, grün, rot, rot, rot,
rot, rot, grün, rot, rot, rot, rot, blau,
rot, blau, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, blau, rot, rot,
rot, rot, rot, blau, rot, rot, rot, blau,
rot, rot, rot, blau, rot, rot, rot, rot,
rot, blau, blau, blau, rot, rot, rot
rot, rot, grün, grün, grün, grün, grün,
rot, rot, rot, grün, rot, rot, rot, rot,
rot, grün, rot, rot, grün, rot, rot, rot,
rot, rot, grün, rot, rot, rot, rot, blau,
rot, blau, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, blau, rot, rot,
rot, rot, rot, blau, rot, rot, rot, blau,
rot, rot, rot, blau, rot, rot, rot, rot,
rot, blau, blau, blau, rot, rot, rot
Maschinelles Sehen /
Computer Vision
Von der Rastergrafik zur Merkmalsextraktion –
Algorithmen & Co.
 Vorbereitung bzw. Vorverarbeitung
 Punkt-Operationen
 Histogramm
 Filter
 Geometrische Operationen
 Drehung, Streckung, Verschiebung des Bildes
 Merkmalsextraktion
 Clustering
Maschinelles Sehen
Betrachtung / Veränderung eines Pixels unabhängig
von seinen Nachbarpixeln
Vorverarbeitung I: Punkt-Operationen
Gonzalez und Woods, 2008: „We can summarize by saying that RGB is ideal
for image color generation (as in image capture by a color camera or image
display in a monitor screen), but its use for color description is much more
limited.”
Zu viel Information: Umwandlung in Graustufenbild
Das IHS-Farbsystem (auch HSI, HSV Farbsystem):
 Leuchtstärke (Intensity): Maßeinheit der Helligkeit,
resultiert aus dem Durchschnitt der Farbwerte
 Sättigung (Saturation): Beschreibt die Farbreinheit
 Farbton (Hue): Proportional zur durchschnittlichen
Wellenlänge der Farbe; basiert auf Abbildung der
Farben in einem Polarkoordinatensystem:
Zu viel Information: Umwandlung in Graustufenbild
Relevant für Umwandlung in Graustufenbild:
Leuchtstärke (Intensity)
Algorithmus:
 Betrachte jedes Pixel P der Rastergrafik
 Weise jedem Farbkanal des betrachteten Pixels P die Summe
der Werte der einzelnen Farbkanäle R, G und B zu und
dividiere anschließend durch die Anzahl der drei:

𝑃 = 𝑟𝑔𝑏(
𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵
3
,
𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵
3
,
𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵
3
)
Zu viel Information: Umwandlung in Graustufenbild
Zu viel Information: Umwandlung in Graustufenbild
Histogramm
Das Histogramm eines Bildes dokumentiert über eine Liste von 256
Elementen (bei einem 8-Bit Graustufenbild) die Anzahl (y-Achse) der
Pixel des Bildes, die mit dem entsprechenden Graustufenwert belegt
sind.
Histogramm
Das Histogramm eines Bildes dokumentiert über eine Liste von 256
Elementen (8-Bit Graustufenbild) die Anzahl der Pixel des Bildes, die
mit dem entsprechenden Farb- bzw. Graustufenwert belegt sind.
?
Algorithmus:
 Betrachte jedes Pixel P der Rastergrafik
 Speichere den Graustufenwert des Pixels in einem
assoziierten Array:
// Initialisiere jede Speicherstelle des Arrays mit 0
array histogram[0-255] = 0;
// Iteriere über jedes Pixel des Bildes
array histogram[ PR ] += 1;
Histogrammerstellung – so funktioniert‘s
Histogrammausgleich (automatisch)
Z.B.: Lisani, Petro, Sbert 2012: Color and
Contrast Enhancement by Controlled
Piecewise Affine Histogram Equalization
Vgl. http://www.ipol.im/pub/art/2012/lps-pae/
Wie lässt sich (algorithmisch) eine Aufhellung des
Graustufenbildes vornehmen?
Übung: Bildaufhellung?
Wie lässt sich (algorithmisch) eine Aufhellung des
Graustufenbildes vornehmen?
Übung: Bildaufhellung?
Algorithmus:
 Betrachte jedes Pixel des Bildes
 Für jedes dunkle Pixel: Vermindere den Grauwert
 Für jedes helle Pixel: Erhöhe den Grauwert
Kontrastverstärkung
Zu viel Information II: Binarisierung
Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich
Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form
des Elephanten) zu zerstören?
Zu viel Information II: Binarisierung
Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich
Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form
des Elephanten) zu zerstören?
Binarisierung mit konstantem Schwellenwert – so funktioniert‘s
Zwei Pixelklassen:
Algorithmus:
 Betrachte jedes Pixel P der Rastergrafik
 Vergleiche den Farb-/Grauwert jedes Pixels mit dem
Schwellenwert T.
 Ist der Wert kleiner als der Schwellenwert, so wird es
schwarz eingefärbt (a).
 Ist der Wert größer oder gleich dem Schwellenwert, so wird
es weiß eingefärbt (b).
Übung: Binarisierung
Filter: Betrachtung / Veränderung eines Pixels in
Abhängigkeit seiner Nachbarpixel
Achtung: Weil Originalpixel für das Ergebnis der
Filterung relevant (und unabdingbar) ist: Nutzung eines
Zwischenbildes als Ausgabe- oder Eingabepuffer.
Filter
 Lineare Filter (LSI-Filter, linear shift-invariant
filters): Jedes Pixel im Verarbeitungsfenster wird
mit einem vordefinierten Wert aus einer Faltungs-
bzw. Filtermatrix multipliziert.
 Nichtlineare Filter: U.a. heuristische Ansätze
Heuristik (vgl. Prechtl / Burkard): „Lehre bzw. Theorie der Verfahren zum Finden von Neuem und Problemlösen.“
Filter
 Berechnet einfachen arithmetischen Mittelwert der
Pixelwerte in der Nachbarschaft unter der
Filtermaske
 Faltungsmatrix 𝑀 =
1
9
1 1 1
1 1 1
1 1 1
 Pro / Contra:
 Rauschen reduziert
 Glättung / „Blurring“
 Kanten verwischen
Einfacher Mittelwertfilter
Quelle: Handels 2009: Medizinische Bildverarbeitung.
Einfacher Mittelwertfilter: 3x3 Pixel „Hotspot“
Einfacher Mittelwertfilter – so schaut‘s aus
𝑀 =
1
16
1 2 1
2 4 2
1 2 1
Was tun bei Bildrauschen?
Algorithmus Medianfilter (Rangordnungsfilter):
 Rangordnungsfilter betrachten die Nachbarschaftspixel
jedes Pixels, speichern die gefundenen Farb- bzw.
Graustufenwerte und sortieren die so gewonnenen Werte
in aufsteigender Reihenfolge.
 Aus einer 3x3 Pixelmatrix resultiert eine Liste, bestehend
aus insgesamt neun Werten. Relevant für das
Medianfilter ist das Element, das sich in der Mitte der
sortierten Liste der Pixelwerte befindet.
 Das Medianfilter selektiert den Pixelwert des fünften
Listenelements und weist dem Pixel in der Mitte der
Matrix den Median, d.h. den fünften Wert der Liste zu.
Beispiel Nichtlinearer Filter: Medianfilter
Medianfilter: Anwendungsbeispiele
Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Medianfilterp.png&filetimestamp=20070810172335
Medianfilter: Anwendungsbeispiele
Bildnachweis: http://de.wikipedia.org/w/index.php?title=Datei:Cydonia_medianrp.jpg&filetimestamp=20050313005105
Übung Medianfilter
?
?
?
Merkmalsextraktion:
Kantendetektion
Laplace-Operator / -Filter
Sobel-Operator
Vgl.:
http://de.wikipedia.org/wiki/Sobel-Operator
http://old.hki.uni-koeln.de/teach/ws0405/VIP/tag7/index.html
“Same Same But Different – Comparing Rendering Environments for Interactive
Digital Objects” (Guttenbrunner, Rauber, Thaller, Wieners): http://www.euromed2010.eu/e-
proceedings/content/full/140.pdf
 Künstliche Neuronale Netze, z.B. Hopfield-Netz
 Clustering
Beispiel: Selbstorganisierende Karte
…eine Portion KI…
 Filter & Co. Mit HTML5 und JavaScript:
http://www.html5rocks.com/en/tutorials/canvas/imagefi
lters/?redirect_from_locale=de
 OpenCV (Open Source Computer Vision):
http://opencv.org/
 OCRopus(tm) open source document analysis and
OCR system: www.code.google.com/p/ocropus/
 Framework (PC) für Playstation „Move“:
http://code.google.com/p/moveframework/
 Kinect for Windows SDK:
http://www.microsoft.com/en-
us/kinectforwindows/develop/developer-
downloads.aspx
Weiterführendes
/

Weitere ähnliche Inhalte

Andere mochten auch

FELIZ 2013 !!!!!!!!!!!!!
FELIZ 2013 !!!!!!!!!!!!!FELIZ 2013 !!!!!!!!!!!!!
FELIZ 2013 !!!!!!!!!!!!!CelesteUepc1
 
W@s oö konzeptentwurf beruf ung feld der widersprüche
W@s oö konzeptentwurf beruf ung  feld der widersprücheW@s oö konzeptentwurf beruf ung  feld der widersprüche
W@s oö konzeptentwurf beruf ung feld der widersprücheWerner Drizhal
 
museum-digital: Gemeinsam stark im Internet
museum-digital: Gemeinsam stark im Internetmuseum-digital: Gemeinsam stark im Internet
museum-digital: Gemeinsam stark im Internetmuseum-digital
 
Schulstruktur Vortrag 06 07 09
Schulstruktur Vortrag 06 07 09Schulstruktur Vortrag 06 07 09
Schulstruktur Vortrag 06 07 09MiradorBerlin
 
Markenschuhe – Eine Geschichte in der Entstehung !
Markenschuhe – Eine Geschichte in der Entstehung !Markenschuhe – Eine Geschichte in der Entstehung !
Markenschuhe – Eine Geschichte in der Entstehung !jaydenoliver
 
Damian gola Ketrzyn
Damian gola KetrzynDamian gola Ketrzyn
Damian gola KetrzynEwa Kowalska
 
Flower Garden Spring 2009
Flower Garden Spring 2009Flower Garden Spring 2009
Flower Garden Spring 2009Oldrich
 

Andere mochten auch (10)

FELIZ 2013 !!!!!!!!!!!!!
FELIZ 2013 !!!!!!!!!!!!!FELIZ 2013 !!!!!!!!!!!!!
FELIZ 2013 !!!!!!!!!!!!!
 
W@s oö konzeptentwurf beruf ung feld der widersprüche
W@s oö konzeptentwurf beruf ung  feld der widersprücheW@s oö konzeptentwurf beruf ung  feld der widersprüche
W@s oö konzeptentwurf beruf ung feld der widersprüche
 
museum-digital: Gemeinsam stark im Internet
museum-digital: Gemeinsam stark im Internetmuseum-digital: Gemeinsam stark im Internet
museum-digital: Gemeinsam stark im Internet
 
Schulstruktur Vortrag 06 07 09
Schulstruktur Vortrag 06 07 09Schulstruktur Vortrag 06 07 09
Schulstruktur Vortrag 06 07 09
 
Niemiecki
NiemieckiNiemiecki
Niemiecki
 
Markenschuhe – Eine Geschichte in der Entstehung !
Markenschuhe – Eine Geschichte in der Entstehung !Markenschuhe – Eine Geschichte in der Entstehung !
Markenschuhe – Eine Geschichte in der Entstehung !
 
Damian gola Ketrzyn
Damian gola KetrzynDamian gola Ketrzyn
Damian gola Ketrzyn
 
Trivial cultural 2
Trivial cultural 2Trivial cultural 2
Trivial cultural 2
 
Water Disaster
Water DisasterWater Disaster
Water Disaster
 
Flower Garden Spring 2009
Flower Garden Spring 2009Flower Garden Spring 2009
Flower Garden Spring 2009
 

Mehr von Institute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung IBit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
 

Bit SoSem 2014 | Basisinformationstechnologie II - 06: Algorithmen der Bildverarbeitung II: Computervision - Vorverarbeitung

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de Basisinformationstechnologie II Sommersemester 2014 04. Juni 2014 – Algorithmen der Bildverarbeitung II: Computervision – Vorverarbeitung
  • 2. Maschinelles Sehen / Computer Vision  Problemstellung: Algorithmische sinnliche Wahrnehmung?  Vorverarbeitung: Verbesserung des Quellmaterials  Punktoperationen  Binarisierung  Histogrammausgleich  Binarisierung, Schwellwertausgleich  Filter  Medianfilter  Geometrische Operationen  Merkmalsextraktion: Kantendetektion  Algorithmische „kognitive“ Wahrnehmung:  Künstliche Neuronale Netze Themenüberblick
  • 4. Welches Verfahren würden Sie wählen, um die Binärfolge 0000 0011 1111 0000 zu komprimieren? Erläutern Sie Ihre Wahl.
  • 5. Welches Verfahren würden Sie wählen, um die Binärfolge 0000 0011 1111 0000 zu komprimieren? Erläutern Sie Ihre Wahl.  z.B.: (6, 0) (6, 1) (4, 0)
  • 6. Erläutern Sie ausführlich die Funktionsweise der Huffman- Kodierung anhand der Zeichenkette „torokokorot“ (ohne Anführungszeichen).
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 14. Sinnliche Wahrnehmung Photorezeptorenschicht der Netzhaut: ~ 6 Millionen Zapfen ~ 120 Millionen Stäbchen
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20. „Alles […], was ich bisher am ehesten für wahr angenommen, habe ich von den Sinnen oder durch Vermittelung der Sinne empfangen. Nun aber bin ich dahinter gekommen, daß diese uns bisweilen täuschen, und es ist ein Gebot der Klugheit, niemals denen ganz zu trauen, die auch nur einmal uns getäuscht haben.“ (Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen. Hamburg: meiner, 1994. S. 12)
  • 21. …und Algorithmen / Computer / Rechner?
  • 22. rot, rot, grün, grün, grün, grün, grün, rot, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, blau, blau, rot, rot, rot
  • 23. rot, rot, grün, grün, grün, grün, grün, rot, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, rot, rot, blau, blau, blau, rot, rot, rot
  • 24.
  • 25.
  • 26.
  • 28. Von der Rastergrafik zur Merkmalsextraktion – Algorithmen & Co.  Vorbereitung bzw. Vorverarbeitung  Punkt-Operationen  Histogramm  Filter  Geometrische Operationen  Drehung, Streckung, Verschiebung des Bildes  Merkmalsextraktion  Clustering Maschinelles Sehen
  • 29. Betrachtung / Veränderung eines Pixels unabhängig von seinen Nachbarpixeln Vorverarbeitung I: Punkt-Operationen
  • 30. Gonzalez und Woods, 2008: „We can summarize by saying that RGB is ideal for image color generation (as in image capture by a color camera or image display in a monitor screen), but its use for color description is much more limited.” Zu viel Information: Umwandlung in Graustufenbild
  • 31. Das IHS-Farbsystem (auch HSI, HSV Farbsystem):  Leuchtstärke (Intensity): Maßeinheit der Helligkeit, resultiert aus dem Durchschnitt der Farbwerte  Sättigung (Saturation): Beschreibt die Farbreinheit  Farbton (Hue): Proportional zur durchschnittlichen Wellenlänge der Farbe; basiert auf Abbildung der Farben in einem Polarkoordinatensystem: Zu viel Information: Umwandlung in Graustufenbild
  • 32. Relevant für Umwandlung in Graustufenbild: Leuchtstärke (Intensity) Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Weise jedem Farbkanal des betrachteten Pixels P die Summe der Werte der einzelnen Farbkanäle R, G und B zu und dividiere anschließend durch die Anzahl der drei:  𝑃 = 𝑟𝑔𝑏( 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 , 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 , 𝑃𝑅 + 𝑃𝐺 + 𝑃𝐵 3 ) Zu viel Information: Umwandlung in Graustufenbild
  • 33. Zu viel Information: Umwandlung in Graustufenbild
  • 34. Histogramm Das Histogramm eines Bildes dokumentiert über eine Liste von 256 Elementen (bei einem 8-Bit Graustufenbild) die Anzahl (y-Achse) der Pixel des Bildes, die mit dem entsprechenden Graustufenwert belegt sind.
  • 35. Histogramm Das Histogramm eines Bildes dokumentiert über eine Liste von 256 Elementen (8-Bit Graustufenbild) die Anzahl der Pixel des Bildes, die mit dem entsprechenden Farb- bzw. Graustufenwert belegt sind. ?
  • 36. Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Speichere den Graustufenwert des Pixels in einem assoziierten Array: // Initialisiere jede Speicherstelle des Arrays mit 0 array histogram[0-255] = 0; // Iteriere über jedes Pixel des Bildes array histogram[ PR ] += 1; Histogrammerstellung – so funktioniert‘s
  • 37. Histogrammausgleich (automatisch) Z.B.: Lisani, Petro, Sbert 2012: Color and Contrast Enhancement by Controlled Piecewise Affine Histogram Equalization Vgl. http://www.ipol.im/pub/art/2012/lps-pae/
  • 38. Wie lässt sich (algorithmisch) eine Aufhellung des Graustufenbildes vornehmen? Übung: Bildaufhellung?
  • 39. Wie lässt sich (algorithmisch) eine Aufhellung des Graustufenbildes vornehmen? Übung: Bildaufhellung?
  • 40. Algorithmus:  Betrachte jedes Pixel des Bildes  Für jedes dunkle Pixel: Vermindere den Grauwert  Für jedes helle Pixel: Erhöhe den Grauwert Kontrastverstärkung
  • 41. Zu viel Information II: Binarisierung Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form des Elephanten) zu zerstören?
  • 42. Zu viel Information II: Binarisierung Grundfrage dieses (und der vergangenen Verfahren): Wie lässt sich Bildinformation verwerfen, ohne die Bildcharakteristika (i.e. die Form des Elephanten) zu zerstören?
  • 43. Binarisierung mit konstantem Schwellenwert – so funktioniert‘s Zwei Pixelklassen: Algorithmus:  Betrachte jedes Pixel P der Rastergrafik  Vergleiche den Farb-/Grauwert jedes Pixels mit dem Schwellenwert T.  Ist der Wert kleiner als der Schwellenwert, so wird es schwarz eingefärbt (a).  Ist der Wert größer oder gleich dem Schwellenwert, so wird es weiß eingefärbt (b).
  • 44.
  • 46.
  • 47. Filter: Betrachtung / Veränderung eines Pixels in Abhängigkeit seiner Nachbarpixel Achtung: Weil Originalpixel für das Ergebnis der Filterung relevant (und unabdingbar) ist: Nutzung eines Zwischenbildes als Ausgabe- oder Eingabepuffer. Filter
  • 48.  Lineare Filter (LSI-Filter, linear shift-invariant filters): Jedes Pixel im Verarbeitungsfenster wird mit einem vordefinierten Wert aus einer Faltungs- bzw. Filtermatrix multipliziert.  Nichtlineare Filter: U.a. heuristische Ansätze Heuristik (vgl. Prechtl / Burkard): „Lehre bzw. Theorie der Verfahren zum Finden von Neuem und Problemlösen.“ Filter
  • 49.  Berechnet einfachen arithmetischen Mittelwert der Pixelwerte in der Nachbarschaft unter der Filtermaske  Faltungsmatrix 𝑀 = 1 9 1 1 1 1 1 1 1 1 1  Pro / Contra:  Rauschen reduziert  Glättung / „Blurring“  Kanten verwischen Einfacher Mittelwertfilter Quelle: Handels 2009: Medizinische Bildverarbeitung.
  • 50. Einfacher Mittelwertfilter: 3x3 Pixel „Hotspot“
  • 51. Einfacher Mittelwertfilter – so schaut‘s aus
  • 52. 𝑀 = 1 16 1 2 1 2 4 2 1 2 1
  • 53. Was tun bei Bildrauschen?
  • 54. Algorithmus Medianfilter (Rangordnungsfilter):  Rangordnungsfilter betrachten die Nachbarschaftspixel jedes Pixels, speichern die gefundenen Farb- bzw. Graustufenwerte und sortieren die so gewonnenen Werte in aufsteigender Reihenfolge.  Aus einer 3x3 Pixelmatrix resultiert eine Liste, bestehend aus insgesamt neun Werten. Relevant für das Medianfilter ist das Element, das sich in der Mitte der sortierten Liste der Pixelwerte befindet.  Das Medianfilter selektiert den Pixelwert des fünften Listenelements und weist dem Pixel in der Mitte der Matrix den Median, d.h. den fünften Wert der Liste zu. Beispiel Nichtlinearer Filter: Medianfilter
  • 55.
  • 56.
  • 60. ? ? ?
  • 62.
  • 65.
  • 66. “Same Same But Different – Comparing Rendering Environments for Interactive Digital Objects” (Guttenbrunner, Rauber, Thaller, Wieners): http://www.euromed2010.eu/e- proceedings/content/full/140.pdf
  • 67.  Künstliche Neuronale Netze, z.B. Hopfield-Netz  Clustering Beispiel: Selbstorganisierende Karte …eine Portion KI…
  • 68.  Filter & Co. Mit HTML5 und JavaScript: http://www.html5rocks.com/en/tutorials/canvas/imagefi lters/?redirect_from_locale=de  OpenCV (Open Source Computer Vision): http://opencv.org/  OCRopus(tm) open source document analysis and OCR system: www.code.google.com/p/ocropus/  Framework (PC) für Playstation „Move“: http://code.google.com/p/moveframework/  Kinect for Windows SDK: http://www.microsoft.com/en- us/kinectforwindows/develop/developer- downloads.aspx Weiterführendes
  • 69. /

Hinweis der Redaktion

  1. Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  2. Struktur / form?
  3. Kaffeehaustäuschung
  4. Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  5. Bedeutung?
  6. Woher wissen Suchmaschinen, was in einer Rastergrafik dargestellt ist? Annotation: Metainformationen, ausgefülltes alt-Attribut des <img> Tags Bildanalyse
  7. Woher wissen Algorithmen, dass sich auf der Platine eine kalte Lötstelle befindet?
  8. Alle Pixelwerte um einen Wert n erhöhen
  9. Punktoperation
  10. Der Mittelwert-Filter ersetzt jedes Pixel durch den Mittelwert seiner Umgebungspixel. Dabei wird jedes Umgebungspixel gleich gewichtet. Dies hat zur Folge, dass der Mittelwert-Filter nicht nur Rauschen glättet, sondern auch Kanten im Bild verwischt. Er berechnet als neuen Pixelwert das arithmetische Mittel der Umgebungspixel.
  11. Faltungsmatrix Gaußscher Filter
  12. Anwendungsfall: PLANETS