SlideShare ist ein Scribd-Unternehmen logo
1 von 56
Basisinformationstechnologie II – Sommersemester 2016 – 13. Mai 2016
Dr. Jan G. Wieners
Algorithmen der Bildverarbeitung
Maschinelles Sehen / Computer Vision
Maschinelles Sehen / Computer Vision
 Problemstellung: Algorithmische sinnliche
Wahrnehmung?
 (Vorverarbeitung: Verbesserung des Quellmaterials)
 Kantendetektion
 Segmentierung
 Clustering
Themenüberblick
Computer Vision / maschinelles
Sehen
Bedeutung:
 „Schafe im Hochland Islands“
 „Geothermalkraftwerk Bjarnarflag“
 „Pünderich an der Mosel“
 Menschliche (sinnliche) Wahrnehmung + x + Hintergrundwissen
„Alles […], was ich bisher am ehesten für wahr
angenommen, habe ich von den Sinnen oder durch
Vermittelung der Sinne empfangen. Nun aber bin ich
dahinter gekommen, daß diese uns bisweilen täuschen,
und es ist ein Gebot der Klugheit, niemals denen ganz zu
trauen, die auch nur einmal uns getäuscht haben.“
(Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen.
Hamburg: meiner, 1994. S. 12)
…und ?
Kantendetektion
„Schaf“
„Schaf“
„Schaf“
„Schafe“„Berg“„Hügel“
„Schotterpiste“
„Stein“
Form Textur
Hall of Fame der Kantenfilter / Kantenoperatoren
 Sobel-Operator
 Laplace-Operator
 Scharr-Operator
 Prewitt-Operator
 Kirsch-Operator
 Marr-Hildreth-Operator
 Canny-Algorithmus
 …
Sobel-Operator:
Laplace-Operator:
Merkmalsextraktion
==
?
I. Differenzbild / pixelweiser Vergleich
==
?
II. Template Matching
==
?
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Merkmalsextraktion
Merkmale
Merkmalsvektor
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Anforderungen / Intention
 Separationsfähigkeit:
 Ähnliche Werte für ähnliche Objekte
 Unterschiedliche Werte für unterschiedliche Objekte
 Performanz
 Störungsanfälligkeit / Robustheit gegen Störungen
 Kompakter Merkmalsvektor
Merkmalsextraktion
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Mustererkennung
Einfaches Modell eines künstlichen Neurons i mit:
 ℎ𝑖:Summe der gewichteten Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛, die das Neuron
von verknüpften externen Einheiten oder von Sensoren (𝜉1…𝜉𝑛) erhält
 𝑎𝑖: Aktivierungsmaß
 𝑔(ℎ𝑖): Aktivierungsfunktion
 𝑜𝑖: Ausgabe des Neurons
Verarbeitung der Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛 erfolgt in zwei Schritten:
 ℎ𝑖: gewichtete Summe der Eingabeimpulse bestimmen, die an dem
Neuron anliegen:
 Bestimmung des Aktivierungsmaßes (in den meisten Fällen: Ausgabe)
des Neurons:
Selbstorganisierende Karte (Kohonen-Karte)
Selbstorganisierende Karte (Kohonen-Karte)
 Clustering
 Filter & Co. Mit HTML5 und JavaScript:
http://www.html5rocks.com/en/tutorials/canvas/imag
efilters/?redirect_from_locale=de
 OpenCV (Open Source Computer Vision):
http://opencv.org/
 Framework (PC) für Playstation „Move“:
http://code.google.com/p/moveframework/
 Kinect for Windows SDK 2.0:
https://www.microsoft.com/en-
us/download/details.aspx?id=44561
Weiterführendes
/
 https://commons.wikimedia.org/wiki/File:Universitat_
zu_Koln_Hauptgebaude_ost.jpg
 http://causeitsallaboutthepayno.tumblr.com/post/131
746453874/im-currently-listening-to-adeles-new
 www.giphy.com
Bildnachweise

Weitere ähnliche Inhalte

Andere mochten auch

19. Projektowanie podzespołów osi i wałów
19. Projektowanie podzespołów osi i wałów19. Projektowanie podzespołów osi i wałów
19. Projektowanie podzespołów osi i wałówAdam Osa
 
Internet Freedom Festival Recap, 2016
Internet Freedom Festival Recap, 2016Internet Freedom Festival Recap, 2016
Internet Freedom Festival Recap, 2016Robert Stribley
 
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践美团点评技术团队
 
美团点评沙龙012-从零到千万量级的实时物流平台架构实践
美团点评沙龙012-从零到千万量级的实时物流平台架构实践美团点评沙龙012-从零到千万量级的实时物流平台架构实践
美团点评沙龙012-从零到千万量级的实时物流平台架构实践美团点评技术团队
 
Crowdfunding in India
Crowdfunding in India Crowdfunding in India
Crowdfunding in India Crowdinvest
 
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.ioTraction Conf
 
Plan tematik procesual TIK kl. II viti shkollor 2016/17
Plan tematik procesual TIK kl. II viti shkollor 2016/17Plan tematik procesual TIK kl. II viti shkollor 2016/17
Plan tematik procesual TIK kl. II viti shkollor 2016/17Zekirja Latifi
 
Plan-për-mesim-me-eko-standarde Kl II 2016/17
 Plan-për-mesim-me-eko-standarde Kl II 2016/17 Plan-për-mesim-me-eko-standarde Kl II 2016/17
Plan-për-mesim-me-eko-standarde Kl II 2016/17Zekirja Latifi
 
8 conclusiones
8 conclusiones8 conclusiones
8 conclusionestaboada5
 

Andere mochten auch (12)

eCertificate
eCertificateeCertificate
eCertificate
 
19. Projektowanie podzespołów osi i wałów
19. Projektowanie podzespołów osi i wałów19. Projektowanie podzespołów osi i wałów
19. Projektowanie podzespołów osi i wałów
 
Internet Freedom Festival Recap, 2016
Internet Freedom Festival Recap, 2016Internet Freedom Festival Recap, 2016
Internet Freedom Festival Recap, 2016
 
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践
美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Plant based, heart healthy dishes
Plant based, heart healthy dishesPlant based, heart healthy dishes
Plant based, heart healthy dishes
 
美团点评沙龙012-从零到千万量级的实时物流平台架构实践
美团点评沙龙012-从零到千万量级的实时物流平台架构实践美团点评沙龙012-从零到千万量级的实时物流平台架构实践
美团点评沙龙012-从零到千万量级的实时物流平台架构实践
 
Crowdfunding in India
Crowdfunding in India Crowdfunding in India
Crowdfunding in India
 
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io
10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io
 
Plan tematik procesual TIK kl. II viti shkollor 2016/17
Plan tematik procesual TIK kl. II viti shkollor 2016/17Plan tematik procesual TIK kl. II viti shkollor 2016/17
Plan tematik procesual TIK kl. II viti shkollor 2016/17
 
Plan-për-mesim-me-eko-standarde Kl II 2016/17
 Plan-për-mesim-me-eko-standarde Kl II 2016/17 Plan-për-mesim-me-eko-standarde Kl II 2016/17
Plan-për-mesim-me-eko-standarde Kl II 2016/17
 
8 conclusiones
8 conclusiones8 conclusiones
8 conclusiones
 

Mehr von Institute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung IBit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
 
Bit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: Entwurfsmuster
Bit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: EntwurfsmusterBit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: Entwurfsmuster
Bit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: Entwurfsmuster
 

Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision

Hinweis der Redaktion

  1. Punktoperationen Binarisierung Histogrammausgleich Binarisierung, Schwellwertausgleich Filter Medianfilter
  2. Geothermalkraftwerk Bjarnarflag
  3. Pünderich, Mosel
  4. Sinnliche Wahrnehmung Moped Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  5. Struktur / form?
  6. Kaffeehaustäuschung
  7. Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
  8. Vexierbilder Bedeutung?
  9. Woher wissen Suchmaschinen, was in einer Rastergrafik dargestellt ist? Annotation: Metainformationen, ausgefülltes alt-Attribut des <img> Tags Bildanalyse
  10. Der Algorithmus nutzt eine Faltung mittels einer 3×3-Matrix (Faltungsmatrix), die aus dem Originalbild ein Gradienten-Bild erzeugt. Mit diesem werden hohe Frequenzen im Bild mit Grauwerten dargestellt. Die Bereiche der größten Intensität sind dort, wo sich die Helligkeit des Originalbildes am stärksten ändert und somit die größten Kanten darstellt. Daher wird zumeist nach der Faltung mit dem Sobeloperator eine Schwellwert-Funktion angewandt. Der Algorithmus kann allerdings auch auf andere zweidimensionale Signale angewandt werden. Aus dem Originalbild wird für jeden Bildpunkt immer nur ein Ausschnitt, genauer gesagt die Umgebung des zu betrachtenden Punktes verwendet. Dazu wird eine Matrix definiert, deren Komponenten die Änderungsgewichtung der Umgebung vom Punkt repräsentieren. Die Matrix ist üblicherweise symmetrisch angelegt, sodass keine Änderung in der Umgebung zu einer Nullsumme führt (siehe unten). Nun werden mittels der Sobeloperatoren und die gefalteten Resultate und berechnet:
  11. Der Algorithmus nutzt eine Faltung mittels einer 3×3-Matrix (Faltungsmatrix), die aus dem Originalbild ein Gradienten-Bild erzeugt. Mit diesem werden hohe Frequenzen im Bild mit Grauwerten dargestellt. Die Bereiche der größten Intensität sind dort, wo sich die Helligkeit des Originalbildes am stärksten ändert und somit die größten Kanten darstellt. Daher wird zumeist nach der Faltung mit dem Sobeloperator eine Schwellwert-Funktion angewandt. Der Algorithmus kann allerdings auch auf andere zweidimensionale Signale angewandt werden. Aus dem Originalbild wird für jeden Bildpunkt immer nur ein Ausschnitt, genauer gesagt die Umgebung des zu betrachtenden Punktes verwendet. Dazu wird eine Matrix definiert, deren Komponenten die Änderungsgewichtung der Umgebung vom Punkt repräsentieren. Die Matrix ist üblicherweise symmetrisch angelegt, sodass keine Änderung in der Umgebung zu einer Nullsumme führt (siehe unten). Nun werden mittels der Sobeloperatoren und die gefalteten Resultate und berechnet:
  12. Anwendungsfall: PLANETS
  13. Nach Kantendetektion: Segmente / Bildteile, die einzelne oder mehrere Objekte enthalten können Wir möchten herausfinden, ob zwei Objekte gleich sind Szenario 1 : Wie können wir hier einen Vergleich durchführen? Einfache Möglichkeit: Differenzbild unterschiedliche Pixel zählen bei vielen unterschiedlichen Pixeln => unterschiedli che Segmente bei wenig unterschiedlichen Pixeln => ähnliche/gleic he Segmente
  14. Template Matching Das erste Segment wird in alle Positionen und Drehu ngen versetzt und mit dem zweiten verglichen, bis es „passt“. Problem: alle Drehungen müssen mit allen x-Verschiebungen und allen y-Verschiebungen kombiniert werden!  Sehr rechenintensiv
  15. Großes Problem…
  16. Es werden Charakterisierungen durch „Attribute“ oder Zahlen vorgenommen Vergleich der Attribute oder Zahlen ist einfach: Sind diese ungleich so sind die Objekte unterschiedlich Dies ist offensichtlich sehr viel schneller als Template Matching!
  17. A quadrat + b quadrat
  18. Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
  19. Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
  20. Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
  21. Es fasst drei biologisch motivierte Fachgebiete der Informationsverarbeitung zusammen. Es basiert auf Algorithmen der Fuzzylogik und künstlichen neuronalen Netzen sowie auf den Evolutionären Algorithmen.
  22. Hierbei signifiziert 𝑤𝑖𝑗𝑜𝑗 die Ausgabe 𝑜𝑗 des Knotens 𝑗, die das betrachtete Neuron 𝑖 durch eine gewichtete Verbindung 𝑤𝑖𝑗 erreicht. Ist ℎ𝑖 berechnet, wird anschließend die Aktivierungsfunktion 𝑔(ℎ𝑖) ausgeführt, die das Aktivierungsmaß 𝑎𝑖 des Neurons 𝑖 kalkuliert:
  23. Netztopologien Ein vorwärtsgerichtetes künstliches neuronales Netz mit einer Eingabe-, einer versteckten- und einer Ausgabeschicht.