Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision

•

1 gefällt mir•716 views

Institute for Digital Humanities, University of Cologne

Bildung

Basisinformationstechnologie II – Sommersemester 2016 – 13. Mai 2016
Dr. Jan G. Wieners
Algorithmen der Bildverarbeitung
Maschinelles Sehen / Computer Vision

Maschinelles Sehen / Computer Vision
 Problemstellung: Algorithmische sinnliche
Wahrnehmung?
 (Vorverarbeitung: Verbesserung des Quellmaterials)
 Kantendetektion
 Segmentierung
 Clustering
Themenüberblick

Bedeutung:
 „Schafe im Hochland Islands“
 „Geothermalkraftwerk Bjarnarflag“
 „Pünderich an der Mosel“
 Menschliche (sinnliche) Wahrnehmung + x + Hintergrundwissen

„Alles […], was ich bisher am ehesten für wahr
angenommen, habe ich von den Sinnen oder durch
Vermittelung der Sinne empfangen. Nun aber bin ich
dahinter gekommen, daß diese uns bisweilen täuschen,
und es ist ein Gebot der Klugheit, niemals denen ganz zu
trauen, die auch nur einmal uns getäuscht haben.“
(Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen.
Hamburg: meiner, 1994. S. 12)

„Schaf“
„Schaf“
„Schaf“
„Schafe“„Berg“„Hügel“
„Schotterpiste“
„Stein“

Hall of Fame der Kantenfilter / Kantenoperatoren
 Sobel-Operator
 Laplace-Operator
 Scharr-Operator
 Prewitt-Operator
 Kirsch-Operator
 Marr-Hildreth-Operator
 Canny-Algorithmus
 …

==
?
I. Differenzbild / pixelweiser Vergleich

Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Merkmalsextraktion
Merkmale
Merkmalsvektor

Anforderungen / Intention
 Separationsfähigkeit:
 Ähnliche Werte für ähnliche Objekte
 Unterschiedliche Werte für unterschiedliche Objekte
 Performanz
 Störungsanfälligkeit / Robustheit gegen Störungen
 Kompakter Merkmalsvektor
Merkmalsextraktion

Einfaches Modell eines künstlichen Neurons i mit:
 ℎ𝑖:Summe der gewichteten Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛, die das Neuron
von verknüpften externen Einheiten oder von Sensoren (𝜉1…𝜉𝑛) erhält
 𝑎𝑖: Aktivierungsmaß
 𝑔(ℎ𝑖): Aktivierungsfunktion
 𝑜𝑖: Ausgabe des Neurons

Verarbeitung der Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛 erfolgt in zwei Schritten:
 ℎ𝑖: gewichtete Summe der Eingabeimpulse bestimmen, die an dem
Neuron anliegen:
 Bestimmung des Aktivierungsmaßes (in den meisten Fällen: Ausgabe)
des Neurons:

Selbstorganisierende Karte (Kohonen-Karte)

Selbstorganisierende Karte (Kohonen-Karte)
 Clustering

 Filter & Co. Mit HTML5 und JavaScript:
http://www.html5rocks.com/en/tutorials/canvas/imag
efilters/?redirect_from_locale=de
 OpenCV (Open Source Computer Vision):
http://opencv.org/
 Framework (PC) für Playstation „Move“:
http://code.google.com/p/moveframework/
 Kinect for Windows SDK 2.0:
https://www.microsoft.com/en-
us/download/details.aspx?id=44561
Weiterführendes

 https://commons.wikimedia.org/wiki/File:Universitat_
zu_Koln_Hauptgebaude_ost.jpg
 http://causeitsallaboutthepayno.tumblr.com/post/131
746453874/im-currently-listening-to-adeles-new
 www.giphy.com
Bildnachweise

Weitere ähnliche Inhalte

Andere mochten auch

eCertificateAakash Kharat

19. Projektowanie podzespołów osi i wałówAdam Osa

Internet Freedom Festival Recap, 2016Robert Stribley

美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践美团点评技术团队

Bit sosem 2016-wieners-sitzung-11_bild-iii-filterInstitute for Digital Humanities, University of Cologne

Plant based, heart healthy dishesCentral Texas Medical Center

美团点评沙龙012-从零到千万量级的实时物流平台架构实践美团点评技术团队

Crowdfunding in India Crowdinvest

10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.ioTraction Conf

Plan tematik procesual TIK kl. II viti shkollor 2016/17Zekirja Latifi

Plan-për-mesim-me-eko-standarde Kl II 2016/17Zekirja Latifi

8 conclusionestaboada5

Andere mochten auch (12)

eCertificate

19. Projektowanie podzespołów osi i wałów

Internet Freedom Festival Recap, 2016

美团点评技术沙龙08 - 分布式会话跟踪系统架构设计与实践

Bit sosem 2016-wieners-sitzung-11_bild-iii-filter

Plant based, heart healthy dishes

美团点评沙龙012-从零到千万量级的实时物流平台架构实践

Crowdfunding in India

10 Offbeat Tactics to 10x Your Growth by Sujan Patel, CEO, ContentMarketer.io

Plan tematik procesual TIK kl. II viti shkollor 2016/17

Plan-për-mesim-me-eko-standarde Kl II 2016/17

8 conclusiones

Mehr von Institute for Digital Humanities, University of Cologne

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Institute for Digital Humanities, University of Cologne

Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Institute for Digital Humanities, University of Cologne

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Institute for Digital Humanities, University of Cologne

Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Institute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-13_ki-in-gamesInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-08_semantic-webInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-04_theoretische-informatikInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-03_algorithmenInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-02_datenstrukturenInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-01_auffrischungInstitute for Digital Humanities, University of Cologne

Bit sosem 2016-wieners-sitzung-00_themenueberblickInstitute for Digital Humanities, University of Cologne

Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIInstitute for Digital Humanities, University of Cologne

Bit wisem 2015-wieners-sitzung-12_Zusammenfassung IInstitute for Digital Humanities, University of Cologne

Bit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: EntwurfsmusterInstitute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...

Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...

Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...

Bit sosem 2016-wieners-sitzung-13_ki-in-games

Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen

Bit sosem 2016-wieners-sitzung-09_bild-i-kompression

Bit sosem 2016-wieners-sitzung-08_semantic-web

Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii

Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation

Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway

Bit sosem 2016-wieners-sitzung-04_theoretische-informatik

Bit sosem 2016-wieners-sitzung-03_algorithmen

Bit sosem 2016-wieners-sitzung-02_datenstrukturen

Bit sosem 2016-wieners-sitzung-01_auffrischung

Bit sosem 2016-wieners-sitzung-00_themenueberblick

Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II

Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I

Bit wisem 2015-wieners-sitzung-11_Software-Entwicklung II: Entwurfsmuster

Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision

1. Basisinformationstechnologie II – Sommersemester 2016 – 13. Mai 2016 Dr. Jan G. Wieners Algorithmen der Bildverarbeitung Maschinelles Sehen / Computer Vision

2. Maschinelles Sehen / Computer Vision  Problemstellung: Algorithmische sinnliche Wahrnehmung?  (Vorverarbeitung: Verbesserung des Quellmaterials)  Kantendetektion  Segmentierung  Clustering Themenüberblick

3. Computer Vision / maschinelles Sehen

7. Bedeutung:  „Schafe im Hochland Islands“  „Geothermalkraftwerk Bjarnarflag“  „Pünderich an der Mosel“  Menschliche (sinnliche) Wahrnehmung + x + Hintergrundwissen

10.

11.

12.

13.

14. „Alles […], was ich bisher am ehesten für wahr angenommen, habe ich von den Sinnen oder durch Vermittelung der Sinne empfangen. Nun aber bin ich dahinter gekommen, daß diese uns bisweilen täuschen, und es ist ein Gebot der Klugheit, niemals denen ganz zu trauen, die auch nur einmal uns getäuscht haben.“ (Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen. Hamburg: meiner, 1994. S. 12)

15. …und ?

16.

17.

18.

19.

20.

21.

22. Kantendetektion

23.

24. „Schaf“ „Schaf“ „Schaf“ „Schafe“„Berg“„Hügel“ „Schotterpiste“ „Stein“

25. Form Textur

26. Hall of Fame der Kantenfilter / Kantenoperatoren  Sobel-Operator  Laplace-Operator  Scharr-Operator  Prewitt-Operator  Kirsch-Operator  Marr-Hildreth-Operator  Canny-Algorithmus  …

27. Sobel-Operator:

28.

29.

30. Laplace-Operator:

31.

32.

33.

34.

35. Merkmalsextraktion

36. == ? I. Differenzbild / pixelweiser Vergleich

37. == ? II. Template Matching

38. == ?

39. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

40. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf Merkmalsextraktion Merkmale Merkmalsvektor

41. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

42. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

43. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

44. Anforderungen / Intention  Separationsfähigkeit:  Ähnliche Werte für ähnliche Objekte  Unterschiedliche Werte für unterschiedliche Objekte  Performanz  Störungsanfälligkeit / Robustheit gegen Störungen  Kompakter Merkmalsvektor Merkmalsextraktion

45. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf

46. Mustererkennung

47. Einfaches Modell eines künstlichen Neurons i mit:  ℎ𝑖:Summe der gewichteten Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛, die das Neuron von verknüpften externen Einheiten oder von Sensoren (𝜉1…𝜉𝑛) erhält  𝑎𝑖: Aktivierungsmaß  𝑔(ℎ𝑖): Aktivierungsfunktion  𝑜𝑖: Ausgabe des Neurons

48. Verarbeitung der Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛 erfolgt in zwei Schritten:  ℎ𝑖: gewichtete Summe der Eingabeimpulse bestimmen, die an dem Neuron anliegen:  Bestimmung des Aktivierungsmaßes (in den meisten Fällen: Ausgabe) des Neurons:

49.

50.

51.

52. Selbstorganisierende Karte (Kohonen-Karte)

53. Selbstorganisierende Karte (Kohonen-Karte)  Clustering

54.  Filter & Co. Mit HTML5 und JavaScript: http://www.html5rocks.com/en/tutorials/canvas/imag efilters/?redirect_from_locale=de  OpenCV (Open Source Computer Vision): http://opencv.org/  Framework (PC) für Playstation „Move“: http://code.google.com/p/moveframework/  Kinect for Windows SDK 2.0: https://www.microsoft.com/en- us/download/details.aspx?id=44561 Weiterführendes

55. /

56.  https://commons.wikimedia.org/wiki/File:Universitat_ zu_Koln_Hauptgebaude_ost.jpg  http://causeitsallaboutthepayno.tumblr.com/post/131 746453874/im-currently-listening-to-adeles-new  www.giphy.com Bildnachweise

Hinweis der Redaktion

Punktoperationen Binarisierung Histogrammausgleich Binarisierung, Schwellwertausgleich Filter Medianfilter
Geothermalkraftwerk Bjarnarflag
Pünderich, Mosel
Sinnliche Wahrnehmung Moped Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
Struktur / form?
Kaffeehaustäuschung
Auflösungsvermögen Das menschliche Auge besitzt ca. 6 Mio. Zapfenzellen und 120 Mio. Stabzellen; das Sensor-Array einer typischen CCD-Kamera 440.000 Bildpunkte (Video) bzw. 5-16 MegaPixel (Photo) Eine analoge 35mm Kleinbildkamera erreicht eine Auflösung von ca. 20 Megapixel (!) Verarbeitungsleistung Trotz relativ langsamer „Schaltzeiten“ im Millisekundenbereich garantiert parallele Verarbeitung eine extrem hohe Verarbeitungsleistung des menschl. visuellen Systems Farbensehen Das menschliche Auge kann ca. 100 Grauwerte und 7 Mio. Farben unterscheiden; digitale Graustufenbilder enthalten bis zu 256 Graustufen und bis zu 16,7 Mio Farben.
Vexierbilder Bedeutung?
Woher wissen Suchmaschinen, was in einer Rastergrafik dargestellt ist? Annotation: Metainformationen, ausgefülltes alt-Attribut des <img> Tags Bildanalyse
Der Algorithmus nutzt eine Faltung mittels einer 3×3-Matrix (Faltungsmatrix), die aus dem Originalbild ein Gradienten-Bild erzeugt. Mit diesem werden hohe Frequenzen im Bild mit Grauwerten dargestellt. Die Bereiche der größten Intensität sind dort, wo sich die Helligkeit des Originalbildes am stärksten ändert und somit die größten Kanten darstellt. Daher wird zumeist nach der Faltung mit dem Sobeloperator eine Schwellwert-Funktion angewandt. Der Algorithmus kann allerdings auch auf andere zweidimensionale Signale angewandt werden. Aus dem Originalbild wird für jeden Bildpunkt immer nur ein Ausschnitt, genauer gesagt die Umgebung des zu betrachtenden Punktes verwendet. Dazu wird eine Matrix definiert, deren Komponenten die Änderungsgewichtung der Umgebung vom Punkt repräsentieren. Die Matrix ist üblicherweise symmetrisch angelegt, sodass keine Änderung in der Umgebung zu einer Nullsumme führt (siehe unten). Nun werden mittels der Sobeloperatoren und die gefalteten Resultate und berechnet:
Der Algorithmus nutzt eine Faltung mittels einer 3×3-Matrix (Faltungsmatrix), die aus dem Originalbild ein Gradienten-Bild erzeugt. Mit diesem werden hohe Frequenzen im Bild mit Grauwerten dargestellt. Die Bereiche der größten Intensität sind dort, wo sich die Helligkeit des Originalbildes am stärksten ändert und somit die größten Kanten darstellt. Daher wird zumeist nach der Faltung mit dem Sobeloperator eine Schwellwert-Funktion angewandt. Der Algorithmus kann allerdings auch auf andere zweidimensionale Signale angewandt werden. Aus dem Originalbild wird für jeden Bildpunkt immer nur ein Ausschnitt, genauer gesagt die Umgebung des zu betrachtenden Punktes verwendet. Dazu wird eine Matrix definiert, deren Komponenten die Änderungsgewichtung der Umgebung vom Punkt repräsentieren. Die Matrix ist üblicherweise symmetrisch angelegt, sodass keine Änderung in der Umgebung zu einer Nullsumme führt (siehe unten). Nun werden mittels der Sobeloperatoren und die gefalteten Resultate und berechnet:
Anwendungsfall: PLANETS
Nach Kantendetektion: Segmente / Bildteile, die einzelne oder mehrere Objekte enthalten können Wir möchten herausfinden, ob zwei Objekte gleich sind Szenario 1 : Wie können wir hier einen Vergleich durchführen? Einfache Möglichkeit: Differenzbild unterschiedliche Pixel zählen bei vielen unterschiedlichen Pixeln => unterschiedli che Segmente bei wenig unterschiedlichen Pixeln => ähnliche/gleic he Segmente
Template Matching Das erste Segment wird in alle Positionen und Drehu ngen versetzt und mit dem zweiten verglichen, bis es „passt“. Problem: alle Drehungen müssen mit allen x-Verschiebungen und allen y-Verschiebungen kombiniert werden!  Sehr rechenintensiv
Großes Problem…
Es werden Charakterisierungen durch „Attribute“ oder Zahlen vorgenommen Vergleich der Attribute oder Zahlen ist einfach: Sind diese ungleich so sind die Objekte unterschiedlich Dies ist offensichtlich sehr viel schneller als Template Matching!
A quadrat + b quadrat
Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
Einfache Geometrische und Topologische Merkmale Viele Merkmale für Segmente sind schön anschaulich und einfach zu berechnen
Es fasst drei biologisch motivierte Fachgebiete der Informationsverarbeitung zusammen. Es basiert auf Algorithmen der Fuzzylogik und künstlichen neuronalen Netzen sowie auf den Evolutionären Algorithmen.
Hierbei signifiziert 𝑤𝑖𝑗𝑜𝑗 die Ausgabe 𝑜𝑗 des Knotens 𝑗, die das betrachtete Neuron 𝑖 durch eine gewichtete Verbindung 𝑤𝑖𝑗 erreicht. Ist ℎ𝑖 berechnet, wird anschließend die Aktivierungsfunktion 𝑔(ℎ𝑖) ausgeführt, die das Aktivierungsmaß 𝑎𝑖 des Neurons 𝑖 kalkuliert:
Netztopologien Ein vorwärtsgerichtetes künstliches neuronales Netz mit einer Eingabe-, einer versteckten- und einer Ausgabeschicht.

Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (12)

Mehr von Institute for Digital Humanities, University of Cologne

Mehr von Institute for Digital Humanities, University of Cologne (20)

Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision

Hinweis der Redaktion