Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Dr. Jan G. Wieners // jan.wieners@uni-koe...
Maschinelles Sehen / Computer Vision
 Problemstellung: Algorithmische sinnliche
Wahrnehmung?
 (Vorverarbeitung: Verbesse...
Computer Vision /
maschinelles Sehen
Bedeutung:
 „Schafe im Hochland Islands“
 „Geothermalkraftwerk Bjarnarflag“
 „Pünderich an der Mosel“
 Menschliche (si...
„Alles […], was ich bisher am ehesten für wahr
angenommen, habe ich von den Sinnen oder durch
Vermittelung der Sinne empfa...
…und ?
Kantendetektion
„Schaf“
„Schaf“
„Schaf“
„Schafe“„Berg“„Hügel“
„Schotterpiste“
„Stein“
Form Textur
Hall of Fame der Kantenfilter / Kantenoperatoren
 Sobel-Operator
 Laplace-Operator
 Scharr-Operator
 Prewitt-Operator
...
Sobel-Operator:
Laplace-Operator:
Merkmalsextraktion
==
?
I. Differenzbild / pixelweiser Vergleich
==
?
II. Template Matching
==
?
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Merkmalsextraktion
Merkmale
Mer...
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Anforderungen / Intention
 Separationsfähigkeit:
 Ähnliche Werte für ähnliche Objekte
 Unterschiedliche Werte für unter...
Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
Mustererkennung
Einfaches Modell eines künstlichen Neurons i mit:
 ℎ𝑖:Summe der gewichteten Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛, die das Neuron
von ve...
Verarbeitung der Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛 erfolgt in zwei Schritten:
 ℎ𝑖: gewichtete Summe der Eingabeimpulse bestimmen, di...
Selbstorganisierende Karte (Kohonen-Karte)
Selbstorganisierende Karte (Kohonen-Karte)
 Clustering
 Filter & Co. Mit HTML5 und JavaScript:
http://www.html5rocks.com/en/tutorials/canvas/imagefi
lters/?redirect_from_locale...
/
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision
Nächste SlideShare
Wird geladen in …5
×

BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision

727 Aufrufe

Veröffentlicht am

BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision

Veröffentlicht in: Bildung
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

BIT I SoSem 2015 | Basisinformationstechnologie II - 07_Maschinelles Sehen / Computer Vision

  1. 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan G. Wieners // jan.wieners@uni-koeln.de Basisinformationstechnologie II Sommersemester 2015 03. Juni 2015 – Maschinelles Sehen / Computer Vision
  2. 2. Maschinelles Sehen / Computer Vision  Problemstellung: Algorithmische sinnliche Wahrnehmung?  (Vorverarbeitung: Verbesserung des Quellmaterials)  Kantendetektion  Segmentierung  Clustering Themenüberblick
  3. 3. Computer Vision / maschinelles Sehen
  4. 4. Bedeutung:  „Schafe im Hochland Islands“  „Geothermalkraftwerk Bjarnarflag“  „Pünderich an der Mosel“  Menschliche (sinnliche) Wahrnehmung + x + Hintergrundwissen
  5. 5. „Alles […], was ich bisher am ehesten für wahr angenommen, habe ich von den Sinnen oder durch Vermittelung der Sinne empfangen. Nun aber bin ich dahinter gekommen, daß diese uns bisweilen täuschen, und es ist ein Gebot der Klugheit, niemals denen ganz zu trauen, die auch nur einmal uns getäuscht haben.“ (Descartes, René: Meditationen über die Grundlagen der Philosophie mit den sämtlichen Einwänden und Erwiderungen. Hamburg: meiner, 1994. S. 12)
  6. 6. …und ?
  7. 7. Kantendetektion
  8. 8. „Schaf“ „Schaf“ „Schaf“ „Schafe“„Berg“„Hügel“ „Schotterpiste“ „Stein“
  9. 9. Form Textur
  10. 10. Hall of Fame der Kantenfilter / Kantenoperatoren  Sobel-Operator  Laplace-Operator  Scharr-Operator  Prewitt-Operator  Kirsch-Operator  Marr-Hildreth-Operator  Canny-Algorithmus  …
  11. 11. Sobel-Operator:
  12. 12. Laplace-Operator:
  13. 13. Merkmalsextraktion
  14. 14. == ? I. Differenzbild / pixelweiser Vergleich
  15. 15. == ? II. Template Matching
  16. 16. == ?
  17. 17. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
  18. 18. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf Merkmalsextraktion Merkmale Merkmalsvektor
  19. 19. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
  20. 20. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
  21. 21. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
  22. 22. Anforderungen / Intention  Separationsfähigkeit:  Ähnliche Werte für ähnliche Objekte  Unterschiedliche Werte für unterschiedliche Objekte  Performanz  Störungsanfälligkeit / Robustheit gegen Störungen  Kompakter Merkmalsvektor Merkmalsextraktion
  23. 23. Quelle: http://lmb.informatik.uni-freiburg.de/people/haasdonk/DBV_FHO/DBV_FHO_SS08_E10.pdf
  24. 24. Mustererkennung
  25. 25. Einfaches Modell eines künstlichen Neurons i mit:  ℎ𝑖:Summe der gewichteten Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛, die das Neuron von verknüpften externen Einheiten oder von Sensoren (𝜉1…𝜉𝑛) erhält  𝑎𝑖: Aktivierungsmaß  𝑔(ℎ𝑖): Aktivierungsfunktion  𝑜𝑖: Ausgabe des Neurons
  26. 26. Verarbeitung der Eingabeimpulse 𝑤𝑖1…𝑤𝑖𝑛 erfolgt in zwei Schritten:  ℎ𝑖: gewichtete Summe der Eingabeimpulse bestimmen, die an dem Neuron anliegen:  Bestimmung des Aktivierungsmaßes (in den meisten Fällen: Ausgabe) des Neurons:
  27. 27. Selbstorganisierende Karte (Kohonen-Karte)
  28. 28. Selbstorganisierende Karte (Kohonen-Karte)  Clustering
  29. 29.  Filter & Co. Mit HTML5 und JavaScript: http://www.html5rocks.com/en/tutorials/canvas/imagefi lters/?redirect_from_locale=de  OpenCV (Open Source Computer Vision): http://opencv.org/  OCRopus(tm) open source document analysis and OCR system: www.code.google.com/p/ocropus/  Framework (PC) für Playstation „Move“: http://code.google.com/p/moveframework/  Kinect for Windows SDK: http://www.microsoft.com/en- us/kinectforwindows/develop/developer- downloads.aspx Weiterführendes
  30. 30. /

×