Dank moderner Werkzeuge wie OpenDataCam ist Computer Vision, ein Teilbereich der KI, heute keine Raketenwissenschaft mehr. Mit ein wenig technischem Sachverstand kann man mit der Quantifizierung der Welt beginnen. Stephan Hochhaus gibt uns einen Einblick, wie man ohne Spezialkenntnisse Objekte erkennen, nachverfolgen und zählen kann. Dazu berichtet er von seinen Erfahrungen beim Zählen vor der eigenen Haustür mit einem nVidia Jetson und einer Webcam.
2. Ich zähle und erzähle
Stephan Hochhaus
Digital Product Nerd
@codecentric
Stephan Hochhaus
Digital Product Professional am Tag
Computer Vision Enthusiast bei Nacht
3. Was ich zu erzählen habe
• Wie alles begann
• Computer Vision Basics
• OpenDataCam
• Basics
• Praxis
• Erkenntnisse
• Rahmenbedingungen
• Einsatzszenarien
8. CV Tools: CUDA
GPUs sind für moderne KI-Methoden
um ein Vielfaches effizienter als CPUs.
CUDA ist eine von Nvidia entwickelte
Programmierplattform, mit der Programmteile
durch die GPU verarbeitet werden können.
9. CV Tools: Darknet
Darknet ist ein Open-Source-Framework für
Neuronale Netzwerke basierend auf C und CUDA.
10. CV Tools: You only look once
YOLO ist ein Echtzeitsystem
zur Objekterkennung
auf Basis von Darknet.
Wir fokussieren auf YOLOv4.
11. CV Tools: Common Objects in Context
COCO ist ein Dataset,
das zum Training für 80 Alltagsobjekte
genutzt werden kann.
12. CV Tools: OpenCV
OpenCV (englische Abk. für Open Computer Vision) ist eine freie
Programmbibliothek mit Algorithmen für Computer Vision.
OpenCV besteht aus Modulen für verschiedene Anwendungsfelder:
• Gesichtserkennung
• Gestenerkennung
• mobile Roboter
• Klassifizierung mit Hilfe der Viola-Jones-Methode
• Segmentierung und Erkennung
• optisches Tracking, Motion Compensation und Optischer Fluss
• Kalman-Filter zum Tracking
• …
13. Geht das nicht auch einfach?
Sonst könnt ihr ohne mich zählen
16. Man nehme
• Zählumgebung
• Balkon
• Straße vor dem Küchenfenster*
• Kamera
• USB-Webcam
• IP-Cam
• Videodatei
• Computer
• CUDA-fähige Hardware, z.B. nVidia
Jetson Nano
• CUDA-fähige Cloud-Instanzen*
*dazu später mehr
18. Hardware und Connectivity
• Logitech Webcam, ca. 70 Euro
• nVidia Jetson Nano, ca. 130 Euro*
• Sorry, no Raspberry
• Autarke Deployments mit PowerBank
• Keine Cloud-Anbindung
• 100% lokal
*oder andere nVidia-Hardware
19. Unter der Haube
• Linux + Jetpack
• Yolo + Weights
• Node.js
• Mongo DB
32. Wie genau schaut YOLO hin?
• Jetson Nano mit 8-15fps und einer Auflösung von 416x416
• Relative Größe im Frame spielt eine wesentliche Rolle
• Mehr Power erlaubt mehr fps und mehr Auflösung
• Confidence einstellbar für Tracker/Pathfinder
40. Zählen im öffentlichen Raum - Darf man das?
• IANAL – I am not a lawyer!
• Keine Speicherung und lokale
Datenverarbeitung
• https://www.bmvi.de/SharedDo
cs/DE/Artikel/DG/mfund-
projekte/OpenTrafficCount.html
• Stichwort Videoüberwachung
beim https://www.ldi.nrw.de/