Hluboké učení pro každého (Jan Matoušek)

…we do target precisely
Hluboké učení pro
každého?
Neuronové sítě a spol.
Pro Data Restart 2018

Jan Matoušek / Data Mind s.r.o.
■Data mining/ data science (od 2003)
■Šéf Data Mind s.r.o. (od 2009)
■Co dělám: Předpovědní a segmentační modely
pro marketing (TELCO, RETAIL,
AUTOMOTIVE)
■Připravujeme průmyslové modely a
automatizaci do Kebooly (letos)
strana 2

Neuronové sítě na ráně
Co dělají neuronové sítě v běžném životě:
■Obírají vás na akciové, měnové burze (jo, platí i pro Kryptoměny a i pro HODL strategie)
■Zjišťují váš věk, pohlaví a náladu
■Kontrolují zda jste terorista
■Hrají hry
■Diagnostikují lidi
■Diagnostikují přístroje
■Rozpoznávají běžnou řeč
■Detekují složitý malware
■Detekují sofistikované podvody
■Řídí auta
■Poznávají dopravní a poznávací značky
strana 3

Dělat hluboké neuronové sítě nebo ne?
strana 4
ANO, jako veš NE
ANO NE, vobyč.marketingový data
ANO NE, jsem v pohodě
Kde nasadit hlubokou
neuronovou síť:
■ Komplexní signál
 Video
 Audio
 Senzory
 Složité jazykové problémy
 State of art aplikace
 Ožebračit 10.000 obchodníků
na burze
 Diagnostikovat rakovinu lépe
než ostatní
 Překonat 50 agentur v
předpovědi výpovědí (Churn
prediction)
 Frajeření na ostatní analytiky
 Celoživotní vzdělávání

Proč je děláme my ?
Poptávka na počítání a rozpoznání konzerv na pásu:
■Bez počítadla
■Z obrazových dat
■Včetně rozpoznání druhu konzervy
Další poptávka na Predictive Maintenance:
■Údržbu strojů na základě predikce
strana 5

Učící se křivka
strana 6
■Populární články nepomáhají
■Začínáme výběrem softwaru
■Šprtáme
■ Napojujeme
■ Ladíme
■ Provozujeme
■ Měníme

1. Čumíme do Facebooku /Youtube
strana 7
Zdroj:
Tom Brown
Publikováno 22. 1.
2018
Na Youtube

2.Vybíráme softwarový balíček
■Dilema mezi
nejpopulárnějším
TensorFlow a
nejjednodušším open
source Kerasem se
vyřeší snadno
■Použijte obojí
■Keras aTensoflow
vytvoří prostředí, které
je
 Jednoduché
 Silné když bude
potřeba
■Jednodušší jsou jen
komerční balíčky
napříkladWolfram
strana 8
Obrázek: Popularita jednotlivých balíčku pro Deep learning.
Zdroj dat: The Data Incubator, měřítko je ve standardních odchylkách
(!, pozn.: geekové pro geeky)

3 Šprtací zdroje
Zdrojů jsou stovky, já vyzkoušel:
■ Stanfordská univerzita a její videa
Jsou na youtube ,
Např: Introduction to Convolutional
Neural Networks forVisual
Recognition
■ Datacamp
■ Coursera
Jak to dostat do provozu (zkratky):
■ Keras je zadarmo v Pythonu + R
■ Nečekejte na nákupGPU (grafiky)
■ Nekoukejte naTED ani na bajky o
geniálních topinkovačích
■ Pozor na akademické knihy
 Grantoví běžci mají nekonečně
mnoho času
 Ladění parametru fň pro počítače
roku 2025 na 680 stránkách není to,
co byste měli číst na počátku
strana 9

4The Keras BLOG
■https://blog.keras.io/building-
powerful-image-classification-
models-using-very-little-data.html
■Neuronovou sít postavíte za 80
řádek kódu, které jsou tam
uvedeny
 Těžkých 80 řádek
strana 10

5. Porno, psi a kočky – Jak zvolíme první úlohu
■State of art úlohy:
 Porno na Seznam.cz (tlačítko skrýt hanbaté
obrázky)
 Google obrázky
 Desítky akademických i komerčních autorů
 Architektury modelů jsou často publikované
 Kaggle – soutěž datových geeků
■Obyčejné úlohy
 Rozpoznání psů a koček – doporučeno
autory Kerasu
 Rozpoznání Slonů a Aut
■Příliš triviální úlohy (nebrat)
 Rozpoznání barev, světla
 Nepotřebujete model, vystačíte si s
klasifikací RGB
strana 11

Příklad – Krok 1
Ukázkový model v Data Mind:
■ Obrázky s označením aut a slonů
■ Obrázky jsou různorodé (netříděný zdroj: seznam.cz)
strana 12

Příklad – Krok 2
Zpracování obrázků:
■Obrázky jsou převedeny na stejnou velikost
■Pro účely učení jsou použity náhodné rotace, posuny a oříznutí
strana 13
Standardizace velikosti Náhodné úpravy

Model ?
■Model obsahuje neurony:
Jednoduché funkce které se učí dle
vstupních signálů
■Výstupní vrstva má charakter:
Klasifikace:
Typ obrázku
strana 14

Příklad – Krok 3 – Architektura modelu
Vrstvy zpracování obrázků
■ První vrstva zachycuje nejmenší podobrázky například o 4*4 pixelech, které se snažíme pochopit pomocí „filtrů“
■ Obrázky se skládají do větších a větších čtverců zachycujících komplexnější tvary
Ze 190 malých výseků obrázků získáme 99, pak 48,pak 23 větších skládáním obrázků
■ Ve výsledku odhadujeme typ objektu
■ Chyby a úspěšné predikce upravují zpětně váhy jednotlivých „neuronů“
strana 15
Odhalení
čáry
Odhalení
chobotu
Odhalení
slona
Klasifikace slona
a měření vlivů
na správnou
klasifikaci
Zpětná propagace vah
dle úspěchu a chyb
Význam tvaru
slona
Význam
chobotu
Význam čáry

Příklad – Krok 4 – Skoring
strana 16strana 16
Skoring
čáry
Skoring
chobotu
Skoring
slona
Klasifikace slona
Vliv jednotlivých prvků na
správnou klasifikaci je znám
■ Neuronová síť uvidí nový obrázek, nelekne se ho, ale naopak ho správně zařadí do kategorie
■ Při klasifikaci objektů použijeme již naučené váhy:
 Malých obrázků a v nich rozpoznaných tvarů
 Součtu těchto malých obrázků do větších celků
 Celkový skoring objektu

Úspěšnost
Ve vzorovém projektu bylo úspěšně klasifikováno 95% objektů, na
kterých se model neučil a „viděl je“ až následně, když byl již hotov:
■Kdy nastane chybná klasifikace:
■S autem níže má naše neuronová síť velký problém.
Auto nemá kola, ale zato má hlavu a chobot, takže je klasifikováno jako slon
strana 17

Jednorožec Ksenie Sorokina
■ DigitálníAkademie Czechitas
■ Mentoring s Honzou
■ Úkol:
 Porozumět principům Hlubokého učení
 Nastavit model
 Natrénovat model
 Otestovat
 Optimalizovat
■ Výsledek:
 Model funguje s přesností 96%
 Optimalizace: zkráceni doby tréninku
 Technický článek: ttps://bit.ly/2pNkHSH
■ Ocenění:
 Jednorožec (nejvyšší metál v Czechitas)
 Keboola
■ Dělat hluboké neuronové sítě se vyplatí a dá se to
strana 18
Jednorožec ….

www.datamind.cz
Data Mind s.r.o., Pobřežní 18/16, 170 00 Praha 7
Loga a registrované značky uvedené v této prezentaci jsou majetkem jejich právoplatných majitelů.
Jan.Matousek
@datamind.cz
Ksenia Sorokina
@keboola.com
www.keboola.com

Hluboké učení pro každého (Jan Matoušek)

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Mehr von Taste Medio

Mehr von Taste Medio (20)

Hluboké učení pro každého (Jan Matoušek)