Az adatbányászat és gépi tanulás automatizálása – de hogyan?

•Download as PPTX, PDF•

1 like•288 views

Dr. Tomás Horváth előadása a Magyar Információbrókerek Egyesülete konferenciáján - Mesterséges intelligencia az információkeresésben és -feldolgozásban, 2018. jún. 6.

Technology

Az adatbányászat és gépi
tanulás automatizálása
– de hogyan?
dr. Horváth Tomáš
Adattudományi és Adattechnológiai tanszék (T-Labs)
Informatikai kar, ELTE

Egy átlagos “adattudomány” projekt
Feladat
megértése
Adatok megértése Modellezés
Adatok
előkészítése
Eredmény
értékelése
Modell
hasznosí-
tása
időigényes
(szakértők + adattudósok)
unalmas
(adattudósok)
izgalmas
(szakértők+adattudósok)

Automatizáció - de miért?
● Sokkal kevesebb az “adattudósok” száma mint amennyi feladat van
● A kevésbé kreatív munkát csinálhatnák robotok is
○ Adatok előkészítése (automatizált adatbányászat)
■ zaj szűrés, hiányzó adatok pótlása, attribútumok kiválasztása, dimenzió csökkentés, …
○ Modellezés (automatizált gépi tanulás)
■ modell, algoritmus, hibafüggvény, hyper-paraméterek (pl. regularizáció), …
■ erről szólunk egy-két szót a következőkben
● Sok jó kutatási feladat rejlik a témában

Gépi tanulás - Modellezés
Train
Adatok
Modell típus
Optimalizáló
Algoritmus
hibafüggvény
hyper-
paraméterek
Optimalizált
modell
Teszt
Adat
Predikció
NO FREE LUNCH
tanulás

Automatizáció - de hogyan?
Az adott kérdéstől függ
● Milyen modellt használjunk?
○ transzfer tanulás, meta-tanulás
● Hogyan állítsuk be az adott modell hyper-paramétereit?
○ fekete-doboz függvények optimalizációja
● és hasonló kérdések
○ Kell-e egyáltalán hyper-paramétereket beállítani?
○ Meddig fog tartani az adott adatokon
az adott modell optimalizációja?
Sokszor látunk nem éppen jó ML/DM megoldásokat
● mert, “eddig így szoktuk csinálni” vagy
● mert, “a Google-nél bevált”, stb.

Fekete-doboz függvény optimalizáció
- a két klasszikus

Fekete-doboz függvény optimalizáció
- iteratív módszerek

Hol tartunk mi
https://github.com/kppeterkiss/BlackBoxOptimizer

Hol tartunk mi
Meta-features for Fast Data Characterization
● kutatás, kísérletek (idő- és számítás igényes)

Köszönöm a figyelmet!
http://t-labs.elte.hu/

Featured

2024 State of Marketing Report – by HubspotMarius Sescu

Everything You Need To Know About ChatGPTExpeed Software

Product Design Trends in 2024 | Teenage EngineeringsPixeldarts

How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow

AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork

Skeleton Culture CodeSkeleton Technologies

PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley

Content Methodology: A Best Practices Report (Webinar)contently

How to Prepare For a Successful Job Search for 2024Albert Qian

Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)

Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal

5 Public speaking tips from TED - Visualized summarySpeakerHub

ChatGPT and the Future of Work - Clark Boyd Clark Boyd

Getting into the tech field. what next Tessa Mero

Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray

How to have difficult conversations Rajiv Jayarajah, MAppComm, ACC

Introduction to Data ScienceChristy Abraham Joy

Time Management & Productivity - Best PracticesVit Horky

The six step guide to practical project managementMindGenius

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36

Featured (20)

2024 State of Marketing Report – by Hubspot

Everything You Need To Know About ChatGPT

Product Design Trends in 2024 | Teenage Engineerings

How Race, Age and Gender Shape Attitudes Towards Mental Health

AI Trends in Creative Operations 2024 by Artwork Flow.pdf

Skeleton Culture Code

PEPSICO Presentation to CAGNY Conference Feb 2024

Content Methodology: A Best Practices Report (Webinar)

How to Prepare For a Successful Job Search for 2024

Social Media Marketing Trends 2024 // The Global Indie Insights

Trends In Paid Search: Navigating The Digital Landscape In 2024

5 Public speaking tips from TED - Visualized summary

ChatGPT and the Future of Work - Clark Boyd

Getting into the tech field. what next

Google's Just Not That Into You: Understanding Core Updates & Search Intent

How to have difficult conversations

Introduction to Data Science

Time Management & Productivity - Best Practices

The six step guide to practical project management

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...

Az adatbányászat és gépi tanulás automatizálása – de hogyan?

1. Az adatbányászat és gépi tanulás automatizálása – de hogyan? dr. Horváth Tomáš Adattudományi és Adattechnológiai tanszék (T-Labs) Informatikai kar, ELTE

2. Egy átlagos “adattudomány” projekt Feladat megértése Adatok megértése Modellezés Adatok előkészítése Eredmény értékelése Modell hasznosí- tása időigényes (szakértők + adattudósok) unalmas (adattudósok) izgalmas (szakértők+adattudósok)

3. Automatizáció - de miért? ● Sokkal kevesebb az “adattudósok” száma mint amennyi feladat van ● A kevésbé kreatív munkát csinálhatnák robotok is ○ Adatok előkészítése (automatizált adatbányászat) ■ zaj szűrés, hiányzó adatok pótlása, attribútumok kiválasztása, dimenzió csökkentés, … ○ Modellezés (automatizált gépi tanulás) ■ modell, algoritmus, hibafüggvény, hyper-paraméterek (pl. regularizáció), … ■ erről szólunk egy-két szót a következőkben ● Sok jó kutatási feladat rejlik a témában

4. Gépi tanulás - Modellezés Train Adatok Modell típus Optimalizáló Algoritmus hibafüggvény hyper- paraméterek Optimalizált modell Teszt Adat Predikció NO FREE LUNCH tanulás

5. Automatizáció - de hogyan? Az adott kérdéstől függ ● Milyen modellt használjunk? ○ transzfer tanulás, meta-tanulás ● Hogyan állítsuk be az adott modell hyper-paramétereit? ○ fekete-doboz függvények optimalizációja ● és hasonló kérdések ○ Kell-e egyáltalán hyper-paramétereket beállítani? ○ Meddig fog tartani az adott adatokon az adott modell optimalizációja? Sokszor látunk nem éppen jó ML/DM megoldásokat ● mert, “eddig így szoktuk csinálni” vagy ● mert, “a Google-nél bevált”, stb.

6. Meta-tanulás

7. Fekete-doboz függvény optimalizáció - a két klasszikus

8. Fekete-doboz függvény optimalizáció - iteratív módszerek

9. Fekete-doboz függvény optimalizáció

10. Hol tartanak mások

11. Hol tartunk mi https://github.com/kppeterkiss/BlackBoxOptimizer

12. Hol tartunk mi Meta-features for Fast Data Characterization ● kutatás, kísérletek (idő- és számítás igényes)

13. Hol tart mindenki

14. Köszönöm a figyelmet! http://t-labs.elte.hu/

Az adatbányászat és gépi tanulás automatizálása – de hogyan?

Recommended

Recommended

More Related Content

Featured

Featured (20)

Az adatbányászat és gépi tanulás automatizálása – de hogyan?