SlideShare ist ein Scribd-Unternehmen logo
1 von 30
Downloaden Sie, um offline zu lesen
PETR HAMERNÍK
Textová analytika

v mobilních aplikacích
14.1.2015 FIT ČVUT
Témata:
1. Zpracování přirozeného jazyka
2. Geneea REST API a architektura NLP řešení
3. Demo – rychlé zapojení NLP do mobilní aplikace (Android)
4. Co se s tím dá dělat?
4 x
4
Témata:
1. Zpracování přirozeného jazyka
2. Geneea REST API a architektura NLP řešení
3. Demo – rychlé zapojení NLP do mobilní aplikace (Android)
4. Co se s tím dá dělat?
4 x
5
1. Zpracování přirozeného jazyka
(Natural language processing = NLP)
Obor na pomezí lingvistiky a informatiky (umělé inteligence)
• Mluvené slovo: rozpoznávání a syntéza řeči
• Korektura textu a strojový překlad
• Generování textu (NLG – natural language generation)
• Extrakce informací z textu
6
Extrakce informací z textu 1/3
• Detekce jazyka
• Extrakce informací (pojmenovaných entity):
• Jména osob
• Geografické názvy
• Názvy firem
• Čísla, částky,… vlastní typy
7
8
Extrakce informací z textu – 2/3
Detekce tématu:
• Kategorizace
• Předem dané kategorie, hierarchie
• Štítky
• Otevřená množina
• Nejsou nutná anotovaná trénovací data
Zdroj: idnes.cz
9
Extrakce informací z textu 3/3
Analýza sentimentu
• Nálada zprávy nebo dokumentu: pozitivní / neutrální / negativní
(bipolární)
• Kontroverzní oblast
• Domenově specifická (“Přečtěte si knížku“ – recenze filmu vs.
knihy)
10
11
Analýza sentimentu během MS v hokeji
12
Sentiment vs. výsledky hráčů
13
Extrakce informací z textu – shrnutí
• Detekce jazyka
• Extrakce pojmenovaných entit – osoby, geografické názvy, firmy,
atd.
• Detekce tématu – kategorizace nebo štítky
• Analýza sentimentu
14
Témata:
1. Zpracování přirozeného jazyka
2. Geneea REST API a architektura NLP řešení
3. Demo – rychlé zapojení NLP do mobilní aplikace (Android)
4. Co se s tím dá dělat?
15
2. Geneea Interpretor
• NLP platforma
• Cloudová služba SaaS (software as a service)
• Dostupná a integrovatelná přes REST API
• Na adrese: api.geneea.com
• Klíč pro přístup zdarma získáte tamtéž
16
17
Zapojení REST API – Java
18
Zapojení REST API – Python
19
Technologie v NLP platformě
• Kombinace strojového učení s pravidly
• Na některé části lze využít Open source knihovny – TensorFlow,
OpenNLP
• Anotovaná data
• Komponentová architektura
Detekce
jazyka
Lemmatizac
e
Detekce
tématu
Analýza
sentimentu
Analýza
sentimentu
Lemmatizac
e
20
… …
…
Témata:
1. Zpracování přirozeného jazyka
2. Geneea REST API a architektura NLP řešení
3. Demo – rychlé zapojení NLP do mobilní aplikace (Android)
4. Co se s tím dá dělat?
21
3. Rychlé zapojení NLP přímo
do mobilní aplikace (ukázka Android)
• Dvě obrazovky – vstup a výstup
• Analýza se volá přímo z Androidu
22
23
24
Témata:
1. Zpracování přirozeného jazyka
2. Geneea REST API a architektura NLP řešení
3. Demo – rychlé zapojení NLP do mobilní aplikace (Android)
4. Co se s tím dá dělat?
25
4. Co se s tím dá dělat?
K čemu je to dobré?
Příklady použití (ne nutně v mobilní aplikaci, ale na serverové straně) -
inspirace
• Štítky k dokumentům – obsah o čem text je, propojování obsahu (Gmail,
Evernote, blogy, news)
• Helpdesk – kategorizace ticketů, analýza sentimentu, celkový pohled na
data, detekce anomálií.
• Uživatelské komentáře – obsah (o čem jsou), nálada, produkty na
srovnávači cen
Všude, kde je text….
26
4. Proč je to dobré dělat?
• Množství nestrukturovaných dat roste
• Samozřejmě obrázky a videa, ale textů také dost
• Často leží ladem, případně texty čtou lidi
• Big picture – celkový přehled
27
Exponenciální růst výpočetních technologií,
digitalizace a dostupnost informací a
rekombinantní inovace … stojí za objevy,
které mění science fiction na běžnou součást
našeho života…
— E. Brynjolfsson, A.McAfee: Druhý věk strojů
28
• www.mdevtalk.cz – tato prezentace
• www.geneea.com – blog, atd.
• api.geneea.com - klíč, dokumentace, příklady
• Dnešní Android příklad: https://github.com/Geneea/android-demo
• Napište nám, co se vám líbí/nelíbí, co chybí, jak byste to chtěli použít:
info@geneea.com @GeneeaAnalytics
Děkuji za pozornost.
Otázky?
29
Geneea
Další zdroje
WWW.MDEVTALK.CZ
mdevtalk
30

Weitere ähnliche Inhalte

Andere mochten auch

Foreign Aid Depedency in Rwanda
Foreign Aid Depedency in RwandaForeign Aid Depedency in Rwanda
Foreign Aid Depedency in Rwanda
Theogene Habimana
 
Self portrait examples
Self portrait examplesSelf portrait examples
Self portrait examples
Taborboo
 
National georaphic.2011
National georaphic.2011National georaphic.2011
National georaphic.2011
filipj2000
 

Andere mochten auch (10)

Foreign Aid Depedency in Rwanda
Foreign Aid Depedency in RwandaForeign Aid Depedency in Rwanda
Foreign Aid Depedency in Rwanda
 
Comed2009
Comed2009Comed2009
Comed2009
 
Génération connectée - nos 5 valeurs
Génération connectée - nos 5 valeursGénération connectée - nos 5 valeurs
Génération connectée - nos 5 valeurs
 
Atif ppt for islam
Atif ppt for islamAtif ppt for islam
Atif ppt for islam
 
Blog ingles
Blog inglesBlog ingles
Blog ingles
 
Adam Šimek: Optimalizace skrolování, RecyclerView
Adam Šimek: Optimalizace skrolování, RecyclerViewAdam Šimek: Optimalizace skrolování, RecyclerView
Adam Šimek: Optimalizace skrolování, RecyclerView
 
Self portrait examples
Self portrait examplesSelf portrait examples
Self portrait examples
 
Belonging
BelongingBelonging
Belonging
 
Game Idea Pitching Exercise - first round
Game Idea Pitching Exercise - first roundGame Idea Pitching Exercise - first round
Game Idea Pitching Exercise - first round
 
National georaphic.2011
National georaphic.2011National georaphic.2011
National georaphic.2011
 

Ähnlich wie Petr Hamerník: Textová analytika v mobilních aplikacích

Mobile_Internet_Forum_2016_f
Mobile_Internet_Forum_2016_fMobile_Internet_Forum_2016_f
Mobile_Internet_Forum_2016_f
Dalibor Pulkert
 

Ähnlich wie Petr Hamerník: Textová analytika v mobilních aplikacích (20)

Vybrané předměty vyučované KIZI pro studenty informatických oborů FIS VŠE
Vybrané předměty vyučované KIZI pro studenty informatických oborů FIS VŠEVybrané předměty vyučované KIZI pro studenty informatických oborů FIS VŠE
Vybrané předměty vyučované KIZI pro studenty informatických oborů FIS VŠE
 
Ndk
NdkNdk
Ndk
 
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
 
Profiling PHP Applications
Profiling PHP ApplicationsProfiling PHP Applications
Profiling PHP Applications
 
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
 
DEV Čtvrtkon #76 - How to build an evil-free social network: Behind the wheels
DEV Čtvrtkon #76 - How to build an evil-free social network: Behind the wheelsDEV Čtvrtkon #76 - How to build an evil-free social network: Behind the wheels
DEV Čtvrtkon #76 - How to build an evil-free social network: Behind the wheels
 
SEO Restart 2022: Marek Prokop - Analýza klíčových slov v R
SEO Restart 2022: Marek Prokop - Analýza klíčových slov v RSEO Restart 2022: Marek Prokop - Analýza klíčových slov v R
SEO Restart 2022: Marek Prokop - Analýza klíčových slov v R
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoring
 
Obhajoba absolventské práce
Obhajoba absolventské práceObhajoba absolventské práce
Obhajoba absolventské práce
 
Karel Minařík: Do nitra stroje s programovacím jazykem Ruby
Karel Minařík: Do nitra stroje s programovacím jazykem Ruby Karel Minařík: Do nitra stroje s programovacím jazykem Ruby
Karel Minařík: Do nitra stroje s programovacím jazykem Ruby
 
On-line nástroje pro plánování, projektový management a time management + sof...
On-line nástroje pro plánování, projektový management a time management + sof...On-line nástroje pro plánování, projektový management a time management + sof...
On-line nástroje pro plánování, projektový management a time management + sof...
 
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
 
Antiplagiátorské nástroje pro naše repozitáře
Antiplagiátorské nástroje pro naše repozitářeAntiplagiátorské nástroje pro naše repozitáře
Antiplagiátorské nástroje pro naše repozitáře
 
Mobile_Internet_Forum_2016_f
Mobile_Internet_Forum_2016_fMobile_Internet_Forum_2016_f
Mobile_Internet_Forum_2016_f
 
ORM Designer: Speed up your ORM development
ORM Designer: Speed up your ORM developmentORM Designer: Speed up your ORM development
ORM Designer: Speed up your ORM development
 
Product API in MallGroup
Product API in MallGroupProduct API in MallGroup
Product API in MallGroup
 
TNPW2-2012-04
TNPW2-2012-04TNPW2-2012-04
TNPW2-2012-04
 
Co může udělat vaše firma pro open source
Co může udělat vaše firma pro open sourceCo může udělat vaše firma pro open source
Co může udělat vaše firma pro open source
 
TNPW2-2013-04
TNPW2-2013-04TNPW2-2013-04
TNPW2-2013-04
 
AI Restart 2024: Vojtěch Dlouhý - Automatizace komunikace za pomoci konverzač...
AI Restart 2024: Vojtěch Dlouhý - Automatizace komunikace za pomoci konverzač...AI Restart 2024: Vojtěch Dlouhý - Automatizace komunikace za pomoci konverzač...
AI Restart 2024: Vojtěch Dlouhý - Automatizace komunikace za pomoci konverzač...
 

Mehr von mdevtalk

Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve SwiftuJan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
mdevtalk
 
Jarda Machaň: Proč je dobré míti Developer Evangelistu
Jarda Machaň: Proč je dobré míti Developer EvangelistuJarda Machaň: Proč je dobré míti Developer Evangelistu
Jarda Machaň: Proč je dobré míti Developer Evangelistu
mdevtalk
 
Nikita Tuk: Handling background processes in iOS: problems & solutions
Nikita Tuk: Handling background processes in iOS: problems & solutionsNikita Tuk: Handling background processes in iOS: problems & solutions
Nikita Tuk: Handling background processes in iOS: problems & solutions
mdevtalk
 

Mehr von mdevtalk (20)

Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve SwiftuJan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
Jan Čislinský: Seznámení se Sourcery aneb Základy metaprogramování ve Swiftu
 
Jarda Machaň: Proč je dobré míti Developer Evangelistu
Jarda Machaň: Proč je dobré míti Developer EvangelistuJarda Machaň: Proč je dobré míti Developer Evangelistu
Jarda Machaň: Proč je dobré míti Developer Evangelistu
 
Pavel Cvetler: Jeden kód, co vládne všem? Žádný problém pro Android i iOS
Pavel Cvetler: Jeden kód, co vládne všem? Žádný problém pro Android i iOSPavel Cvetler: Jeden kód, co vládne všem? Žádný problém pro Android i iOS
Pavel Cvetler: Jeden kód, co vládne všem? Žádný problém pro Android i iOS
 
Anastasiia Vixentael: 10 things you need to know before implementing cryptogr...
Anastasiia Vixentael: 10 things you need to know before implementing cryptogr...Anastasiia Vixentael: 10 things you need to know before implementing cryptogr...
Anastasiia Vixentael: 10 things you need to know before implementing cryptogr...
 
Michal Havryluk: How To Speed Up Android Gradle Builds
Michal Havryluk: How To Speed Up Android Gradle BuildsMichal Havryluk: How To Speed Up Android Gradle Builds
Michal Havryluk: How To Speed Up Android Gradle Builds
 
Vladislav Iliushin: Dark side of IoT
Vladislav Iliushin: Dark side of IoTVladislav Iliushin: Dark side of IoT
Vladislav Iliushin: Dark side of IoT
 
Georgiy Shur: Bring onboarding to life
Georgiy Shur: Bring onboarding to lifeGeorgiy Shur: Bring onboarding to life
Georgiy Shur: Bring onboarding to life
 
David Bilík: Anko – modern way to build your layouts?
David Bilík: Anko – modern way to build your layouts?David Bilík: Anko – modern way to build your layouts?
David Bilík: Anko – modern way to build your layouts?
 
Maxim Zaks: Deep dive into data serialisation
Maxim Zaks: Deep dive into data serialisationMaxim Zaks: Deep dive into data serialisation
Maxim Zaks: Deep dive into data serialisation
 
Nikita Tuk: Handling background processes in iOS: problems & solutions
Nikita Tuk: Handling background processes in iOS: problems & solutionsNikita Tuk: Handling background processes in iOS: problems & solutions
Nikita Tuk: Handling background processes in iOS: problems & solutions
 
Milan Oulehla: Bezpečnost mobilních aplikací na Androidu
Milan Oulehla: Bezpečnost mobilních aplikací na AndroiduMilan Oulehla: Bezpečnost mobilních aplikací na Androidu
Milan Oulehla: Bezpečnost mobilních aplikací na Androidu
 
Tomáš Kohout: Jak zrychlit iOS vývoj pomocí Swift playgoundů
Tomáš Kohout: Jak zrychlit iOS vývoj pomocí Swift playgoundůTomáš Kohout: Jak zrychlit iOS vývoj pomocí Swift playgoundů
Tomáš Kohout: Jak zrychlit iOS vývoj pomocí Swift playgoundů
 
David Vávra: Firebase + Kotlin + RX + MVP
David Vávra: Firebase + Kotlin + RX + MVPDavid Vávra: Firebase + Kotlin + RX + MVP
David Vávra: Firebase + Kotlin + RX + MVP
 
Paul Lammertsma: Account manager & sync
Paul Lammertsma: Account manager & syncPaul Lammertsma: Account manager & sync
Paul Lammertsma: Account manager & sync
 
Charles Du: Introduction to Mobile UX Design
Charles Du: Introduction to Mobile UX DesignCharles Du: Introduction to Mobile UX Design
Charles Du: Introduction to Mobile UX Design
 
Honza Dvorský: Swift Package Manager
Honza Dvorský: Swift Package ManagerHonza Dvorský: Swift Package Manager
Honza Dvorský: Swift Package Manager
 
David Bureš - Xamarin, IoT a Azure
David Bureš - Xamarin, IoT a AzureDavid Bureš - Xamarin, IoT a Azure
David Bureš - Xamarin, IoT a Azure
 
Dominik Veselý - Vše co jste kdy chtěli vědět o CI a báli jste se zeptat
Dominik Veselý - Vše co jste kdy chtěli vědět o CI a báli jste se zeptatDominik Veselý - Vše co jste kdy chtěli vědět o CI a báli jste se zeptat
Dominik Veselý - Vše co jste kdy chtěli vědět o CI a báli jste se zeptat
 
Jiří Dutkevič: Ochrana citlivých dat v iOS
Jiří Dutkevič: Ochrana citlivých dat v iOSJiří Dutkevič: Ochrana citlivých dat v iOS
Jiří Dutkevič: Ochrana citlivých dat v iOS
 
Petr Dvořák: Push notifikace ve velkém
Petr Dvořák: Push notifikace ve velkémPetr Dvořák: Push notifikace ve velkém
Petr Dvořák: Push notifikace ve velkém
 

Petr Hamerník: Textová analytika v mobilních aplikacích

  • 1.
  • 3. Textová analytika
 v mobilních aplikacích 14.1.2015 FIT ČVUT
  • 4. Témata: 1. Zpracování přirozeného jazyka 2. Geneea REST API a architektura NLP řešení 3. Demo – rychlé zapojení NLP do mobilní aplikace (Android) 4. Co se s tím dá dělat? 4 x 4
  • 5. Témata: 1. Zpracování přirozeného jazyka 2. Geneea REST API a architektura NLP řešení 3. Demo – rychlé zapojení NLP do mobilní aplikace (Android) 4. Co se s tím dá dělat? 4 x 5
  • 6. 1. Zpracování přirozeného jazyka (Natural language processing = NLP) Obor na pomezí lingvistiky a informatiky (umělé inteligence) • Mluvené slovo: rozpoznávání a syntéza řeči • Korektura textu a strojový překlad • Generování textu (NLG – natural language generation) • Extrakce informací z textu 6
  • 7. Extrakce informací z textu 1/3 • Detekce jazyka • Extrakce informací (pojmenovaných entity): • Jména osob • Geografické názvy • Názvy firem • Čísla, částky,… vlastní typy 7
  • 8. 8
  • 9. Extrakce informací z textu – 2/3 Detekce tématu: • Kategorizace • Předem dané kategorie, hierarchie • Štítky • Otevřená množina • Nejsou nutná anotovaná trénovací data Zdroj: idnes.cz 9
  • 10. Extrakce informací z textu 3/3 Analýza sentimentu • Nálada zprávy nebo dokumentu: pozitivní / neutrální / negativní (bipolární) • Kontroverzní oblast • Domenově specifická (“Přečtěte si knížku“ – recenze filmu vs. knihy) 10
  • 11. 11
  • 12. Analýza sentimentu během MS v hokeji 12
  • 13. Sentiment vs. výsledky hráčů 13
  • 14. Extrakce informací z textu – shrnutí • Detekce jazyka • Extrakce pojmenovaných entit – osoby, geografické názvy, firmy, atd. • Detekce tématu – kategorizace nebo štítky • Analýza sentimentu 14
  • 15. Témata: 1. Zpracování přirozeného jazyka 2. Geneea REST API a architektura NLP řešení 3. Demo – rychlé zapojení NLP do mobilní aplikace (Android) 4. Co se s tím dá dělat? 15
  • 16. 2. Geneea Interpretor • NLP platforma • Cloudová služba SaaS (software as a service) • Dostupná a integrovatelná přes REST API • Na adrese: api.geneea.com • Klíč pro přístup zdarma získáte tamtéž 16
  • 17. 17
  • 18. Zapojení REST API – Java 18
  • 19. Zapojení REST API – Python 19
  • 20. Technologie v NLP platformě • Kombinace strojového učení s pravidly • Na některé části lze využít Open source knihovny – TensorFlow, OpenNLP • Anotovaná data • Komponentová architektura Detekce jazyka Lemmatizac e Detekce tématu Analýza sentimentu Analýza sentimentu Lemmatizac e 20 … … …
  • 21. Témata: 1. Zpracování přirozeného jazyka 2. Geneea REST API a architektura NLP řešení 3. Demo – rychlé zapojení NLP do mobilní aplikace (Android) 4. Co se s tím dá dělat? 21
  • 22. 3. Rychlé zapojení NLP přímo do mobilní aplikace (ukázka Android) • Dvě obrazovky – vstup a výstup • Analýza se volá přímo z Androidu 22
  • 23. 23
  • 24. 24
  • 25. Témata: 1. Zpracování přirozeného jazyka 2. Geneea REST API a architektura NLP řešení 3. Demo – rychlé zapojení NLP do mobilní aplikace (Android) 4. Co se s tím dá dělat? 25
  • 26. 4. Co se s tím dá dělat? K čemu je to dobré? Příklady použití (ne nutně v mobilní aplikaci, ale na serverové straně) - inspirace • Štítky k dokumentům – obsah o čem text je, propojování obsahu (Gmail, Evernote, blogy, news) • Helpdesk – kategorizace ticketů, analýza sentimentu, celkový pohled na data, detekce anomálií. • Uživatelské komentáře – obsah (o čem jsou), nálada, produkty na srovnávači cen Všude, kde je text…. 26
  • 27. 4. Proč je to dobré dělat? • Množství nestrukturovaných dat roste • Samozřejmě obrázky a videa, ale textů také dost • Často leží ladem, případně texty čtou lidi • Big picture – celkový přehled 27
  • 28. Exponenciální růst výpočetních technologií, digitalizace a dostupnost informací a rekombinantní inovace … stojí za objevy, které mění science fiction na běžnou součást našeho života… — E. Brynjolfsson, A.McAfee: Druhý věk strojů 28
  • 29. • www.mdevtalk.cz – tato prezentace • www.geneea.com – blog, atd. • api.geneea.com - klíč, dokumentace, příklady • Dnešní Android příklad: https://github.com/Geneea/android-demo • Napište nám, co se vám líbí/nelíbí, co chybí, jak byste to chtěli použít: info@geneea.com @GeneeaAnalytics Děkuji za pozornost. Otázky? 29 Geneea Další zdroje