SlideShare ist ein Scribd-Unternehmen logo
1 von 44
—                 –
Dr. Francesco Colace, Ph.D. – Prof. Massimo De Santo, Ph.D
            fcolace@unisa.it – desanto@unisa.it
                    Osservatorio SNIF
˜ E    dunque, Snif …




˜    http://www.centroict.unisa.it/snif/index


                           Social Case History - Milano
-    Sentiment Analysis: fra mito e leggenda … … c’è
     sempre un computer!
-    Alla ricerca del Sentiment perduto …
-    Come si estrae un sentiment?
-    I principali attori sul mercato
-    Alcuni risultati ottenuti sul campo
-    Una metodologia
-    E il futuro …


                       Social Case History - Milano
Sempre maggiore diffusione dei social network:

•  Generalisti
   •  Twitter
   •  Facebook
   •  Google+

•  Specializzati
   •  Linkedin
   •  Viadeo




                     Social Case History - Milano
Effetto: massiccia e inedita quantità di dati sulle preferenze e
sulle opinioni degli utenti

•  Disponibili in tempo reale
•  Caratterizzati territorialmente
•  Caratterizzati per tipologia di utente

È possibile estrarre informazioni sulle opinioni degli utenti?

Soluzione: Sentiment Analysis



                           Social Case History - Milano
-  Soggettività, cioè, l’espressione da parte di qualcuno,
   attraverso il linguaggio, di:
    -  opinioni
    -  sentimenti
    -  emozioni
    -  convinzioni
    -  valutazioni
    -  speculazioni



                       Social Case History - Milano
Come riconoscere la soggettività in una frase?

-  Subjectivity Analysis: classificare
   “automaticamente” contenuti in “oggettivi” e
   “soggettivi”

  -  Oggettivo: I bought an iPhone a few days ago.
  -  Soggettivo: It is such a nice phone.


                     Social Case History - Milano
Sentiment

   •  Pensiero, punto di vista o atteggiamento basato
      principalmente sulle emozioni invece che sulla ragione

Sentiment Analysis (Opinion Mining)

   •  Tecnica basata su metodologie per il trattamento del
      linguaggio naturale (NLP) per automatizzare
      l’estrazione o la classificazione di “sentiment” da testi
      non strutturati

                        Social Case History - Milano
•  Ha l’obiettivo di identificare l’opinione/sentimento
   che una persona manifesta verso un oggetto, una
   persona o un argomento

•  Analisi di maggior dettaglio rispetto alla subjectivity
   analysis




                       Social Case History - Milano
- Informazioni sulle opinioni del consumatore
        - Product reviews
- Marketing
        - Attitudini del consumatore
        - Trends
- Politica
        - Punto di vista degli elettori su determinati
        argomenti
        - Punto di vista degli elettori sui candidati
- Social
        - Caratterizzare l’orientamento di gruppi di persone

                        Social Case History - Milano
Twitter Political Index




https://election.twitter.com/
http://www.usatoday.com/news/politics/twitter-election-meter
                          Social Case History - Milano
Twitter Political Index




https://election.twitter.com/
http://www.usatoday.com/news/politics/twitter-election-meter
                          Social Case History - Milano
Social Case History - Milano
Social Case History - Milano
Social Case History - Milano
•  Colui che genera il sentimento

•  L’oggetto (o parte di esso) sul quale l’opinione è
   espressa

•  L’opinione




                    Social Case History - Milano
A livello di documento:

-  Obiettivo: classificazione complessiva del sentiment
   contenuto in esso

-  Classi di valutazione: positivo, negativo, e neutrale

-  Assunzione: ogni documento o review si focalizza su
   un singolo oggetto e contiene opinioni da parte di un
   singolo “opinion holder”

                       Social Case History - Milano
A livello di singola frase (o post):

-  Obiettivo_1: identificare le frasi “soggettive”
   contenenti un’opinione

-  Classi: frasi oggettive e soggettive “opinionate”




                        Social Case History - Milano
A livello di singola frase (o post):

-  Obiettivo_2: classificazione del “sentiment” presente
   nelle frasi

-  Classi di valutazione: positivo, negativo e neutro

-  Assunzione: una frase contiene solo un’opinione.



                        Social Case History - Milano
A livello di “feature”:

-  Task_1: Identificare e estrarre “feature” riferite
   all’oggetto che è stato commentato

-  Task_2: Determinare quali fra le “feature” esprimono
   opinioni positive, negative e neutre

-  Task_3: Raggruppare le feature simili in modo da
   poterle identificare in varie review

                          Social Case History - Milano
Descrivendo il “generatore” di opinione:

- Task_1: caratterizzare (se possibile) colui che ha
generato l’opinione attraverso le sue principali
caratteristiche

- Task_2: tracciandone il comportamento




                       Social Case History - Milano
Attori del mercato: NM Incite (nmincite.com)




Caratteristiche
Tipologia: blog reporting
Nielsen and McKinsey & Company

                      Social Case History - Milano
Attori del mercato: Radian6 (http://www.radian6.com/)




Caratteristiche
Tipologia: Reputation monitoring

                       Social Case History - Milano
Attori del mercato: Alterian (http://www.alterian.com/)




Caratteristiche
Tipologia: reputation monitoring

                        Social Case History - Milano
Attori del mercato: Social Mention (http://www.socialmention.com/)




Caratteristiche
Tipologia: Search and Analysis


                           Social Case History - Milano
Attori del mercato: Lithium (http://www.lithium.com/)




Caratteristiche
Tipologia: search-specific mentions and sentiment in social media


                         Social Case History - Milano
Attori del mercato: SentiMetrix (http://www.sentimetrix.com/)




Caratteristiche
Tipologia: Sentiment Analysis Tool

                          Social Case History - Milano
Blog           Reputation        Search         Brand          Sentiment in Social   Search and
          	
  
                    Reporting 	
     Monitoring 	
     Engine	
     Reputation	
           Media	
          Analysis	
  
    NM Incite          SI	
             NO	
            NO	
           NO	
                 NO	
              NO	
  
     Radian6           NO	
             SI	
            NO	
           NO	
                 NO	
              NO	
  
  Addict-O-matic       NO	
             NO	
             SI	
          NO	
                 NO	
              NO	
  
       Alexa           NO	
             NO	
            NO	
            SI	
                NO	
              NO	
  
 Twitter Analyzer      NO	
             NO	
            NO	
           NO	
                 NO	
              NO	
  
  Sentiment140         NO	
             NO	
            NO	
            SI	
                NO	
              NO	
  
       Topsy           NO	
             NO	
            NO	
            SI	
                NO	
              NO	
  
     tweetfeel         NO	
             NO	
            NO	
           NO	
                 SI	
               SI	
  
      twitrratr        NO	
             NO	
            NO	
           NO	
                 SI	
               SI	
  
    Technorati         SI	
             NO	
            NO	
           NO	
                 NO	
              NO	
  
      Alterian         NO	
             SI	
            NO	
           NO	
                 NO	
              NO	
  
  SocialMention        NO	
             NO	
            NO	
           NO	
                 NO	
               SI	
  
   SentiMetrix         NO	
             NO	
            NO	
           NO	
                 SI	
              NO	
  
      Lithium          NO	
             NO	
            NO	
           NO	
                 SI	
               SI	
  
   KissMetrics         NO	
             SI	
            NO	
            SI	
                NO	
              NO	
  
General Sentiment      NO	
             SI	
            NO	
            SI	
                NO	
              NO	
  
    Amplicate          NO	
             NO	
            NO	
            SI	
                NO	
              NO	
  
     Viralheat         NO	
             NO	
            NO	
           NO	
                 SI	
               SI	
  
    MoodMap            NO	
             NO	
            NO	
           NO	
                 SI	
               SI	
  




                                             Social Case History - Milano
Attori del mercato: ViralHeat (https://viralheat.com/)




Caratteristiche
Tipologia: Sentiment Analysis Tool

                        Social Case History - Milano
Una prova sul campo …

Pagina: Samsung Mobile (https://graph.facebook.com/
samsungMobile);
Numero di post analizzati: 10;
Tre Sessioni:
Max. 10 commenti per post;
Max. 50 commenti per post;
Max. 100 commenti per post.


                    Social Case History - Milano
Post 1	
         Post 2	
        Post 3	
        Post 4	
        Post 5	
        Post 6	
        Post 7	
        Post 8	
        Post 9	
        Post 10	
  
	
  
                 #Pos : 4        #Pos : 3        #Pos : 7        #Pos : 8        #Pos : 8        #Pos : 6        #Pos : 6        #Pos : 9        #Pos : 7        #Pos : 4
                 #Neg: 6         #Neg: 4         #Neg: 1         #Neg: 2         #Neg: 2         #Neg: 3         #Neg: 4         #Neg: 0         #Neg: 3         #Neg: 5
                 Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:
                 71,43%          58,30%          62,90%          71,46%          76,61%          70,76%          68,28%          73,73%          66,80%          80,87%
  Session 10	
   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:
                 70,43%          65,97%          82,89%          60,00%          69,87%          84,19%          56,49%          0%              71,93%          69,77%
                 Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:
                 19,32%          20,27%          68,31%          65,30%          62,86%          25,40%          28,90%          100%            36,84%          3,77%
                #Pos : 29        #Pos : 32       #Pos : 31       #Pos : 34       #Pos : 37       #Pos : 26       #Pos : 29       #Pos : 46       #Pos : 36       #Pos : 29
                #Neg: 18         #Neg: 9         #Neg: 15        #Neg: 16        #Neg: 12        #Neg: 21        #Neg: 18        #Neg: 3         #Neg: 11        #Neg: 15
                Avg Prob Pos:    Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:
                70,54%           73,59%          71,50%          71,34%          74,89%          78,40%          69,22%          76,97%          71,01%          73,17%
 Session 50	
   Avg Prob Neg:    Avg ProbNeg:    Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:
                71,63%           68,31%          63,99%          69,34%          73,79%          73,69%          63,13%          57,22%          72,42%          71,01%
                Spread:          Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:
                22,67%           58,59%          39,55%          37,23%          51,56%          13,69%          27,70%          90,75%          52,48%          33,15%
             #Pos : 62           #Pos : 68       #Pos : 64       #Pos : 47       #Pos : 59       #Pos : 61       #Pos : 61       #Pos : 86       #Pos : 48       #Pos : 58
             #Neg: 31            #Neg: 21        #Neg: 31        #Neg: 25        #Neg: 25        #Neg: 35        #Neg: 35        #Neg: 9         #Neg: 17        #Neg: 35
             Avg Prob Pos:       Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:   Avg Prob Pos:
             73,87%              75,42%          71,72%          70,79%          75,15%          75,45%          68,44%          76,08%          73,22%          74,42%
Session 100	
  Avg Prob Neg:     Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:   Avg Prob Neg:
             71,79%              69,20%          68,25%          67,16%          73,80%          73,90%          68,75%          59,55%          74,55%          70,55%
             Spread:             Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:         Spread:
             34,59%              55,84%          36,89%          32,91%          41,23%          28,03%          26,87%          84,85%          46,99%          27,21%


                                                   Positive dominant                      Negative dominant
                                                   mood                                   mood
                                                                      Social Case History - Milano
Post 1 – Session 10:
•  #Pos = 4
•  #Neg = 6
•  AvgProbPos = 0,7143
•  AvgProbNeg = 0,7043

Steps:
1.  #Pos to [0-1]: 0,4; #Neg to [0-1]: 0,6;
2.  (0,4*AvgProbPos) + (0,6*AvgProbNeg)= firstArg +secondArg = weighted sum =
    0,7083;
3.  Positivity à firstArg : x = weighted sum : 1 àx = firstArg/weighted sum = 0,4033
4.  Negativity à secondArg : x = weighted sum : 1 àx = secondArg/weighted sum =
    0,5966
5.  Spread = Positivity – Negativity = -0,1933 à Negativity wins! à absolute spread:
    19,33%


                                   Social Case History - Milano
•  [post: 3/12, comment: 58/100]
     fromid = 100001585959213; likes = 1; text = Samsung phones are the best
phones
     Comment's mood: positive, Probability: 0.60161744842501
•  [post: 4/12, comment: 90/100]
     fromid = 1740090348; likes = 0; text = My galaxy S2 just died. Samsuck
     Comment's mood: negative, Probability: 0.813345405617903
•  [post: 4/12, commento: 83/100]
     fromid = 100002554492722; likes = 0; text = I luuuuuv samsung Galaxyyyyyyyyy
     Comment's mood: negative, Probability: 0.754766406365881
•  [post: 3/12, commento: 55/100]
     fromid = 100002916285610; likes = 1; text = i Love my GALAXY S2 ! IPHONE
SUCKS
     Comment's mood: negative, Probability: 0.856065195331185



                                Social Case History - Milano
•  Bassa precisione degli algoritmi di classificazione

•  Scarsa scalabilità degli algoritmi
   (cento milioni di messaggi solo nei blog personali)

•  Spam (recensioni fasulle)

•  Multilinguismo (lingue differenti dall'inglese)

                       Social Case History - Milano
•  Utilizzo della Latent Dirichlet Allocation (LDA) per
   determinare un mixed Graph of Terms (mGT)

   –  per rappresentare implicitamente il dominio in cui
      si collocano le opinioni degli utenti

   –  per caratterizzare la polarizzazione di insiemi di
      documenti etichettati


                        Social Case History - Milano
•  Il documento è rappresentato come un insieme di
   parole
•  Necessità di sviluppare strategie per determinare le
   parole caratteristiche
•  Utilizzo di dataset molto grandi e incapacità di
   caratterizzare semplicemente la tipologia di dominio
   in cui il commento si colloca
•  Un miglioramento è dato dall’utilizzo di modelli
   probabilistici

                      Social Case History - Milano
Rappresentazione grafiche dei termini maggiormente
occorrenti nel testo e delle loro relazioni

•  Termini
•  Termini Aggregatori
•  Legami proporzionali alla loro mutua occorrenza

I Mixed Graph of Terms vengono ottenuti attraverso
l’applicazione della LDA sui testi


                     Social Case History - Milano
Social Case History - Milano
Tokenizer               Stemming              XML
                                  Module                  Module              Builder


     Training Set
(positive and negative)
                                                                       Documenti
                                                                     in XML format




                      LDA mGT              XML
                       Builder            Builder
                                                                                        Sentiment mGT
                                                                                     (positive and negative)




                                      Social Case History - Milano
Tokenizer                 Stemming                      XML
                           Module                    Module                      Builder
        Post



                                                                               Documento
                                                                             in XML format




                                     Comparator                Classifier

   Sentiment mGT
(positive and negative)
                                                           Classificazione del
                                                               Sentiment



                            Social Case History - Milano
Dataset selezionato: Samsung Forum

n    Per la sperimentazione sono stati costruiti:

      •    Training Set (piccolo grazie a LDA)
            –  50 Commenti positivi
            –  50 Commenti negativi


      •    Test Set
            –  400 Commenti positivi
            –  400 Commenti negativi




                                 Social Case History - Milano
˜  Training Set: 100 Documenti
˜  Test Set: 800 Documenti


                               Positive	
          Negative	
                     Non            Total	
  
                                                                              classificati	
  
       Positive Test set	
       299	
                 96	
                         5	
          400	
  
      Negative Test set	
         33	
                341	
                         3	
          400	
  
      Precision Positive	
                                        0.842	
  
      Precision Negative	
                                        0.780	
  




                                   Social Case History - Milano
•  Ingegnerizzazione del prototipo per sviluppare un
   framework da proporre sul mercato per supportare

  •    Marketing

  •    Campagne Politiche

  •    Sondaggi

  •    Analisi di gruppi sociali



                           Social Case History - Milano
—  La “Sentiment Analysis” rappresenta un settore in grande espansione sia dal
    punto di vista del mercato che da quello di ricerca

—  Il confronto con l’importante mole di dati strutturati e non presenti in rete
    permettono di migliorare le tecniche per la Sentiment Analysis che si basano
    soprattutto su NLP

—  Le tendenze del futuro:

     — Sviluppare sistemi che permettono un’annotazione automatica di un
     documento in accordo alla sua polarità
     — Localizzare gli approcci alle varie lingue
     — Far diventare il web davvero semantico
     — HP indica uno dei temi di ricerca del futuro il “Multimedia Sentiment
     Analysis”


                                 Social Case History - Milano

Weitere ähnliche Inhalte

Ähnlich wie Sentiment Analysis: dietro al web c’è un cuore?

Social media: un possibile planning per la strategia
Social media: un possibile planning per la strategiaSocial media: un possibile planning per la strategia
Social media: un possibile planning per la strategiaMarco Goldin
 
BM_Monitorare i social media in ambito salute_2013
BM_Monitorare i social media in ambito salute_2013BM_Monitorare i social media in ambito salute_2013
BM_Monitorare i social media in ambito salute_2013Me-Source S.r.l./Blogmeter
 
Smau Napoli 2014 Emanuele Mazzi
Smau Napoli 2014 Emanuele MazziSmau Napoli 2014 Emanuele Mazzi
Smau Napoli 2014 Emanuele MazziSMAU
 
Short Workshop Social Communication, Viral e Social Video 20.02.13.
Short Workshop Social Communication, Viral e Social Video 20.02.13.Short Workshop Social Communication, Viral e Social Video 20.02.13.
Short Workshop Social Communication, Viral e Social Video 20.02.13.Giacomo Lancellotti Durazzo
 
Social listening: a cosa serve ascoltare la rete e cosa si può scoprire
Social listening: a cosa serve ascoltare la rete e cosa si può scoprireSocial listening: a cosa serve ascoltare la rete e cosa si può scoprire
Social listening: a cosa serve ascoltare la rete e cosa si può scoprireCentral Marketing Intelligence
 
L'organizzazione "social-driven": i social media a supporto della strategia d...
L'organizzazione "social-driven": i social media a supporto della strategia d...L'organizzazione "social-driven": i social media a supporto della strategia d...
L'organizzazione "social-driven": i social media a supporto della strategia d...Simone Moriconi
 
Il potere delle immagini sui social media. Barison, Luciani, Omero Olimpio
Il potere delle immagini sui social media. Barison, Luciani, Omero OlimpioIl potere delle immagini sui social media. Barison, Luciani, Omero Olimpio
Il potere delle immagini sui social media. Barison, Luciani, Omero OlimpioSerena Omero Olimpio
 
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome..."Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...Luisa
 
Il potere delle immagini nei social media
Il potere delle immagini nei social mediaIl potere delle immagini nei social media
Il potere delle immagini nei social mediaGiorgio Barison
 
Consapevolezza, conversazioni e condi-Visioni
Consapevolezza, conversazioni e condi-Visioni Consapevolezza, conversazioni e condi-Visioni
Consapevolezza, conversazioni e condi-Visioni Silvia Toffolon
 
My Reputation®: il primo servizio italiano che misura la tua identità digitale
My Reputation®: il primo servizio italiano che misura la tua identità digitaleMy Reputation®: il primo servizio italiano che misura la tua identità digitale
My Reputation®: il primo servizio italiano che misura la tua identità digitaleReputation Manager
 
Da Alessandro Sallusti a Joe Bastianich: Il caso My Reputation
Da Alessandro Sallusti a Joe Bastianich: Il caso My ReputationDa Alessandro Sallusti a Joe Bastianich: Il caso My Reputation
Da Alessandro Sallusti a Joe Bastianich: Il caso My ReputationSocial Case History Forum®
 
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...B com Expo | GL events Italia
 
Sentiment analysis SLA/Ice Bucket Challenge
Sentiment analysis SLA/Ice Bucket ChallengeSentiment analysis SLA/Ice Bucket Challenge
Sentiment analysis SLA/Ice Bucket ChallengeTermometro Politico
 
Vincenzo cosenza socialresearch_onlinevs
Vincenzo cosenza socialresearch_onlinevsVincenzo cosenza socialresearch_onlinevs
Vincenzo cosenza socialresearch_onlinevsDigital Accademia
 
Metodologia e potenzialità dei social media
Metodologia e potenzialità dei social mediaMetodologia e potenzialità dei social media
Metodologia e potenzialità dei social mediaEnrico Gualandi
 

Ähnlich wie Sentiment Analysis: dietro al web c’è un cuore? (20)

Social media: un possibile planning per la strategia
Social media: un possibile planning per la strategiaSocial media: un possibile planning per la strategia
Social media: un possibile planning per la strategia
 
BM_Monitorare i social media in ambito salute_2013
BM_Monitorare i social media in ambito salute_2013BM_Monitorare i social media in ambito salute_2013
BM_Monitorare i social media in ambito salute_2013
 
Smau Napoli 2014 Emanuele Mazzi
Smau Napoli 2014 Emanuele MazziSmau Napoli 2014 Emanuele Mazzi
Smau Napoli 2014 Emanuele Mazzi
 
Short Workshop Social Communication, Viral e Social Video 20.02.13.
Short Workshop Social Communication, Viral e Social Video 20.02.13.Short Workshop Social Communication, Viral e Social Video 20.02.13.
Short Workshop Social Communication, Viral e Social Video 20.02.13.
 
Social listening: a cosa serve ascoltare la rete e cosa si può scoprire
Social listening: a cosa serve ascoltare la rete e cosa si può scoprireSocial listening: a cosa serve ascoltare la rete e cosa si può scoprire
Social listening: a cosa serve ascoltare la rete e cosa si può scoprire
 
Seminario Franco Tuveri e Manuela Angioni, 06-09-2012
Seminario Franco Tuveri e Manuela Angioni, 06-09-2012Seminario Franco Tuveri e Manuela Angioni, 06-09-2012
Seminario Franco Tuveri e Manuela Angioni, 06-09-2012
 
Geo emozioni
Geo emozioniGeo emozioni
Geo emozioni
 
Marzano terni 18 sett2015_fm_trovarelavoro
Marzano terni 18 sett2015_fm_trovarelavoroMarzano terni 18 sett2015_fm_trovarelavoro
Marzano terni 18 sett2015_fm_trovarelavoro
 
L'organizzazione "social-driven": i social media a supporto della strategia d...
L'organizzazione "social-driven": i social media a supporto della strategia d...L'organizzazione "social-driven": i social media a supporto della strategia d...
L'organizzazione "social-driven": i social media a supporto della strategia d...
 
Il potere delle immagini sui social media. Barison, Luciani, Omero Olimpio
Il potere delle immagini sui social media. Barison, Luciani, Omero OlimpioIl potere delle immagini sui social media. Barison, Luciani, Omero Olimpio
Il potere delle immagini sui social media. Barison, Luciani, Omero Olimpio
 
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome..."Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...
"Il potere delle immagini nei social media" di G. Barison, L. Luciani, S. Ome...
 
Il potere delle immagini nei social media
Il potere delle immagini nei social mediaIl potere delle immagini nei social media
Il potere delle immagini nei social media
 
Consapevolezza, conversazioni e condi-Visioni
Consapevolezza, conversazioni e condi-Visioni Consapevolezza, conversazioni e condi-Visioni
Consapevolezza, conversazioni e condi-Visioni
 
My Reputation®: il primo servizio italiano che misura la tua identità digitale
My Reputation®: il primo servizio italiano che misura la tua identità digitaleMy Reputation®: il primo servizio italiano che misura la tua identità digitale
My Reputation®: il primo servizio italiano che misura la tua identità digitale
 
Into The Wild_Lorenzo Fresh
Into The Wild_Lorenzo FreshInto The Wild_Lorenzo Fresh
Into The Wild_Lorenzo Fresh
 
Da Alessandro Sallusti a Joe Bastianich: Il caso My Reputation
Da Alessandro Sallusti a Joe Bastianich: Il caso My ReputationDa Alessandro Sallusti a Joe Bastianich: Il caso My Reputation
Da Alessandro Sallusti a Joe Bastianich: Il caso My Reputation
 
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...
B com 2014 | I territori online, ruolo ed aspettative da parte degli utenti_S...
 
Sentiment analysis SLA/Ice Bucket Challenge
Sentiment analysis SLA/Ice Bucket ChallengeSentiment analysis SLA/Ice Bucket Challenge
Sentiment analysis SLA/Ice Bucket Challenge
 
Vincenzo cosenza socialresearch_onlinevs
Vincenzo cosenza socialresearch_onlinevsVincenzo cosenza socialresearch_onlinevs
Vincenzo cosenza socialresearch_onlinevs
 
Metodologia e potenzialità dei social media
Metodologia e potenzialità dei social mediaMetodologia e potenzialità dei social media
Metodologia e potenzialità dei social media
 

Mehr von Social Case History Forum®

SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...
SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...
SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...Social Case History Forum®
 
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...Social Case History Forum®
 
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 mese
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 meseSCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 mese
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 meseSocial Case History Forum®
 
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’ottica
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’otticaSCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’ottica
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’otticaSocial Case History Forum®
 
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...Social Case History Forum®
 
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...Social Case History Forum®
 
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social media
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social mediaSCHF16 Pietro Ferrante: la community diventa una crew grazie ai social media
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social mediaSocial Case History Forum®
 
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOOD
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOODSCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOOD
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOODSocial Case History Forum®
 
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...Social Case History Forum®
 
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadio
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadioSCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadio
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadioSocial Case History Forum®
 
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...Social Case History Forum®
 
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15Social Case History Forum®
 
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15Social Case History Forum®
 
Radio 105: quando il digital è “RadioFriendly” - #schf15
Radio 105: quando il digital è “RadioFriendly” - #schf15Radio 105: quando il digital è “RadioFriendly” - #schf15
Radio 105: quando il digital è “RadioFriendly” - #schf15Social Case History Forum®
 
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...Social Case History Forum®
 
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...Social Case History Forum®
 
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...Social Case History Forum®
 
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...Social Case History Forum®
 
Quando un’azienda B2B si mette in gioco sui social: la social case history di...
Quando un’azienda B2B si mette in gioco sui social: la social case history di...Quando un’azienda B2B si mette in gioco sui social: la social case history di...
Quando un’azienda B2B si mette in gioco sui social: la social case history di...Social Case History Forum®
 
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...Social Case History Forum®
 

Mehr von Social Case History Forum® (20)

SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...
SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...
SCHF16 #DigitaLogico: dagli strumenti alle emozioni. Il caso Ecologica Navigl...
 
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...
SCHF16 Social Automation: come TalentGarden ha generato lead qualificati inte...
 
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 mese
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 meseSCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 mese
SCHF16 #FiandreCheSorpresa: VisitFlanders diventa virale in 1 mese
 
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’ottica
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’otticaSCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’ottica
SCHF16 Optovista e Ottica Bergamini, social b2b e b2c per il mercato dell’ottica
 
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...
SCHF16 Radio Italia Friends: costruire una relazione diretta con i propri fan...
 
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...
SCHF16 I Wonder Pictures – Dio esiste e vive a Bruxelles – E se potessi scriv...
 
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social media
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social mediaSCHF16 Pietro Ferrante: la community diventa una crew grazie ai social media
SCHF16 Pietro Ferrante: la community diventa una crew grazie ai social media
 
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOOD
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOODSCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOOD
SCHF16 Your Brand Camp e l’InflUTILITY in azione: il caso POLLI SOCIAL FOOD
 
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...
SCHF16 Socialindex – Come valutare in modo efficace gli influencer e misurarn...
 
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadio
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadioSCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadio
SCHF16 Dalla radio a Facebook live: ha senso andare in onda? Il caso OkRadio
 
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...
SCHF16 Tecniche di Remarketing avanzato a favore degli eventi: il caso SAS An...
 
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15
Dalle Digital PR alla vera Advocacy: il caso di Dyson Italia - #schf15
 
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15
Essefin & Ventorosso S.p.a: quando la strategia batte lo strumento - #schf15
 
Radio 105: quando il digital è “RadioFriendly” - #schf15
Radio 105: quando il digital è “RadioFriendly” - #schf15Radio 105: quando il digital è “RadioFriendly” - #schf15
Radio 105: quando il digital è “RadioFriendly” - #schf15
 
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...
OkRadio e l’intrattenimento in diretta tramite la radiovisione e i social - #...
 
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...
60milioni di visualizzazioni, 2 milioni di visite al sito, 700 lead, gratis: ...
 
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...
Photoskine: analisi dei punti d’incontro tra la Fotografia e le Aziende nei s...
 
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...
Nestle Fitness Cereali: il coinvolgimento dei publisher nel digital media mix...
 
Quando un’azienda B2B si mette in gioco sui social: la social case history di...
Quando un’azienda B2B si mette in gioco sui social: la social case history di...Quando un’azienda B2B si mette in gioco sui social: la social case history di...
Quando un’azienda B2B si mette in gioco sui social: la social case history di...
 
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...
Come Tomappo ha aumentato del 400% i download della sua app grazie ad un foto...
 

Sentiment Analysis: dietro al web c’è un cuore?

  • 1. — – Dr. Francesco Colace, Ph.D. – Prof. Massimo De Santo, Ph.D fcolace@unisa.it – desanto@unisa.it Osservatorio SNIF
  • 2. ˜ E dunque, Snif … ˜  http://www.centroict.unisa.it/snif/index Social Case History - Milano
  • 3. -  Sentiment Analysis: fra mito e leggenda … … c’è sempre un computer! -  Alla ricerca del Sentiment perduto … -  Come si estrae un sentiment? -  I principali attori sul mercato -  Alcuni risultati ottenuti sul campo -  Una metodologia -  E il futuro … Social Case History - Milano
  • 4. Sempre maggiore diffusione dei social network: •  Generalisti •  Twitter •  Facebook •  Google+ •  Specializzati •  Linkedin •  Viadeo Social Case History - Milano
  • 5. Effetto: massiccia e inedita quantità di dati sulle preferenze e sulle opinioni degli utenti •  Disponibili in tempo reale •  Caratterizzati territorialmente •  Caratterizzati per tipologia di utente È possibile estrarre informazioni sulle opinioni degli utenti? Soluzione: Sentiment Analysis Social Case History - Milano
  • 6. -  Soggettività, cioè, l’espressione da parte di qualcuno, attraverso il linguaggio, di: -  opinioni -  sentimenti -  emozioni -  convinzioni -  valutazioni -  speculazioni Social Case History - Milano
  • 7. Come riconoscere la soggettività in una frase? -  Subjectivity Analysis: classificare “automaticamente” contenuti in “oggettivi” e “soggettivi” -  Oggettivo: I bought an iPhone a few days ago. -  Soggettivo: It is such a nice phone. Social Case History - Milano
  • 8. Sentiment •  Pensiero, punto di vista o atteggiamento basato principalmente sulle emozioni invece che sulla ragione Sentiment Analysis (Opinion Mining) •  Tecnica basata su metodologie per il trattamento del linguaggio naturale (NLP) per automatizzare l’estrazione o la classificazione di “sentiment” da testi non strutturati Social Case History - Milano
  • 9. •  Ha l’obiettivo di identificare l’opinione/sentimento che una persona manifesta verso un oggetto, una persona o un argomento •  Analisi di maggior dettaglio rispetto alla subjectivity analysis Social Case History - Milano
  • 10. - Informazioni sulle opinioni del consumatore - Product reviews - Marketing - Attitudini del consumatore - Trends - Politica - Punto di vista degli elettori su determinati argomenti - Punto di vista degli elettori sui candidati - Social - Caratterizzare l’orientamento di gruppi di persone Social Case History - Milano
  • 16. •  Colui che genera il sentimento •  L’oggetto (o parte di esso) sul quale l’opinione è espressa •  L’opinione Social Case History - Milano
  • 17. A livello di documento: -  Obiettivo: classificazione complessiva del sentiment contenuto in esso -  Classi di valutazione: positivo, negativo, e neutrale -  Assunzione: ogni documento o review si focalizza su un singolo oggetto e contiene opinioni da parte di un singolo “opinion holder” Social Case History - Milano
  • 18. A livello di singola frase (o post): -  Obiettivo_1: identificare le frasi “soggettive” contenenti un’opinione -  Classi: frasi oggettive e soggettive “opinionate” Social Case History - Milano
  • 19. A livello di singola frase (o post): -  Obiettivo_2: classificazione del “sentiment” presente nelle frasi -  Classi di valutazione: positivo, negativo e neutro -  Assunzione: una frase contiene solo un’opinione. Social Case History - Milano
  • 20. A livello di “feature”: -  Task_1: Identificare e estrarre “feature” riferite all’oggetto che è stato commentato -  Task_2: Determinare quali fra le “feature” esprimono opinioni positive, negative e neutre -  Task_3: Raggruppare le feature simili in modo da poterle identificare in varie review Social Case History - Milano
  • 21. Descrivendo il “generatore” di opinione: - Task_1: caratterizzare (se possibile) colui che ha generato l’opinione attraverso le sue principali caratteristiche - Task_2: tracciandone il comportamento Social Case History - Milano
  • 22. Attori del mercato: NM Incite (nmincite.com) Caratteristiche Tipologia: blog reporting Nielsen and McKinsey & Company Social Case History - Milano
  • 23. Attori del mercato: Radian6 (http://www.radian6.com/) Caratteristiche Tipologia: Reputation monitoring Social Case History - Milano
  • 24. Attori del mercato: Alterian (http://www.alterian.com/) Caratteristiche Tipologia: reputation monitoring Social Case History - Milano
  • 25. Attori del mercato: Social Mention (http://www.socialmention.com/) Caratteristiche Tipologia: Search and Analysis Social Case History - Milano
  • 26. Attori del mercato: Lithium (http://www.lithium.com/) Caratteristiche Tipologia: search-specific mentions and sentiment in social media Social Case History - Milano
  • 27. Attori del mercato: SentiMetrix (http://www.sentimetrix.com/) Caratteristiche Tipologia: Sentiment Analysis Tool Social Case History - Milano
  • 28. Blog Reputation Search Brand Sentiment in Social Search and     Reporting   Monitoring   Engine   Reputation   Media   Analysis   NM Incite SI   NO   NO   NO   NO   NO   Radian6 NO   SI   NO   NO   NO   NO   Addict-O-matic NO   NO   SI   NO   NO   NO   Alexa NO   NO   NO   SI   NO   NO   Twitter Analyzer NO   NO   NO   NO   NO   NO   Sentiment140 NO   NO   NO   SI   NO   NO   Topsy NO   NO   NO   SI   NO   NO   tweetfeel NO   NO   NO   NO   SI   SI   twitrratr NO   NO   NO   NO   SI   SI   Technorati SI   NO   NO   NO   NO   NO   Alterian NO   SI   NO   NO   NO   NO   SocialMention NO   NO   NO   NO   NO   SI   SentiMetrix NO   NO   NO   NO   SI   NO   Lithium NO   NO   NO   NO   SI   SI   KissMetrics NO   SI   NO   SI   NO   NO   General Sentiment NO   SI   NO   SI   NO   NO   Amplicate NO   NO   NO   SI   NO   NO   Viralheat NO   NO   NO   NO   SI   SI   MoodMap NO   NO   NO   NO   SI   SI   Social Case History - Milano
  • 29. Attori del mercato: ViralHeat (https://viralheat.com/) Caratteristiche Tipologia: Sentiment Analysis Tool Social Case History - Milano
  • 30. Una prova sul campo … Pagina: Samsung Mobile (https://graph.facebook.com/ samsungMobile); Numero di post analizzati: 10; Tre Sessioni: Max. 10 commenti per post; Max. 50 commenti per post; Max. 100 commenti per post. Social Case History - Milano
  • 31. Post 1   Post 2   Post 3   Post 4   Post 5   Post 6   Post 7   Post 8   Post 9   Post 10     #Pos : 4 #Pos : 3 #Pos : 7 #Pos : 8 #Pos : 8 #Pos : 6 #Pos : 6 #Pos : 9 #Pos : 7 #Pos : 4 #Neg: 6 #Neg: 4 #Neg: 1 #Neg: 2 #Neg: 2 #Neg: 3 #Neg: 4 #Neg: 0 #Neg: 3 #Neg: 5 Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: 71,43% 58,30% 62,90% 71,46% 76,61% 70,76% 68,28% 73,73% 66,80% 80,87% Session 10   Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: 70,43% 65,97% 82,89% 60,00% 69,87% 84,19% 56,49% 0% 71,93% 69,77% Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: 19,32% 20,27% 68,31% 65,30% 62,86% 25,40% 28,90% 100% 36,84% 3,77% #Pos : 29 #Pos : 32 #Pos : 31 #Pos : 34 #Pos : 37 #Pos : 26 #Pos : 29 #Pos : 46 #Pos : 36 #Pos : 29 #Neg: 18 #Neg: 9 #Neg: 15 #Neg: 16 #Neg: 12 #Neg: 21 #Neg: 18 #Neg: 3 #Neg: 11 #Neg: 15 Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: 70,54% 73,59% 71,50% 71,34% 74,89% 78,40% 69,22% 76,97% 71,01% 73,17% Session 50   Avg Prob Neg: Avg ProbNeg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: 71,63% 68,31% 63,99% 69,34% 73,79% 73,69% 63,13% 57,22% 72,42% 71,01% Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: 22,67% 58,59% 39,55% 37,23% 51,56% 13,69% 27,70% 90,75% 52,48% 33,15% #Pos : 62 #Pos : 68 #Pos : 64 #Pos : 47 #Pos : 59 #Pos : 61 #Pos : 61 #Pos : 86 #Pos : 48 #Pos : 58 #Neg: 31 #Neg: 21 #Neg: 31 #Neg: 25 #Neg: 25 #Neg: 35 #Neg: 35 #Neg: 9 #Neg: 17 #Neg: 35 Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: Avg Prob Pos: 73,87% 75,42% 71,72% 70,79% 75,15% 75,45% 68,44% 76,08% 73,22% 74,42% Session 100  Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: Avg Prob Neg: 71,79% 69,20% 68,25% 67,16% 73,80% 73,90% 68,75% 59,55% 74,55% 70,55% Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: Spread: 34,59% 55,84% 36,89% 32,91% 41,23% 28,03% 26,87% 84,85% 46,99% 27,21% Positive dominant Negative dominant mood mood Social Case History - Milano
  • 32. Post 1 – Session 10: •  #Pos = 4 •  #Neg = 6 •  AvgProbPos = 0,7143 •  AvgProbNeg = 0,7043 Steps: 1.  #Pos to [0-1]: 0,4; #Neg to [0-1]: 0,6; 2.  (0,4*AvgProbPos) + (0,6*AvgProbNeg)= firstArg +secondArg = weighted sum = 0,7083; 3.  Positivity à firstArg : x = weighted sum : 1 àx = firstArg/weighted sum = 0,4033 4.  Negativity à secondArg : x = weighted sum : 1 àx = secondArg/weighted sum = 0,5966 5.  Spread = Positivity – Negativity = -0,1933 à Negativity wins! à absolute spread: 19,33% Social Case History - Milano
  • 33. •  [post: 3/12, comment: 58/100] fromid = 100001585959213; likes = 1; text = Samsung phones are the best phones Comment's mood: positive, Probability: 0.60161744842501 •  [post: 4/12, comment: 90/100] fromid = 1740090348; likes = 0; text = My galaxy S2 just died. Samsuck Comment's mood: negative, Probability: 0.813345405617903 •  [post: 4/12, commento: 83/100] fromid = 100002554492722; likes = 0; text = I luuuuuv samsung Galaxyyyyyyyyy Comment's mood: negative, Probability: 0.754766406365881 •  [post: 3/12, commento: 55/100] fromid = 100002916285610; likes = 1; text = i Love my GALAXY S2 ! IPHONE SUCKS Comment's mood: negative, Probability: 0.856065195331185 Social Case History - Milano
  • 34. •  Bassa precisione degli algoritmi di classificazione •  Scarsa scalabilità degli algoritmi (cento milioni di messaggi solo nei blog personali) •  Spam (recensioni fasulle) •  Multilinguismo (lingue differenti dall'inglese) Social Case History - Milano
  • 35. •  Utilizzo della Latent Dirichlet Allocation (LDA) per determinare un mixed Graph of Terms (mGT) –  per rappresentare implicitamente il dominio in cui si collocano le opinioni degli utenti –  per caratterizzare la polarizzazione di insiemi di documenti etichettati Social Case History - Milano
  • 36. •  Il documento è rappresentato come un insieme di parole •  Necessità di sviluppare strategie per determinare le parole caratteristiche •  Utilizzo di dataset molto grandi e incapacità di caratterizzare semplicemente la tipologia di dominio in cui il commento si colloca •  Un miglioramento è dato dall’utilizzo di modelli probabilistici Social Case History - Milano
  • 37. Rappresentazione grafiche dei termini maggiormente occorrenti nel testo e delle loro relazioni •  Termini •  Termini Aggregatori •  Legami proporzionali alla loro mutua occorrenza I Mixed Graph of Terms vengono ottenuti attraverso l’applicazione della LDA sui testi Social Case History - Milano
  • 39. Tokenizer Stemming XML Module Module Builder Training Set (positive and negative) Documenti in XML format LDA mGT XML Builder Builder Sentiment mGT (positive and negative) Social Case History - Milano
  • 40. Tokenizer Stemming XML Module Module Builder Post Documento in XML format Comparator Classifier Sentiment mGT (positive and negative) Classificazione del Sentiment Social Case History - Milano
  • 41. Dataset selezionato: Samsung Forum n  Per la sperimentazione sono stati costruiti: •  Training Set (piccolo grazie a LDA) –  50 Commenti positivi –  50 Commenti negativi •  Test Set –  400 Commenti positivi –  400 Commenti negativi Social Case History - Milano
  • 42. ˜  Training Set: 100 Documenti ˜  Test Set: 800 Documenti Positive   Negative   Non Total   classificati   Positive Test set   299   96   5   400   Negative Test set   33   341   3   400   Precision Positive   0.842   Precision Negative   0.780   Social Case History - Milano
  • 43. •  Ingegnerizzazione del prototipo per sviluppare un framework da proporre sul mercato per supportare •  Marketing •  Campagne Politiche •  Sondaggi •  Analisi di gruppi sociali Social Case History - Milano
  • 44. —  La “Sentiment Analysis” rappresenta un settore in grande espansione sia dal punto di vista del mercato che da quello di ricerca —  Il confronto con l’importante mole di dati strutturati e non presenti in rete permettono di migliorare le tecniche per la Sentiment Analysis che si basano soprattutto su NLP —  Le tendenze del futuro: — Sviluppare sistemi che permettono un’annotazione automatica di un documento in accordo alla sua polarità — Localizzare gli approcci alle varie lingue — Far diventare il web davvero semantico — HP indica uno dei temi di ricerca del futuro il “Multimedia Sentiment Analysis” Social Case History - Milano