SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
L'intelligenza collettiva per
 organizzare la conoscenza
            sul Web


          Federico Cairo
      7° Nexa Lunch Seminar
Politecnico di Torino – 23/01/2013
Il concetto di intelligenza collettiva
nasce nell’ambito della biologia per
    descrivere il comportamento di
alcune specie animali (come le api e
le formiche) che agiscono in gruppo
   come un unico superorganismo.
In sociologia è stato affrontato da
 diversi autori come Douglas Engelbart
  (1945), Pierre Lévy (1994) e Howard
  Bloom (1995), ma è divenuto noto al
  grande pubblico grazie all’opera del
giornalista americano James Surowiecki
    “The Wisdom of Crowds” (2004).
Surowiecki racconta un esempio
  di intelligenza collettiva che fu
rilevato nel 1906 dallo scienziato
inglese Francis Galton durante la
fiera contadina di Plymouth, nel
        sud dell’Inghilterra.
Nel suo testo “Reinventing
    Discovery: The New Era of
  Networked Science”, il fisico
canadese Michael Nielsen indaga
    come gli strumenti online
possano amplificare l’intelligenza
collettiva per favorire la scoperta
            scientifica.
Nel 1999 Garry Kasparov affronta “il
resto del mondo” in una partita a scacchi
   online organizzata da Microsoft. Per
     Nielsen è un esempio di come gli
 strumenti collaborativi online possano
 attivare meccanismi di problem solving
   inarrivabili per il singolo individuo.
Wikipedia è la più grande
enciclopedia digitale del mondo.
Contiene più di 23 milioni di voci
     scritte in 275 lingue. È
  interamente gestita da una
comunità di utenti e può essere
   modificata e arricchita da
chiunque abbia accesso al Web.
Per quanto superficiali o incomplete possano
     apparire le voci di Wikipedia ai suoi
 detrattori, esse sono il frutto di un “accordo
    semantico” degli utenti di Internet che
attribuisce ad ogni voce un concetto univoco.
  Wikipedia ha vinto una sorta di selezione
 naturale che l’ha portata ad essere usata di
fatto come ontologia di riferimento sul Web.
Wikipedia condivide il sistema di valori del
movimento FOSS (Free and Open Source
 Software) di cui Jimmy Wales è stato fin
dall’inizio un sostenitore. “Given enough
   eyeballs, all bugs are shallow” (Eric
Raymond, The Cathedral and the Bazaar),
   questa fiducia è il presupposto della
       collaborazione in Wikipedia.
DBpedia, la trasposizione in
formato Linked Data dei contenuti
  di Wikipedia, costituisce oggi il
nodo principale del Web dei Dati. I
Linked Data publisher connettono
 sempre più spesso i propri nodi a
  quelli di DBpedia, rendendola il
  fulcro di interconnessione tra i
dataset pubblicati nello spazio del
          Web Semantico.
Il sovraccarico cognitivo, meglio
  conosciuto come information
  overload, si verifica quando si
  ricevono troppe informazioni
    per riuscire a prendere una
    decisione o sceglierne una
 specifica sulla quale focalizzare
l'attenzione. (fonte: Wikipedia)
I Linked Open Data possono
   contribuire efficacemente a
    contrastare il problema del
sovraccarico informativo. Questo
aspetto del Web Semantico viene
 indagato da David Weinberger
  nel capitolo 9 della sua ultimo
saggio “Too big to know” (2011).
Una strategia per contrastare il sovraccarico
   informativo è aggiungere informazione
all’informazione. I LOD possono metadatare
i contenuti del Web attraverso concetti non
     ambigui rappresentati da URI. Se gli
      argomenti di una pagina Web sono
identificati attraverso URI, anziché semplici
 tag, si elimina l’ambiguità delle parole e si
 migliora la precisione dei motori di ricerca.
Essendo DBpedia collegata a un vasto
 "corpus" multilingue preannotato di
 carattere enciclopedico (Wikipedia),
risulta tecnicamente molto adatta ad
 essere utilizzata per procedimenti di
natural language processing e di text
mining, finalizzati alla classificazione
 automatica dei documenti sul Web.
I software che utilizzano Wikipedia e
         DBpedia per l'estrazione e
  l'arricchimento dei contenuti sul Web,
       come per esempio TellMeFirst
(tellmefirst.polito.it), fanno appunto leva
sull’intelligenza collettiva delle comunità
  online, mostrandone le potenzialità e i
      benefici per gli utenti di Internet.
TellMeFirst è uno strumento per la
  classificazione e l'arricchimento dei
documenti testuali tramite Linked Open
Data. Sfrutta le tecnologie del Semantic
 Web e del NLP per estrarre dai testi gli
argomenti principali in forma di risorse
     DBpedia e arricchirli con nuove
informazioni e contenuti recuperati dal
 Web (immagini, video, mappe, news).
Demo!
Quest'opera è distribuita con licenza Creative Commons
Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 Italia.



                   Grazie per l’attenzione!

                     Federico Cairo
                 federico.cairo@polito.it
           Politecnico di Torino – 23/01/2013

Weitere ähnliche Inhalte

Was ist angesagt?

Corso Chieti Pescara2
Corso Chieti Pescara2Corso Chieti Pescara2
Corso Chieti Pescara2tittiono
 
Introduzione alla biblioteca digitale
Introduzione alla biblioteca digitaleIntroduzione alla biblioteca digitale
Introduzione alla biblioteca digitaleaccessoinformazione
 
Mich internet e il web miti e dati
Mich internet e il web miti e datiMich internet e il web miti e dati
Mich internet e il web miti e datiLuisa Mich
 
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...Quali literacy al tempo dei social network? Slides presentate al Convegno "La...
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...Laura Testoni
 
Introduzione biblioteca digitale
Introduzione biblioteca digitaleIntroduzione biblioteca digitale
Introduzione biblioteca digitaleAnna Maria Tammaro
 
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarla
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarlaL’Europa digitale: come le biblioteche di ricerca vogliono realizzarla
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarlaWouter Schallier
 
Venezia Biblioteche e Digital Humanities 28/10/2013
Venezia Biblioteche e Digital Humanities 28/10/2013Venezia Biblioteche e Digital Humanities 28/10/2013
Venezia Biblioteche e Digital Humanities 28/10/2013Giovanni Colavizza
 

Was ist angesagt? (10)

Biblioteca digitale
Biblioteca digitaleBiblioteca digitale
Biblioteca digitale
 
Corso Chieti Pescara2
Corso Chieti Pescara2Corso Chieti Pescara2
Corso Chieti Pescara2
 
Introduzione alla biblioteca digitale
Introduzione alla biblioteca digitaleIntroduzione alla biblioteca digitale
Introduzione alla biblioteca digitale
 
Mich internet e il web miti e dati
Mich internet e il web miti e datiMich internet e il web miti e dati
Mich internet e il web miti e dati
 
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...Quali literacy al tempo dei social network? Slides presentate al Convegno "La...
Quali literacy al tempo dei social network? Slides presentate al Convegno "La...
 
Introduzione biblioteca digitale
Introduzione biblioteca digitaleIntroduzione biblioteca digitale
Introduzione biblioteca digitale
 
3. La biblioteca digitale
3. La biblioteca digitale3. La biblioteca digitale
3. La biblioteca digitale
 
La biblioteca fuori di sè
La biblioteca fuori di sèLa biblioteca fuori di sè
La biblioteca fuori di sè
 
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarla
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarlaL’Europa digitale: come le biblioteche di ricerca vogliono realizzarla
L’Europa digitale: come le biblioteche di ricerca vogliono realizzarla
 
Venezia Biblioteche e Digital Humanities 28/10/2013
Venezia Biblioteche e Digital Humanities 28/10/2013Venezia Biblioteche e Digital Humanities 28/10/2013
Venezia Biblioteche e Digital Humanities 28/10/2013
 

Ähnlich wie Federico Cairo - L'intelligenza collettiva per organizzare la conoscenza sul Web

La Semantica e il Web dei Dati
La Semantica e il Web dei DatiLa Semantica e il Web dei Dati
La Semantica e il Web dei DatiIrene Celino
 
Dalle risorse aperte all'edupunk
Dalle risorse aperte all'edupunkDalle risorse aperte all'edupunk
Dalle risorse aperte all'edupunkGiovanni Leccisotti
 
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapere
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapereINTERNET vs BIBLIOTECA - Orientare / Organizzare il sapere
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapereLittleIris
 
201203021 comphumanities 2012
201203021 comphumanities 2012201203021 comphumanities 2012
201203021 comphumanities 2012Stefano Lariccia
 
Digilab march 20100315 progetti comphumanities lariccia
Digilab  march 20100315 progetti comphumanities   laricciaDigilab  march 20100315 progetti comphumanities   lariccia
Digilab march 20100315 progetti comphumanities laricciaStefano Lariccia
 
Spring Event - Web 2.0 @ your Library
Spring Event - Web 2.0 @ your LibrarySpring Event - Web 2.0 @ your Library
Spring Event - Web 2.0 @ your LibraryInfoAmerica Rome
 
201304011 comphumanities 2013
201304011 comphumanities 2013201304011 comphumanities 2013
201304011 comphumanities 2013Stefano Lariccia
 
CONVEGNO - EBA FORUM 2008
CONVEGNO - EBA FORUM 2008CONVEGNO - EBA FORUM 2008
CONVEGNO - EBA FORUM 2008Claudio Pasqua
 
Enterprise 2 0 - una introduzione
Enterprise 2 0 - una introduzioneEnterprise 2 0 - una introduzione
Enterprise 2 0 - una introduzioneStefano Epifani
 
web 2.0 quinta parte
web 2.0 quinta parteweb 2.0 quinta parte
web 2.0 quinta parteAngelo Panini
 
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)201203021 comphumanities 2012 lm (editing e analisi del documento digitale)
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)Stefano Lariccia
 
201203021 comphumanities 2012
201203021 comphumanities 2012201203021 comphumanities 2012
201203021 comphumanities 2012Stefano Lariccia
 
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitari
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitariOpen data in sanita' - Master Funzioni Direttive Gestione servizi sanitari
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitariUSAC Program
 

Ähnlich wie Federico Cairo - L'intelligenza collettiva per organizzare la conoscenza sul Web (20)

Web 2.0
Web 2.0Web 2.0
Web 2.0
 
Machina impresa 1. Social web
Machina impresa 1. Social webMachina impresa 1. Social web
Machina impresa 1. Social web
 
La Semantica e il Web dei Dati
La Semantica e il Web dei DatiLa Semantica e il Web dei Dati
La Semantica e il Web dei Dati
 
Dalle risorse aperte all'edupunk
Dalle risorse aperte all'edupunkDalle risorse aperte all'edupunk
Dalle risorse aperte all'edupunk
 
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapere
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapereINTERNET vs BIBLIOTECA - Orientare / Organizzare il sapere
INTERNET vs BIBLIOTECA - Orientare / Organizzare il sapere
 
201203021 comphumanities 2012
201203021 comphumanities 2012201203021 comphumanities 2012
201203021 comphumanities 2012
 
Digilab march 20100315 progetti comphumanities lariccia
Digilab  march 20100315 progetti comphumanities   laricciaDigilab  march 20100315 progetti comphumanities   lariccia
Digilab march 20100315 progetti comphumanities lariccia
 
Spring Event - Web 2.0 @ your Library
Spring Event - Web 2.0 @ your LibrarySpring Event - Web 2.0 @ your Library
Spring Event - Web 2.0 @ your Library
 
Caratteristiche web 2.0
Caratteristiche web 2.0Caratteristiche web 2.0
Caratteristiche web 2.0
 
201304011 comphumanities 2013
201304011 comphumanities 2013201304011 comphumanities 2013
201304011 comphumanities 2013
 
Social Software
Social SoftwareSocial Software
Social Software
 
CONVEGNO - EBA FORUM 2008
CONVEGNO - EBA FORUM 2008CONVEGNO - EBA FORUM 2008
CONVEGNO - EBA FORUM 2008
 
Web20 Agripolis 2009
Web20 Agripolis 2009Web20 Agripolis 2009
Web20 Agripolis 2009
 
Enterprise 2 0 - una introduzione
Enterprise 2 0 - una introduzioneEnterprise 2 0 - una introduzione
Enterprise 2 0 - una introduzione
 
web 2.0 quinta parte
web 2.0 quinta parteweb 2.0 quinta parte
web 2.0 quinta parte
 
Wikipedia lesson
Wikipedia lessonWikipedia lesson
Wikipedia lesson
 
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)201203021 comphumanities 2012 lm (editing e analisi del documento digitale)
201203021 comphumanities 2012 lm (editing e analisi del documento digitale)
 
201203021 comphumanities 2012
201203021 comphumanities 2012201203021 comphumanities 2012
201203021 comphumanities 2012
 
Open data
Open dataOpen data
Open data
 
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitari
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitariOpen data in sanita' - Master Funzioni Direttive Gestione servizi sanitari
Open data in sanita' - Master Funzioni Direttive Gestione servizi sanitari
 

Federico Cairo - L'intelligenza collettiva per organizzare la conoscenza sul Web

  • 1. L'intelligenza collettiva per organizzare la conoscenza sul Web Federico Cairo 7° Nexa Lunch Seminar Politecnico di Torino – 23/01/2013
  • 2. Il concetto di intelligenza collettiva nasce nell’ambito della biologia per descrivere il comportamento di alcune specie animali (come le api e le formiche) che agiscono in gruppo come un unico superorganismo.
  • 3. In sociologia è stato affrontato da diversi autori come Douglas Engelbart (1945), Pierre Lévy (1994) e Howard Bloom (1995), ma è divenuto noto al grande pubblico grazie all’opera del giornalista americano James Surowiecki “The Wisdom of Crowds” (2004).
  • 4. Surowiecki racconta un esempio di intelligenza collettiva che fu rilevato nel 1906 dallo scienziato inglese Francis Galton durante la fiera contadina di Plymouth, nel sud dell’Inghilterra.
  • 5. Nel suo testo “Reinventing Discovery: The New Era of Networked Science”, il fisico canadese Michael Nielsen indaga come gli strumenti online possano amplificare l’intelligenza collettiva per favorire la scoperta scientifica.
  • 6. Nel 1999 Garry Kasparov affronta “il resto del mondo” in una partita a scacchi online organizzata da Microsoft. Per Nielsen è un esempio di come gli strumenti collaborativi online possano attivare meccanismi di problem solving inarrivabili per il singolo individuo.
  • 7. Wikipedia è la più grande enciclopedia digitale del mondo. Contiene più di 23 milioni di voci scritte in 275 lingue. È interamente gestita da una comunità di utenti e può essere modificata e arricchita da chiunque abbia accesso al Web.
  • 8. Per quanto superficiali o incomplete possano apparire le voci di Wikipedia ai suoi detrattori, esse sono il frutto di un “accordo semantico” degli utenti di Internet che attribuisce ad ogni voce un concetto univoco. Wikipedia ha vinto una sorta di selezione naturale che l’ha portata ad essere usata di fatto come ontologia di riferimento sul Web.
  • 9. Wikipedia condivide il sistema di valori del movimento FOSS (Free and Open Source Software) di cui Jimmy Wales è stato fin dall’inizio un sostenitore. “Given enough eyeballs, all bugs are shallow” (Eric Raymond, The Cathedral and the Bazaar), questa fiducia è il presupposto della collaborazione in Wikipedia.
  • 10. DBpedia, la trasposizione in formato Linked Data dei contenuti di Wikipedia, costituisce oggi il nodo principale del Web dei Dati. I Linked Data publisher connettono sempre più spesso i propri nodi a quelli di DBpedia, rendendola il fulcro di interconnessione tra i dataset pubblicati nello spazio del Web Semantico.
  • 11. Il sovraccarico cognitivo, meglio conosciuto come information overload, si verifica quando si ricevono troppe informazioni per riuscire a prendere una decisione o sceglierne una specifica sulla quale focalizzare l'attenzione. (fonte: Wikipedia)
  • 12. I Linked Open Data possono contribuire efficacemente a contrastare il problema del sovraccarico informativo. Questo aspetto del Web Semantico viene indagato da David Weinberger nel capitolo 9 della sua ultimo saggio “Too big to know” (2011).
  • 13. Una strategia per contrastare il sovraccarico informativo è aggiungere informazione all’informazione. I LOD possono metadatare i contenuti del Web attraverso concetti non ambigui rappresentati da URI. Se gli argomenti di una pagina Web sono identificati attraverso URI, anziché semplici tag, si elimina l’ambiguità delle parole e si migliora la precisione dei motori di ricerca.
  • 14. Essendo DBpedia collegata a un vasto "corpus" multilingue preannotato di carattere enciclopedico (Wikipedia), risulta tecnicamente molto adatta ad essere utilizzata per procedimenti di natural language processing e di text mining, finalizzati alla classificazione automatica dei documenti sul Web.
  • 15. I software che utilizzano Wikipedia e DBpedia per l'estrazione e l'arricchimento dei contenuti sul Web, come per esempio TellMeFirst (tellmefirst.polito.it), fanno appunto leva sull’intelligenza collettiva delle comunità online, mostrandone le potenzialità e i benefici per gli utenti di Internet.
  • 16. TellMeFirst è uno strumento per la classificazione e l'arricchimento dei documenti testuali tramite Linked Open Data. Sfrutta le tecnologie del Semantic Web e del NLP per estrarre dai testi gli argomenti principali in forma di risorse DBpedia e arricchirli con nuove informazioni e contenuti recuperati dal Web (immagini, video, mappe, news).
  • 17. Demo!
  • 18. Quest'opera è distribuita con licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 Italia. Grazie per l’attenzione! Federico Cairo federico.cairo@polito.it Politecnico di Torino – 23/01/2013