Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
I dati e la statistica nel mondo open source: InsulaR
1. I dati e la statistica
nel mondo open source:
InsulaR
Davide Massidda
davide.massidda@gmail.com
www.insular.it
Cagliari, Open Data Day, 22 febbraio 2014
2. I dati
Consentono di digitalizzare la realtà, descrivendo un
fenomeno attraverso un codice numerico (e non solo).
Veicolano informazioni, che però necessitano di
opportune tecniche e adeguati strumenti per essere
estratte.
3. La statistica
È quella disciplina che fa da ponte tra i dati e
l'informazione.
Statistica descrittiva
Sintesi dei dati attraverso indici numerici e visualizzazioni
grafiche per descrivere un fenomeno.
Statistica inferenziale
Cerca di scoprire cosa regola la variabilità di un fenomeno,
mettendolo in relazioni con altri fenomeni.
L'analisi statistica semplifica la realtà per renderla
comprensibile: si scarta informazione per ottenere
informazione!
6. Cosa è un data scientist?
Un atleta in grado di
nuotare in mezzo ai dati.
Un
esploratore
numeri.
Un tecnico in grado di
utilizzare gli strumenti
informatici e statistici
per l'utilizzo dei dati.
Un esperto conoscitore
del fenomeno, capace di
guidare lo studio del
dato e individuare le
strade più fertili su cui
orientare il lavoro.
Un artista creativo, in grado di
intrecciare dati preesistenti per trovare
soluzioni originali a un problema.
dei
7. Quali strumenti di lavoro?
Al data scientist non è chiesto di analizzare dati ma di
creare con i dati.
A un artista servono gli strumenti per
potersi esprimere: software flessibili,
personalizzabili e che consentano di
produrre qualcosa di nuovo.
Dato che, come tutti gli artisti, il data
scientist è sempre al verde, questi
strumenti dovrebbero essere gratuiti.
16. Agitare bene (l'utente) prima dell'uso
A differenza di altri software, R richiede all’utente un
adeguato addestramento sia informatico che statistico
(uso consapevole della metodologia d’analisi).
17. R in Sardegna?
In un mondo dove le risorse economiche sono sempre più
esigue, ma la richiesta di utilizzo dei dati è sempre
maggiore, R può rappresentare una grande risorsa per
tutti coloro che lavorano con i dati:
Università
●
Pubbliche amministrazioni
●
Aziende
●
Professionisti
●
Nonostante questo, R in Sardegna è ancora poco diffuso.
18. Nel 2013 nasce InsulaR
È per colmare questa lacuna che nasce InsulaR, la prima
comunità cagliaritana di utilizzatori di R.
www.insular.it
19. Cosa è InsulaR?
InsulaR è un R User Group (RUG).
RUG: gruppi di utilizzatori di R a carattere locale che
mettono in connessione persone geograficamente vicine.
Il punto di partenza è il web, dove nascono delle relazioni
sociali che nel mondo reale possono sfociare in
collaborazioni e rapporti professionali.
InsulaR nasce da un'idea di alcuni studenti dei corsi di
laurea di psicologia di Cagliari interessati a imparare a
utilizzare R.
20. Obiettivi del gruppo
●
●
●
Condividere la conoscenza sull’uso di R, sia all’interno
del gruppo che all’esterno.
Creare una rete di utilizzatori di R nell’Isola.
Permettere a persone capaci di emergere e di farsi
conoscere.
●
Divulgare dati e software con licenze aperte.
●
Creare delle opportunità di lavoro intorno a R!
21. I canali per la divulgazione
Internet
●
Blog (tutorial, videotutorial)
●
Forum
●
Social network (Facebook, Twitter)
Face-to-face
●
Meetings
●
Corsi di R