ASOC1920 Webinar Lezione 4 - Navigare ed estrarre i dati da I.stat
1.
2. Il Datawarehouse di diffusione I.Stat
Come si cercano i dati e si
seleziona un dataset in I.Stat
esempi e navigazione on-line
3. ✔ Il datawarehouse di diffusione I.Stat
✔ Come si accede al datawarehouse
✔ L’albero dei Temi e i suoi elementi
✔ Come si seleziona un dataset con esplora temi
✔ Come si seleziona un dataset con interrogazione
Cerca nei temi
✔ Ricerca dei dati – esempi on line
4. I dati diffusi nel datawarehouse I.Stat sono dati
aggregati (macrodati) relativi alle varie fonti statistiche.
Il DW si basa sulla tecnologia .Stat dell’OECD.
I dati sono raccolti e presentati in un albero dei temi a
cui si può accedere direttamente da dati.istat.it oppure
navigando nel sito dell’Istat www.istat.it
Il datawarehouse di diffusione I.Stat
5. L’articolazione dell’albero in Temi (Sottotemi) è quanto più
possibile coerente con le dimensioni concettuali dei
fenomeni e la collocazione dei dati statistici nell’albero
prescinde dalla fonte (nota solo al ristretto mondo dei tecnici)
e si riferisce invece all’ordine degli argomenti.
E’ stato quindi privilegiato il criterio tematico rispetto a
quello per fonte per consentire agli utenti di ricercare e
capire la disponibilità dei dati navigando l’albero in base
all’argomento di interesse.
Il datawarehouse di diffusione I.Stat
8. La stessa articolazione per temi di dati.istat.it è riportata sul
sito dell’Istat www.istat.it al fine di garantire la coerenza
dell’intera diffusione dell’Istituto
Accesso a I.Stat attraverso le pagine del sito www.istat.it
9.
10. L’accesso a I.Stat dati.istat.it
presenta all’utilizzatore
l’informazione statistica per gruppi
tematici rappresentati in un albero
organizzato per livelli gerarchici.
La navigazione dell’albero
consente di consultare la banca
dati partendo da un macro
argomento, il Tema, fino al
dettaglio della tavola di
visualizzazione dei dati (query).
I Temi sono il primo livello di lettura
e sono preceduti dall’icona
11. Tema
Sottotemi
Articolazione degli argomenti
in verticale
Ogni Tema ha al suo interno, una volta
aperto, più Sottotemi che ne
dettagliano il suo contenuto
I Sottotemi - secondo livello di lettura
sono preceduti dall’icona
12. Si naviga all’interno di un Tema e del suo Sottotema
allo scopo di visualizzare i dataset
1 2
3
I dataset sono preceduti da se è stata creata una
sola query (selezione specifica di dati)
Caso «Indicatori demografici»
I dataset sono preceduti da se vi sono più query
(più visualizzazioni dei dati)
Caso «Popolazione residente al 1° gennaio»
Caso «Popolazione residente – bilancio»
I dataset sono i cubi del data warehouse I.Stat, i reali
contenitori dei dati
1
2
3
3
3
13. I Gruppi sono una sorta di capitoli in cui sono
raccolte query con contenuto omogeneo.
Sono preceduti dall’icona
Le Query sono opportune visualizzazioni dei
dati presenti nel cubo e sono precedute
dall’icona
Query del gruppo
14. Per i dati della popolazione al 1 gennaio fino al
livello provinciale apriremo la prima query
Per i dati del solo Piemonte a livello comunale
apriremo la query
Per i dati di tutti i comuni apriremo la query
15. Per i dati della popolazione al 1 gennaio fino al livello provinciale apriremo la 1° query
16.
17.
18. Query: selezione specifica di dati
I dataset sono i cubi del data warehouse I.Stat, i reali contenitori dei dati
Le Query sono opportune visualizzazioni dei dati presenti nel cubo
19. L’albero dei Temi e i suoi elementi
Tema
Sottotema
Dataset
Gruppi
Query
Per capire l’oggetto che si sta navigando è utile
aprire tutto il suo contenuto fino alle query di
dettaglio
20.
21.
22.
23. Per i dati dei disoccupati per cittadinanza apriremo la query
24. Trovare i dati – relatore Enrica Massi
Accesso a I.Stat attraverso le pagine del sito www.istat.it
29. Come si seleziona un dataset su I.Stat
Primo metodo – esplora Temi
Secondo metodo – interrogazione Cerca nei temi
Esempio 1 – ricercare il dataset Nati vivi
Esempio 2 – ricercare il dataset relativo agli iscritti all’università
Esempio 3 – ricercare il dataset relativo all’utilizzo del pc
35. I.Stat – Personalizzazione delle tabelle multidimensionali
Giovanna Coiro – ISTAT, Direzione Centrale per la Comunicazione, Informazione e servizi ai cittadini e agli utenti
30 marzo 2020
36. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
37. Dal link di I.Stat http://dati.istat.it/Index.aspx
40. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
41. SPOSTARE LE DIMENSIONI DI ANALISI
Cliccare sul menu Personalizza e selezionare Disposizione degli assi
42. Si aprirà la seguente schermata
VARIABILI NEL BANDONE
ROSSO
VARIABILI IN FIANCATA VARIABILI IN TESTATA
43. Trascinare con il mouse le dimensioni dove le si vogliono spostare e
cliccare su Visualizza i dati per vedere la tabella modificata
45. Popolazione residente al 1° gennaio – Italia, regioni, province ( I.Stat )
sposto lo Stato civile in fiancata e il Territorio nel bandone rosso
Tabella originale Tabella personalizzata
46. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
47. MODIFICARE LE OPZIONI DI VISUALIZZAZIONE
Selezionando dal menu Personalizza la voce Opzioni possiamo cambiare
le impostazioni della tabella visualizzata
48. Si aprirà la seguente schermata
Decimali - per inserire dei decimali in
visualizzazione
Mostra i codici – per visualizzare i codici di ogni
modalità nel nostro database
Nascondi righe (o colonne) vuote – per avere
delle tabelle piene
Nascondi le gerarchie di riga (o di colonna) –
consente di vedere delle tabelle più compatte
Altre opzioni – Mostra il Timestamp – permette
di vedere la data dell’ultimo aggiornamento dei
dati
49. Cultura, comunicazione e viaggi
Internet: accesso e tipo di utilizzo – Famiglie e accesso a internet ( I.Stat )
51. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
52. VARIAZIONE DEL TEMPO DI RIFERIMENTO DEI DATI
Cliccare sempre nella tabella visualizzata sulla voce Seleziona periodo
53. Per i dati annuali si aprirà la seguente finestra che permetterà di cambiare il
numero di anni visualizzati a partire dal più recente
54. Oppure si può decidere di visualizzare un intervallo di anni prefissato
55. Popolazione e famiglie Popolazione– Popolazione residente al 1°gennaio – Italia,regioni,province (I.Stat)
Tabella originale con 1 anno
Tabella personalizzata
con 2 anni
56. Per i dati mensili cliccando sulla voce Seleziona periodo si può
cambiare il numero di mesi visualizzati a
partire dal più recente
oppure visualizzare un intervallo di
mesi prefissato
57. Lavoro e retribuzioni Offerta di lavoro– Disoccupazione – Disoccupati dati mensili- Sesso,età (I.Stat)
Tabella originale
Tabella personalizzata
con mesi dal gen.2018
al gen.2019
58. Per i dati trimestrali cliccando sulla voce Seleziona periodo si può
cambiare il numero di trimestri visualizzati a
partire dal più recente
oppure visualizzare un intervallo di
trimestri prefissato
59. Per i dati misti (annuali e trimestrali) cliccando sulla voce Seleziona periodo si
può
cambiare il numero di anni e trimestri
visualizzati a partire dai più recenti
oppure visualizzare un intervallo di
anni e trimestri prefissato
60. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
61. SELEZIONE DELLE MODALITA’ D’INTERESSE
Per filtrare le informazioni da visualizzare, laddove possibile, si può
selezionare una delle voci nei menu a tendina
63. Si possono selezionare (o deselezionare) manualmente gli elementi biffando (o
debiffando) in corrispondenza delle voci coinvolte
64. Si possono anche deselezionare (o selezionare) automaticamente tutti gli
elementi cliccando su Deseleziona ( o su Seleziona)
SONO STATI DESELEZIONATI
TUTTI GLI ELEMENTI
65. Si possono anche selezionare (o deselezionare) automaticamente tutti gli
elementi dello stesso livello gerarchico
PRIMA CLICCARE SUL
NOME DEL LIVELLO
GERARCHICO
(es. REGIONE PIEMONTE)
POI SCEGLIERE NEL
MENU SELEZIONA
ELEMENTI
LA VOCE SELEZIONA
LIVELLO
66. Un altro modo per accedere alle dimensioni da personalizzare è andare sul
menu Personalizza e selezionare la voce Seleziona
Apparirà l’elenco delle dimensioni che possiamo scegliere e modificare
utilizzando le funzioni prima elencate
67. ARGOMENTI
- Personalizzazione delle tabelle di visualizzazione
spostare le dimensioni di analisi nella tabella
modificare le opzioni di visualizzazione
variazione del tempo di riferimento dei dati
selezione delle modalità d’interesse
- Salvare le tabelle personalizzate
68. SALVARE LE TABELLE PERSONALIZZATE
Occorre effettuare prima la registrazione cliccando sul menu in alto a
destra la voce Clicca qui per il login
Si aprirà una finestra per autenticarsi (inserendo mail e password) o, se
si è un nuovo utente, per registrarsi
69. Dopo aver effettuato l’autenticazione sulla home page comparirà il nome
utente inserito
Possiamo quindi personalizzare la tabella e per salvare le modifiche apportate,
dobbiamo cliccare sul menu La tua interrogazione e selezionare la voce Salvare
l’interrogazione
70. Si aprirà la finestra per inserire nome in italiano e in inglese dell’interrogazione
da salvare
Per ritornare alle interrogazioni salvate andare su La tua interrogazione e scegliere
la voce Le mie interrogazioni
71. Si visualizzeranno le interrogazioni salvate per poterle Aprire o Eliminare
Per visualizzare il link della tabella che si vuole condividere con altri si può
cliccare su Condividere
80. I Flag standard
Flag
Si utilizzano in tutti i casi in cui sia necessario fornire informazioni su: un valore mancante o
sullo stato di un valore
81. I Flag standard
Forniscono informazioni supplementari sui valori diffusi.
Sono forniti in modo standard nel sistema ed in linea con altri organismi internazionali (Eurostat, OECD).
Sono visualizzati come lettere tra parentesi nelle celle accanto ai dati corrispondenti.
Una legenda a pie’ di tavola ne spiega il loro significato.
Nel sistema il dato non disponibile viene identificato con il carattere speciale «..».
In alcuni casi, per fornire maggior informazioni all’utente, insieme al flag viene fornita anche una nota a
livello di dataset.
82. I Flag standard
Casistica
I.Stat
Descrizione
Presenza
record
Presenza Valore Flag
casistiche relative ai null o missing
fenomeno impossibile n.p. no
fenomeno possibile di cui non si sono verificati i casi n.p. si si (0)
dato oscurato dato oscurato per la tutela del segreto statistico si no c
minimo considerato il dato non raggiunge la metà della cifra minima considerata si no (*) 0
dato sconosciuto per n ragioni il fenomeno esiste, ma i dati non si conoscono per qualsiasi ragione si no g
dato non significativo dato statisticamente non significativo (vedasi metadati di dataset) si
si/no (dipende dal processo
statistico)
n
dato incerto dato indisponibile o incerto (vedasi metadati di dataset) si si/no u
casistiche relative a dati diversi dai null
dato stimato dato stimato si si e
dato provvisorio dato provvisorio si si p
dato aggiornato post pubblicazione dato aggiornato si si r
break della serie break della serie si si b
previsione dato previsto si si f
sciopero sciopero si si s
dato non ricostruito dato non ricostruito rispetto alla popolazione del censimento 2011 si si y
dati di prova per test dati di prova si si J
Record di raggruppamenti
sono record funzionali alla lettura e non riportano valori è voce da considerarsi come titolo di raggruppamento si no t
91. Esportazione dei dati – Differenze tra formati
File Excel
File testuale (CSV) Intero dataset
esporta la tavola come
visualizzata on line
(le modalità attive nelle combo)
esporta i dati di tutta la query
(tutte le modalità in combo anche
quelle non attive)
esporta tutto il dataset
(se messo a disposizione)
Fino a 100.000 celle Fino a 1.000.000 di celle tutti i dati
formato xls formato csv formato zip + csv
92. Sistema per un accesso facilitato : STATBASE
I.Stat è l'unico punto di accesso ai dati online e ogni utente, sia che si tratti di un comune cittadino o
di un ricercatore, accede all'intero patrimonio informativo, con più di 3.000 query predefinite,
articolate in circa 400 set di dati.
È quindi necessario fornire un percorso facile per accedere alle informazioni più importanti.
Da questo requisito nasce il progetto STATBASE.
STATBASE verrà presentato come una sintesi di I.Stat: più facile da consultare e con le query ritenute
più rilevanti e conterrà soltanto le serie storiche attive.
93. STATBASE – Home page
Path di navigazione al
Sito ISTAT
Versione inglese
Azzera le selezioni
visualizzando l’albero
iniziale
Approfondimenti
su I.Stat