SlideShare ist ein Scribd-Unternehmen logo
1 von 75
Downloaden Sie, um offline zu lesen
introducció a les
DADES OBERTES
i altres hypes
J. Minguillón
EIMT / UOC
què és Open Data?
què és Open?
què es Data?
plural de "datum" (cosa donada)
idea: la mesura / quantitat / ...
d'alguna cosa
"Qualsevol informació que facilita la
formació d'una idea, d'un judici,
d'una conclusió."
piràmide D-I-K-W
"42" és una dada
"la temperatura del pacient és de
42 ºC" és informació
"una febre de 42 ºC pot causar
danys cerebrals" és coneixement
la saviesa és usar aquest
coneixement pel bé comú
les dades
no són només
números
font: https://flic.kr/p/5A9X6P
taules, documents
wikipedia: pàgines / articles
flickr, instagram: imatges
twitter: tweets
metadades
font: https://flic.kr/p/87P3sc
Locals and Tourists
Eric Fischer
metadades de flickr
dades
=
estructura interna
x
valors possibles
atòmiques
estructurades
semi-estructurades
atòmiques
enters, reals, complexos
vectors (RGB, ...)
caràcters, cadenes
dades estructurades
tabulars: 1D, 2D, 3D, ...
jeràrquiques: tweets
relacions: grafs
dades semi-estructurades
documents (text)
pàgines web (HTML)
en resum
conèixer com són les
dades facilita la seva
manipulació posterior
què és Open?
obert com a
llibertat
font: https://flic.kr/p/6p2kFa
model de les 5 Rs
Reuse
Revise
Remix
Redistribute
Retain
lliure vs gratuït
https://theodi.org/blog/when-data-is-free-but-not-open
obert és una combinació
de la manca de
barreres tecnològiques
barreres legals
barreres
tecnològiques
font: https://flic.kr/p/ad8i3
barreres tecnològiques
les dades han de ser
accessibles
descarregables
manipulables
el model de 5 estrelles
* no manipulables: pdf, tiff
** propietàries: doc, ppt, xls
*** formats oberts: txt, csv, json
**** enllaçades: xml, rdf
***** contextualitzades: xml, rdf
http://5stardata.info/en/
per ser obertes calen 3 estrelles
formats oberts
programari lliure
linked data
linked data
usar URIs per identificar
usar HTTP per accedir
descriure dades amb metadades
enllaçar a dades relacionades
pensat per a màquines
exemple
<perfil id="jminguillona">
<website>
https://ca.wikipedia.org/wiki/Usuari:Julià_Minguillón
</website>
<twitter>
https://twitter.com/jminguillona
</twitter>
<orcid>
https://orcid.org/0000-0002-0080-846X
</orcid>
<institució>
http://www.uoc.edu
</institució>
...
</perfil>
perquè linked data?
extracció de dades de la web
intercanvi / enriquiment de dades
construcció de coneixement
cerques semàntiques
exemple: wikidata
quins són els municipis
confrontants amb Reus?
https://ca.wikipedia.org/wiki/Reus
https://www.wikidata.org/wiki/Q487096
accés a les dades
accés "estàtic"
dades en fitxers
"fotografies" del passat
no definits pels usuaris finals
repositoris de dades
consumides per humans
http://dadesobertes.gencat.cat/ca/cercador/detall-cataleg/?id=5
accés "dinàmic"
dades com un flux
"fotografies" del present
parametritzades (API)
serveis online
consumides per aplicacions
Application
Programming
Interface
https://www.programmableweb.com/category/all/apis
exemple: el Tecnoparc de Reus
equipaments (Generalitat de Catalunya)
↓
geolocalització
↓
API de flickr
<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:v="http://www.w3.org/2006/vcard/ns#" xml:base="http://opendata.gencat.cat/recursos/equipaments/vcard">
<v:VCard rdf:about="49176">
<v:fn xml:lang="ca"><![CDATA[Tecnoparc Reus]]></v:fn>
<v:nickname xml:lang="ca"><![CDATA[Tecnoparc]]></v:nickname>
<v:adr>
<rdf:Description>
<v:street-address><![CDATA[ Av. de la Cambra de Comerç]]></v:street-address>
<v:locality><![CDATA[Reus]]></v:locality>
<v:postal-code><![CDATA[43204]]></v:postal-code>
<v:region><![CDATA[Baix Camp]]></v:region>
<v:country-name>Spain</v:country-name>
<rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Work"/>
</rdf:Description>
</v:adr>
<v:geo>
<rdf:Description>
<v:latitude
rdf:datatype="http://www.w3.org/2001/XMLSchema#double">41.1591820489808</v:latitude>
<v:longitude
rdf:datatype="http://www.w3.org/2001/XMLSchema#double">1.118734064933219</v:longitude>
</rdf:Description>
</v:geo>
<v:tel>
<rdf:Description>
<rdf:value><![CDATA[977 276977]]></rdf:value>
<rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Tel"/>
<rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Pref"/>
<rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Work"/>
</rdf:Description>
</v:tel>
<v:category xml:lang="ca">Recerca</v:category>
<v:category xml:lang="ca">Parcs científics i tecnològics</v:category>
</v:VCard>
barreres legals
font: https://flic.kr/p/dQeTEq
barreres legals
accessible no vol dir obert
llicències
condicions d'ús
EULAs
llicències per dades obertes
per fitxers / bases de dades
els fets no es poden registrar...
...però les col·leccions sí!
http://opendatacommons.org/licenses/
condicions d'ús
per dades de la web
llenguatge legal
http://www.coca-colacompany.com/our-company/the-coca-cola-company-terms-of-use
EULA
End-User License Agreement
per aplicacions i serveis online
llenguatge legal
poden ser absurdes!
https://www.eff.org/wp/dangerous-terms-users-guide-eulas
aspectes ètics
privacitat
seguretat
transparència
males pràctiques
AOL's searcher 4417749
Ashley Madison hackejat
AEMET de pagament
altres aspectes a vigilar
qualitat
traçabilitat
actualització
en resum
abans de publicar /
reutilizar dades cal ser
conscients dels límits
per què open data?
per què no?
a qui pertanyen les dades?
qui es/són els productors?
en molts casos, els usuaris!
promouen la participació
redueixen el frau
permeten generar valor afegit
"data is the new oil" (C. Humby)
"data is the new soil" (D. McCandless)
RISP
(reutilització informació sector públic)
lleis, normatives, ...
certes incoherències
context legal
fonts de dades obertes
xarxes socials
scraped web data
repositoris
administració
organitzacions
exemples de repositoris
http://dadesobertes.gencat.cat
http://datos.gob.es
http://opendataday.cat/directori-portals-open-data
https://www.europeandataportal.eu
cicle de vida de les
dades obertes
les dades es...
generen
capturen
emmagatzemen
preprocessen
analitzen
visualitzen
publiquen
generació
per humans / sensors / serveis
en qualsevol moment / lloc
persistents / volàtils
captura
emmagatzemament
publicació
captura
repositoris
APIs
xarxes socials
dases de dades / logs
web scrapping
humans (captcha)
preprocessament
filtrat / selecció
fusió (enriquiment)
extracció de característiques
conversió
resums / agregats
anàlisi
descriptors estadístics
inferència
no supervisat (clustering)
supervisat (classificació)
importància de les variables
...
visualització
anàlisi visual
resums
informes
dashboards
mapes / grafs
interactivitat
eines
...
big data
big data
3 Vs
volum
varietat
velocitat
volum és
el nombre d'elements
mida de la mostra / població
varietat és
el nombre de valors diferents
dimensionalitat
velocitat és
com de ràpid es genera o canvia
longitudinal
altres Vs
veracitat
valor
variabilitat
visibilitat
...
exemple: Wal-Mart
(2015) 37 millions de clients
compren a Wal-Mart cada dia
d'una llista de 140,000 ítems
qui compra què i quan?
per què?
exemple
incloure dades de context
targetes de punts
inspecció dels productes (RFID)
ús de càmeres i sensors
xarxes socials
...
iniciatives
open data
sectors
turisme
oci
educació
administració
agenda oberta
civio
15mpedia
wheredoesmymoneygo?
...
contacte
jminguillona[at]uoc[dot]edu
@jminguillona
webpage
This work is licensed under a
Creative Commons Attribution-ShareAlike 4.0
International License
.

Weitere ähnliche Inhalte

Andere mochten auch

The Search Landscape in 2017
The Search Landscape in 2017The Search Landscape in 2017
The Search Landscape in 2017Rand Fishkin
 
情報セキュリティCAS 第七十一回放送用スライド
情報セキュリティCAS 第七十一回放送用スライド情報セキュリティCAS 第七十一回放送用スライド
情報セキュリティCAS 第七十一回放送用スライドKumasan, LLC.
 
Death of environmental science
Death of environmental scienceDeath of environmental science
Death of environmental scienceamulya123
 
Bennet Kelley Twitter Accounts subpoenaed by Rip Off Report
Bennet Kelley Twitter Accounts subpoenaed by Rip Off ReportBennet Kelley Twitter Accounts subpoenaed by Rip Off Report
Bennet Kelley Twitter Accounts subpoenaed by Rip Off ReportVanessa Kachadurian
 
International wastwater systems company overview
International wastwater systems company overviewInternational wastwater systems company overview
International wastwater systems company overviewMomentumPR
 
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...Suomen Pankki
 
(Declarative) Jenkins Pipelines
(Declarative) Jenkins Pipelines(Declarative) Jenkins Pipelines
(Declarative) Jenkins PipelinesSteffen Gebert
 
Investment Opportunities in Vietnam
Investment Opportunities in VietnamInvestment Opportunities in Vietnam
Investment Opportunities in VietnamDr. Oliver Massmann
 
ハードディスクの正しい消去(2015.7)
ハードディスクの正しい消去(2015.7)ハードディスクの正しい消去(2015.7)
ハードディスクの正しい消去(2015.7)UEHARA, Tetsutaro
 
Double Your Hadoop Hardware Performance with SmartSense
Double Your Hadoop Hardware Performance with SmartSenseDouble Your Hadoop Hardware Performance with SmartSense
Double Your Hadoop Hardware Performance with SmartSenseHortonworks
 
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to Ask
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to AskEverything You Wanted to Know About LinkedIn, but Were Too Embarrassed to Ask
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to AskJonathan Rick
 

Andere mochten auch (12)

Le web design - fullCONTENT
Le web design - fullCONTENTLe web design - fullCONTENT
Le web design - fullCONTENT
 
The Search Landscape in 2017
The Search Landscape in 2017The Search Landscape in 2017
The Search Landscape in 2017
 
情報セキュリティCAS 第七十一回放送用スライド
情報セキュリティCAS 第七十一回放送用スライド情報セキュリティCAS 第七十一回放送用スライド
情報セキュリティCAS 第七十一回放送用スライド
 
Death of environmental science
Death of environmental scienceDeath of environmental science
Death of environmental science
 
Bennet Kelley Twitter Accounts subpoenaed by Rip Off Report
Bennet Kelley Twitter Accounts subpoenaed by Rip Off ReportBennet Kelley Twitter Accounts subpoenaed by Rip Off Report
Bennet Kelley Twitter Accounts subpoenaed by Rip Off Report
 
International wastwater systems company overview
International wastwater systems company overviewInternational wastwater systems company overview
International wastwater systems company overview
 
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...
Näköaloja satavuotiaan tulevaisuuteen. Suomen Pankin pääjohtaja Erkki Liikane...
 
(Declarative) Jenkins Pipelines
(Declarative) Jenkins Pipelines(Declarative) Jenkins Pipelines
(Declarative) Jenkins Pipelines
 
Investment Opportunities in Vietnam
Investment Opportunities in VietnamInvestment Opportunities in Vietnam
Investment Opportunities in Vietnam
 
ハードディスクの正しい消去(2015.7)
ハードディスクの正しい消去(2015.7)ハードディスクの正しい消去(2015.7)
ハードディスクの正しい消去(2015.7)
 
Double Your Hadoop Hardware Performance with SmartSense
Double Your Hadoop Hardware Performance with SmartSenseDouble Your Hadoop Hardware Performance with SmartSense
Double Your Hadoop Hardware Performance with SmartSense
 
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to Ask
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to AskEverything You Wanted to Know About LinkedIn, but Were Too Embarrassed to Ask
Everything You Wanted to Know About LinkedIn, but Were Too Embarrassed to Ask
 

Mehr von Julià Minguillón

Introduction to OPEN DATA and other hypes (2017/18)
Introduction to OPEN DATA and other hypes (2017/18)Introduction to OPEN DATA and other hypes (2017/18)
Introduction to OPEN DATA and other hypes (2017/18)Julià Minguillón
 
Using learning analytics to support applied research and innovation in higher...
Using learning analytics to support applied research and innovation in higher...Using learning analytics to support applied research and innovation in higher...
Using learning analytics to support applied research and innovation in higher...Julià Minguillón
 
Visualización del diseño competencial de un plan de estudios
Visualización del diseño competencial de un plan de estudiosVisualización del diseño competencial de un plan de estudios
Visualización del diseño competencial de un plan de estudiosJulià Minguillón
 
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015Visualization of Enrollment data using Chord Diagrams - GRAPP 2015
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015Julià Minguillón
 
Why do teachers (not) use the institutional repository?
Why do teachers (not) use the institutional repository?Why do teachers (not) use the institutional repository?
Why do teachers (not) use the institutional repository?Julià Minguillón
 
JPEG 1991 GK Wallace paper on JPEG standard
JPEG 1991 GK Wallace paper on JPEG standardJPEG 1991 GK Wallace paper on JPEG standard
JPEG 1991 GK Wallace paper on JPEG standardJulià Minguillón
 
Introducció a Open Data / Big Data
Introducció a Open Data / Big DataIntroducció a Open Data / Big Data
Introducció a Open Data / Big DataJulià Minguillón
 
Relationships between users, resources and services in learning object reposi...
Relationships between users, resources and services in learning object reposi...Relationships between users, resources and services in learning object reposi...
Relationships between users, resources and services in learning object reposi...Julià Minguillón
 
From institutional repositories to personal collections of learning resources
From institutional repositories to personal collections of learning resourcesFrom institutional repositories to personal collections of learning resources
From institutional repositories to personal collections of learning resourcesJulià Minguillón
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Julià Minguillón
 
Analyzing OpenCourseWare usage by means of social tagging
Analyzing OpenCourseWare usage by means of social taggingAnalyzing OpenCourseWare usage by means of social tagging
Analyzing OpenCourseWare usage by means of social taggingJulià Minguillón
 
Conocimiento abierto, objetos de aprendizaje y repositorios
Conocimiento abierto, objetos de aprendizaje y repositoriosConocimiento abierto, objetos de aprendizaje y repositorios
Conocimiento abierto, objetos de aprendizaje y repositoriosJulià Minguillón
 
Promoting OERs through Open Repositories and Social Networks
Promoting OERs through Open Repositories and Social NetworksPromoting OERs through Open Repositories and Social Networks
Promoting OERs through Open Repositories and Social NetworksJulià Minguillón
 
Cerca d’informació a Internet: implicacions jurídiques
Cerca d’informació a Internet: implicacions jurídiquesCerca d’informació a Internet: implicacions jurídiques
Cerca d’informació a Internet: implicacions jurídiquesJulià Minguillón
 
Learning Object Repositories: a learner centered perspective
Learning Object Repositories: a learner centered perspectiveLearning Object Repositories: a learner centered perspective
Learning Object Repositories: a learner centered perspectiveJulià Minguillón
 
ECEL 2009 Keynote J. Minguillón
ECEL 2009 Keynote J. MinguillónECEL 2009 Keynote J. Minguillón
ECEL 2009 Keynote J. MinguillónJulià Minguillón
 
On cascading small decision trees
On cascading small decision treesOn cascading small decision trees
On cascading small decision treesJulià Minguillón
 
Sustainable Information Management for Personal Learning Environments
Sustainable Information Management for Personal Learning EnvironmentsSustainable Information Management for Personal Learning Environments
Sustainable Information Management for Personal Learning EnvironmentsJulià Minguillón
 
Closing remarks of the IV UOC UNESCO Chair International Seminar
Closing remarks of the IV UOC UNESCO Chair International SeminarClosing remarks of the IV UOC UNESCO Chair International Seminar
Closing remarks of the IV UOC UNESCO Chair International SeminarJulià Minguillón
 
Closing remarks of the III UOC UNESCO Chair International Seminar
Closing remarks of the III UOC UNESCO Chair International SeminarClosing remarks of the III UOC UNESCO Chair International Seminar
Closing remarks of the III UOC UNESCO Chair International SeminarJulià Minguillón
 

Mehr von Julià Minguillón (20)

Introduction to OPEN DATA and other hypes (2017/18)
Introduction to OPEN DATA and other hypes (2017/18)Introduction to OPEN DATA and other hypes (2017/18)
Introduction to OPEN DATA and other hypes (2017/18)
 
Using learning analytics to support applied research and innovation in higher...
Using learning analytics to support applied research and innovation in higher...Using learning analytics to support applied research and innovation in higher...
Using learning analytics to support applied research and innovation in higher...
 
Visualización del diseño competencial de un plan de estudios
Visualización del diseño competencial de un plan de estudiosVisualización del diseño competencial de un plan de estudios
Visualización del diseño competencial de un plan de estudios
 
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015Visualization of Enrollment data using Chord Diagrams - GRAPP 2015
Visualization of Enrollment data using Chord Diagrams - GRAPP 2015
 
Why do teachers (not) use the institutional repository?
Why do teachers (not) use the institutional repository?Why do teachers (not) use the institutional repository?
Why do teachers (not) use the institutional repository?
 
JPEG 1991 GK Wallace paper on JPEG standard
JPEG 1991 GK Wallace paper on JPEG standardJPEG 1991 GK Wallace paper on JPEG standard
JPEG 1991 GK Wallace paper on JPEG standard
 
Introducció a Open Data / Big Data
Introducció a Open Data / Big DataIntroducció a Open Data / Big Data
Introducció a Open Data / Big Data
 
Relationships between users, resources and services in learning object reposi...
Relationships between users, resources and services in learning object reposi...Relationships between users, resources and services in learning object reposi...
Relationships between users, resources and services in learning object reposi...
 
From institutional repositories to personal collections of learning resources
From institutional repositories to personal collections of learning resourcesFrom institutional repositories to personal collections of learning resources
From institutional repositories to personal collections of learning resources
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
 
Analyzing OpenCourseWare usage by means of social tagging
Analyzing OpenCourseWare usage by means of social taggingAnalyzing OpenCourseWare usage by means of social tagging
Analyzing OpenCourseWare usage by means of social tagging
 
Conocimiento abierto, objetos de aprendizaje y repositorios
Conocimiento abierto, objetos de aprendizaje y repositoriosConocimiento abierto, objetos de aprendizaje y repositorios
Conocimiento abierto, objetos de aprendizaje y repositorios
 
Promoting OERs through Open Repositories and Social Networks
Promoting OERs through Open Repositories and Social NetworksPromoting OERs through Open Repositories and Social Networks
Promoting OERs through Open Repositories and Social Networks
 
Cerca d’informació a Internet: implicacions jurídiques
Cerca d’informació a Internet: implicacions jurídiquesCerca d’informació a Internet: implicacions jurídiques
Cerca d’informació a Internet: implicacions jurídiques
 
Learning Object Repositories: a learner centered perspective
Learning Object Repositories: a learner centered perspectiveLearning Object Repositories: a learner centered perspective
Learning Object Repositories: a learner centered perspective
 
ECEL 2009 Keynote J. Minguillón
ECEL 2009 Keynote J. MinguillónECEL 2009 Keynote J. Minguillón
ECEL 2009 Keynote J. Minguillón
 
On cascading small decision trees
On cascading small decision treesOn cascading small decision trees
On cascading small decision trees
 
Sustainable Information Management for Personal Learning Environments
Sustainable Information Management for Personal Learning EnvironmentsSustainable Information Management for Personal Learning Environments
Sustainable Information Management for Personal Learning Environments
 
Closing remarks of the IV UOC UNESCO Chair International Seminar
Closing remarks of the IV UOC UNESCO Chair International SeminarClosing remarks of the IV UOC UNESCO Chair International Seminar
Closing remarks of the IV UOC UNESCO Chair International Seminar
 
Closing remarks of the III UOC UNESCO Chair International Seminar
Closing remarks of the III UOC UNESCO Chair International SeminarClosing remarks of the III UOC UNESCO Chair International Seminar
Closing remarks of the III UOC UNESCO Chair International Seminar
 

introducció a les dades obertes i altres hypes