Depozite digitale pentru instituții de cercetare și surse de informații privind Accesul Deschis în România și Uniunea Europeană
1. Depozite digitale pentru instituții de cercetare
și surse de informații privind Accesul
Deschis în România și Uniunea Europeană
IFIN HH, București, ianuarie, 2016
Kosson
Nicolaie Constantinescu, arhitect informațional
2. Câteva motive pentru care trebuie
să ai „locul” tău în ecosistemul
informațional local
4. Clădirea 514, CERN
Ferma de servere din clădirea principală are 1450m2
și
găzduiește un Tier 0 de prelucrare a datelor.
Tier O reprezintă însăși capacitatea de calcul al Centrului
de date CERN
Capacitatea de calcul și stocare este dezvoltată pe 1200m2
,
până la 20000 de unități de calcul și stocare,
40 km de cablu, 3200 m de țează de oțel,
400.000 de ore de muncă. Este un Tier 0
http://home.cern/about/computing
Tier 0 distribuie datele brute și rezultatele reconstruite către structurile de calcul de tip Tier 1 și
reprocesează datele atunci când LHC nu lucrează.
Tier 1 constă din 13 centre de prelucrare computerizată din întreaga lume îndeajuns de mari
pentru a prelua (10Gb/s prin Rețeaua privată de fibră optică a LHC - LHCOPN) și stoca datele
LHC. Au și rolul de a distribui date către Tier 2.
Tier 2 sunt universitățile și alte institute de știință care stochează îndeajuns de multe date și
oferă îndeajuns de multă putere de prelucrare pentru sarcini de analiză specifice.
Tier 3 sunt clusterele locale din departamentul unui institut sau chiar un PC ca unitate
individuală.
România participă prin Romanian Tier-2 Federation (7 instituții) din a cărei componență fac parte
NIPNE și IFIN HH
5. Necesitatea unei infrastructuri
care să asigure servicii de
calitate
Software
cu surse
deschise
Standarde
Deschise
România: 12 instanțe
http://www.dspace.org/
http://files.eprints.org/
http://invenio.readthedocs.org
http://kosson.ro/know-how/212-oais-modelul-functional
REFERENCE MODEL FOR AN OPEN ARCHIVAL
INFORMATION SYSTEM (OAIS)
http://ckan.org/
JSON
XML MARC21
7. ELI - THE EXTREME LIGHT INFRASTRUCTUREELI - THE EXTREME LIGHT INFRASTRUCTURE
THE ELI - NUCLEAR PHYSICS FACILITYTHE ELI - NUCLEAR PHYSICS FACILITY
Biblioteca
are un rol mult
mai activ
Date
Contribuțiile
cercetătorilor
Servicii
Tehnologie
Management
Expertiză
Științe
Deschise
Acces
Deschis
Date
Deschise
Cercetare
deschisă
reproductibilă
Însemnări de laborator/experiment
Instrumente
de
evaluare
Politicile
necesare
deschiderii
Instrumente
de lucru
deschise
Fluxuri de lucru ușor de reprodus
Instrumente licențiate deschis pentru
cercetare
Metrici noi de evaluare
Folosirea datelor în
formate standardizate
Îngemănarea politicilor
guvernamentale cu cele ale
Finanțatorilor cercetării și ale
Instituțiilor de cercetare
Depozite digitale deschise
8. Depozitul digital trebuie considerat parte a valorificări interne a
rezultatelor de cercetare, a rețelei de referințe bibliografice locale,
naționale și internaționale și o componentă activă a procesului de
cercetare prin indicatorii și metricile pe care le poate genera.
Stabilirea autorității privind înregistrările
Atribuirea de identificatori pentru
Cercetători – de tip ORCID,
Articole și/sau date – de tip DOI (Crossref)
Specialiștii bibliotecii stabilesc, creează,
adoptă și atribuie vocabularele controlate
pentru facilitarea indexării și regăsirii
Stabilesc în consultare cu departamentele
de cercetare grupurile și comunitățile
de date și informații din depozitul digital
Asigură stabilirea și întreținerea
mecanismelor de prezervare digitală
a conținutului
Asigură compatibilitatea și schimbul de date
cu instituții similare din țară și străinătate
Oferă metrici propriilor cercetători privind
propriile contribuții
Elaborează politicile privind
- DMP – Data Management Plan
- TDM – Text and Data Mining
Elaborează și recomandă
politicile privind Accesul Deschis de la
politică editorială până la licențele și termenii
drepturilor de autor
Asigură migrarea conținutului din punct de
vedere al formatelor bibliografice
9. Necesar:
● Mandatarea bibliotecii pentru a crea infrastructura
● Un mandat pentru dezvoltarea unei politici interne privind
publicarea rezultatelor folosind licențe deschise
● Interconectarea depozitului digital cu resursele la nivel
european precum openaire.eu
● Instruirea prin intermediul bibliotecii a întregului personal
privind publicarea deschisă a rezultatelor de cercetare
● Scanarea resurselor de cercetare care sunt cele mai
importante și constituirea unei colecții care să acopere
contribuțiile retroactiv.
● Pilotarea unui sistem de colectare a notelor de laborator în
infrastructura bibliotecii.
10. O largă cunoaștere a
întregului ecosistem
utilizat de
cercetătorii proprii.
În acest moment,
cercul de colaborare
nu se mai oprește la
nivelul institutului.
Datele și lucrările de
cercetare sunt
supuse atenției
colegilor înainte de
publicarea propriu-
zisă
12. Plan de diseminare
Rezultate
de cercetare
Plan
de management
al datelor
CERCETARE Decizie de
diseminare/
distribuire
Decizie de
exploatare/
protejare
Publicații
Depozitarea
datelor de
cercetare
Patentare (sau
alte forme de
protecție)
Accesare și
Utilizare fără
taxare
Restricționarea
Accesului și/sau a
utilizării
AD de aur
AD verde
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
18. https://ec.europa.eu/commission/2014-2019/oettinger/blog/open-science-knowledge-and-data-driven-economy_en
Günther Oettinger
Comisar pentru Economia Digitală și Societate
Digitală
Carlos Moedas
Comisar Cercetare, Știință și Inovare
Bruxelles, 22 iunie, 2015
Reprezintă o schimbare sistemică în modus operandi al științei și
cercetării. Afectează întregul ciclu al cercetării și toți actorii săi, crește știința
prin facilitarea unei mai mari transparențe, deschideri, interconectare,
colaborare și refocalizează știința de la paradigma „publish or perish” (publică
sau dispari) la perspectiva cunoașterii distribuite.
Despre ce esteDespre ce este
știința deschisă?știința deschisă?
Știința Deschisă descrie tranziția continuă a
modului în care se face cercetarea,
cercetătorii colaborează, cunoașterea este
distribuită și știința este organizată.
https://ec.europa.eu/research/consultations/science-2.0/consultation_en.htm
23. Politica Olandeză privind
Știința Deschisă
„În această politică, rezultatele de cercetare
finanțate public, trebuie să fie liber disponibile
fără taxare pentru toată lumea. Aceasta va fi o
prioritate pe perioada Președenției Olandeze a
Uniuni Europene în primul semestru al lui
2016”.
Sander Dekker
Secretar de Stat
Pentru Educație,
Cultură și
Știință
Olanda
https://ec.europa.eu/commission/2014-2019/moedas/announcements/commissioner-moedas-and-secretary-state-dekker-call-scientific-publishers-adapt-their-business_en
Declarație comună Bruxelles, 12 octombrie, 2015
25. Cine suntem
•Începând cu dec 2010
• OpenAIRE
• OpenAIREplus
• OpenAIRE2020
• O entitate de sine stătătoare
din 2016
•Un consorțiu de 50 de
parteneri
perspective instituționale, naționale și
internaționale privind politicile AD, e-
infrastructuri
Experți în Accesul Deschis
• Elaborarea unor tehnologii pentru
infrastructuri
• big data, linked data
Experți în domeniul informațiilor
și informaticieni specializați
• Recomandări legale și pe politici
Experți zona legală
• Bune practici privind datele
• Legături cu infrastructurile de date
Comunități de date
25
27. Rezultate: Un sistem de informare
științific integrat
11.5 mil. De publicații
unice
7 mil. autori
590+ furnizori de date
130 K publicații legate
de proiectele lor de la 3
agenții de finanțare
5.5 K seturi de date
legate la publicații
33 K de organizații
27
28. Rețeta
28
1. Date deschise
…pentru distribuire, reutilizare,
validare
… de la sursă
2. Interoperabilitatea datelor
furnizorilor
…normalizare, îmbogățire, date
interconectate
3. Servicii robuste oferite
…pentru creșterea încrederii
…Pentru preluare de la părți terțe
Procese de
luare a
deciziilor
transparente
și testate
29. 1. Deschidere
•Peisajul divers al Europei necesită sprijin la nivel local
•Practici diferite, mentalități diferite
29
O rețea de specialiști
•33 de noduri expert în
toată Europa
•Alinierea politicilor (AD)
•Asistență tehnică
•Instruire
• Un pas către
comunitatea
internațională prin COAR
30. 2. Interoperabilitate
•Ghiduri și standarde
•Ghiduri OpenAIRE guidelines pentru literatură, date, CRIS
•Aliniere Globală și standarde (RDA, WDS, W3C, …)
•Folosirea schemelor de identificatori
•Sinergii cu e-infrastructurile existente
•Vocabulare uniforme
•Clasificare interdisciplinară
•Multilingvism (ex., EUROVOC)
•Legături către alte domenii
•Maparea modelelor de date (DCAT, LOM, …)
•LOD – Date Deschise Interconectate
30
31. 3. O infrastructură orientată pe servicii
•Suport & Instruire
•Distribuirea rezultatelor științifice
•Publicare AD & Depozitare
•Validare și evidență
•Regăsirea informațiilor & Crowdsourcing
•Raportate & Monitorizare
•Analize pe date de utilizare
•…
31
36. Estimate AD privind FP7
36
FP7
116.6K publications
Linked to 11.5 K projects
50% OA
0
5000
10000
15000
20000
25000
0
5000
10000
15000
20000
25000
O creștere a publicațiilor din proiectele FP7 în depozitele instituționale
38. 38
7%
50%
29%
8%
5%
Distribution of publications by Journal Impact Factor value
<2 2 to 5 5 to 10 10 to 15 >15
Journal of antimicrobial chemotherapy (SJR: 2.4)
Nature (SJR: 21.3)
Journal of neuroscience (SJR: 5.8)
Human molecular genetics (SJR: 5.0)
Nature genetics (SJR: 24.1)
Proceedings of the National Academy of Sciences of the US (SJR: 7.0)
Nucleic acids research (SJR: 6.7)
Journal of biological chemistry (SJR: 3.4)
Antimicrobial agents and chemotherapy (SJR: 2.4)
PLoS One (SJR: 1.7)
0 100 200 300 400 500
147
147
154
162
185
186
197
218
233
1222
Number of publications by periodic: top 10
42%
35%
16%
7%
Distribution of publications by SJR value
<2 2 to 5 5 to 10 >10
Nature Medicine (SJR: 11.0)
Immunity (SJR: 14.3)
Nature Neuroscience (SJR: 11.9)
Neuron (SJR: 12.9)
Molecular Cell (SJR: 14.7)
Nature Methods (SJR: 10.7)
Science (SJR: 12.5)
Cell (SJR: 28.2)
Nature (SJR: 21.3)
Nature Genetics (SJR: 24.1)
0
20
40
60
80
100
120
140
160
180
200
40
41
41
47
48
75
75
77
147
185
Number of publications in periodics with SJR>10: top 10
Legături la
baze de date
externe
ex., Scimago
39. ANALIZE PE DATE DE UTILIZARE
pentru a sprijini
procesul decizional
39
40. Ce analizăm?
•Mediul academic – cine ce face, care sunt tematicile
în top / trendurile
•O cartografiere a autorilor, relațiilor, colaborărilor,
trendurilor, …
•Analiză pe rezultatele de cercetare pentru sprijinirea
deciziei politice
•Comunități, corelații, domenii științifice
•Identificarea lipsurilor și a tendințelor atipice
•Corelare cu programele de finanțare
•...
40
41. 1 2 3
From data acquisition to analysis
Get the data.
Involve as many
sources as
possible.
Clean. Clean.
Clean.
Link to many data
sources & external
dbs.
Classify content
based on known
classifications.
Cluster and
classify based on
statistical
methodology –
Find the unknown
(trends)
Work with
experts to give
meaning to
statistical
output.
Visualize: use
online tools to
see different
facets.
41