SlideShare ist ein Scribd-Unternehmen logo
1 von 68
Praktyczne aspekty
udostępniania danych
badawczych
Natalia Gruenpeter
Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego
Uniwersytetu Warszawskiego, Krajowe Biuro Otwartego Dostępu OpenAIRE
CC-BY
Treść licencji dostępna na stronie:
https://creativecommons.org/licenses/by/4.0/legalcode.pl
Plan wystąpienia
• Udostępnianie danych badawczych – korzyści i polityki otwartości
• Plan zarządzania danymi badawczymi (DMP)
• Zasady FAIR w zarządzaniu danymi badawczymi
• Infrastruktura służąca do przechowywania i udostępniania danych badawczych
• Open Research Data Pilot w PR UE Horyzont 2020
https://www.washingtonpost.com/science/2020/01/24/scientists-are-unraveling-chinese-coronavirus-with-unprecedented-speed-openness
https://www.timeshighereducation.com/news/top-universities-ink-data-sharing-pact-virus-spread-shows-need
Deklaracja
sorbońska
27.01.2020
w sprawie danych badawczych;
podpisana przez przedstawicieli 9 sieci
uniwersytetów badawczych z całego świata
https://www.leru.org/files/Sorbonne-declaration.pdf
Udostępnianie danych badawczych:
korzyści i polityki
Polityki otwartości
➔ mogą dotyczyć publikacji i/lub danych badawczych
➔ wymogi grantodawcy, np. Komisja Europejska, program Horyzont 2020
➔ polityka przyjęta przez wydawcę czasopisma
➔ wymogi pracodawcy, uczelni lub instytutów naukowo-badawczych
➔ wymogi prawne: dane badawcze jako dane sektora publicznego
w politykach otwartości zakres danych
wymaganych do udostępnienia może
być ograniczony do danych niezbędnych
do weryfikacji wyników badań
zaprezentowanych w publikacjach
dane w formie nadającej
się do odczytu
maszynowego
6.06.2019 - dyrektywa
zatwierdzona przez
Radę Unii Europejskiej
Dyrektywa w sprawie otwartych danych…
https://eur-lex.europa.eu/legal-content/PL/TXT/PDF/?uri=CELEX:32019L1024&from=EN
Dane badawcze w
dyrektywie dot.
udostępniania
danych sektora
publicznego
„Dane badawcze” zdefiniowano jako
„dokumenty w formie cyfrowej, inne niż
publikacje naukowe, które są
gromadzone lub opracowywane w
ramach działalności
badawczo-naukowej i są
wykorzystywane jako dowody w
procesie badawczym bądź też są
powszechnie akceptowane w
środowisku naukowym jako konieczne
do weryfikacji poprawności ustaleń i
wyników badań”.
https://eur-lex.europa.eu/legal-content/PL/TXT/PDF/
?uri=CELEX:32019L1024&from=EN
Wymogi
Narodowego
Centrum Nauki
sporządzanie planu zarządzania danymi
badawczymi według wytycznych
https://www.ncn.gov.pl/sites/default/file
s/pliki/regulaminy/wytyczne_zarzadzani
e_danymi.pdf
plan zarządzania danymi
badawczymi (DMP)
- jako załącznik do wniosku
o finansowanie projektu
plan zarządzania danymi
badawczymi (DMP)
- jako załącznik do wniosku
o finansowanie projektu
Korzyści płynące z udostępniania danych
❖ dla społeczeństwa: rozwój społeczny i ekonomiczny, np. innowacje, rozwiązywanie
globalnych problemów, ponowne wykorzystanie w innych kontekstach niż naukowy,
❖ dla nauki: przejrzystość, wiarygodność i integralność nauki, powtarzalność wyników
badań, możliwość weryfikacji wyników badań i przeprowadzenia nowych analiz z
wykorzystaniem udostępnionych danych,
❖ dla badaczy: promocja dorobku naukowego, możliwość powiązania danych z
publikacją → większa widoczność i wpływ badań
„W sytuacji braku jasnego i wiarygodnego sygnału,
że naukowcy udostępniający zgromadzone przez
siebie dane otrzymają za to uznanie, zrozumienie
oraz nagrodę, trudno będzie podjąć ten wysiłek w
sposób spontaniczny.”
Bernard Rentier, Open Science, the Challenge of Transparency (2019)
Zarządzanie
danymi
badawczymi
❖ właściwa organizacja danych:
→ ułatwia korzystanie z danych w
przyszłości lub udostępnienie ich (np.
na prośbę),
→ minimalizuje ryzyko w
nieprzewidzianych sytuacjach (utrata
lub zniszczenie danych/sprzętu)
❖ otwarte udostępnianie danych:
→ oszczędza czas, który trzeba
poświęcić na obsługę wniosków o
udostępnienie danych
korzyści dla naukowców
https://www.natureindex.com/news-blog/what-scientists-need-to-know-about-fair-data
Udostępnianie danych badawczych:
co należy wziąć pod uwagę?
❖ Do czego jesteśmy zobowiązani?
❖ Jaka jest wartość naukowa lub historyczna danych?
❖ Jak unikalne są nasze dane? Czy istnieje możliwość ich ponownego zebrania/wytworzenia?
❖ Czy dane mogą wykorzystać inni?
❖ Jakie koszty wiążą się z zarządzaniem i przechowywaniem danych?
❖ … ?
Plan zarządzania danymi
badawczymi (DMP)
Data Management
Plan (DMP)
❖ różne wymogi → różne wzory;
❖ mogą być dostosowane do
wymogów instytucji, grantodawcy
❖ żywy dokument, który może
wspierać realizację projektu na
każdym etapie: planowania,
prowadzenia badań,
upowszechniania wyników badań
Formalny dokument, który
zawiera zarys tego, co będziemy
robić z danymi w trakcie
projektu badawczego i po jego
zakończeniu.
DMP w wytycznych
Narodowego
Centrum Nauki
❖ opis danych oraz pozyskiwanie lub
ponowne wykorzystanie
dostępnych danych
❖ dokumentacja i jakość danych
❖ przechowywanie i tworzenie kopii
zapasowych podczas badań
❖ wymogi prawne, kodeksy
postępowania
❖ udostępnianie i długotrwałe
przechowywanie danych
❖ zadania związane z zarządzaniem
danymi oraz zasoby
DMP w programie
Horyzont 2020
❖ sposób zajmowania się danymi
badawczymi podczas realizacji i po
zakończeniu projektu
❖ jakie dane będą zbierane,
wytwarzane, przetwarzane?
❖ jakie metodologie i standardy będą
używane?
❖ czy dane będą udostępniane w
sposób otwarty?
❖ jak dane będą przechowywane?
❖ uwzględnienie zasad FAIR
Data Management
Plan (DMP)
Ilustracja: The Data Management Expert Guide
by CESSDA ERIC, CC BY SA.
Dane w całym
cyklu projektu
badawczego
Zarządzanie danymi badawczymi to
sposób, w jaki organizujemy pracę z
danymi badawczymi w toku całego
projektu i po jego zakończeniu.
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Planowanie → DMP
❖ przemyślenie kwestii prawnych
na jak najwcześniejszym etapie
❖ przyjęcie jednolitego i spójnego
sposobu organizacji i
nazewnictwa plików
❖ wybór odpowiednich formatów
zapisu danych
❖ tworzenie dokumentacji
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Pozyskiwanie
❖ Jakie dane i w jaki sposób
będziemy pozyskiwać?
❖ Jakie standardy, metody i/lub
oprogramowanie posłużą do
pozyskiwania danych?
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Opis danych
➔ Rodzaj danych
dane liczbowe, tekstowe, wizualne,
audio, wideo, geolokalizacyjne...
➔ Źródło danych
sposób pozyskania/wytworzenia
danych: eksperyment, obserwacja,
symulacja…, wykorzystanie
istniejących danych
➔ Forma i format danych
➔ Rozmiar i złożoność danych
Dokumentacja i
analiza danych
❖ Co jest niezbędne do właściwego
zrozumienia danych?
❖ Dokumentacja ułatwia
odpowiednie zacytowanie i
ponowne wykorzystanie danych
❖ Osobne pliki z dokumentacją:
readme.txt
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Dokumentacja:
projekt
❖ W jakim celu/kontekście dane zostały
wytworzone? Kto i kiedy to zrobił?
❖ Jak dane zostały
wytworzone/pozyskane? Co zawierają
zestawy danych?
❖ Jak dane były
przetwarzane/opracowywane?
❖ Jakie zastosowano metody
sprawdzania jakości danych?
❖ Jakie dane nie zostały udostępnione i
dlaczego?
❖ Inne istotne elementy
Dokumentacja:
zestawy danych
❖ Opis przyjętego nazewnictwa,
skrótów, zmiennych, schematów
klasyfikacyjnych itp.
❖ Informacje o urządzeniach
pomiarowych, aparaturze, kalibracji,
ustawieniach, parametrach itp.
❖ Testy jakości
❖ Informacje o brakujących danych i
dodatkowe informacje
❖ Inne istotne elementy
Przechowywanie
❖ Jak bezpiecznie przechowywać
dane w czasie realizacji projektu?
❖ Jak zapewnić dostęp do danych
dla zespołu, osób uprawnionych?
❖ Tworzenie kopii zapasowych i
procedur kontroli danych.
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Udostępnianie
❖ Jakie dane jesteśmy zobowiązani
udostępnić?
❖ Jakie dane chcemy i mamy
możliwość udostępnić niezależnie
od zobowiązań?
❖ Na jakich zasadach udostępniamy
dane badawcze?
❖ Gdzie udostępnimy dane
badawcze?
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Archiwizacja
❖ Określenie zasad długotrwałego
przechowywania danych,
❖ Wybór danych do długotrwałej
archiwizacji,
❖ Okres przechowywania danych
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
Archiwizacja
❖ Określenie zasad długotrwałego
przechowywania danych
❖ Wybór danych do długotrwałej
archiwizacji
❖ Okres przechowywania danych
wytwarzanie/
pozyskanie
danych
dokumentacja
danych
analiza,
wykorzystanie
danych
przechowywanie
danych
udostępnianie
danych
archiwizacja
danych
https://www.ncn.gov.pl/sites/default/files/pliki/regulaminy/wytyczne_zarzadzanie_danymi.pdf
Zasady FAIR w zarządzaniu
danymi badawczymi
Grafika pełnoekranowa
Sungya Pundir, Wikimedia Commons, CC BY-SA 4.0,
https://en.wikipedia.org/wiki/FAIR_data#/media/File:FAIR_data_principles.jpg
FAIR w politykach otwartości
❖ Polityka Komisji Europejskiej, Horyzont
2020 (zasady FAIR uwzględnione w
DMP),
❖ Dyrektywa o otwartych danych i
ponownym wykorzystywaniu informacji
sektora publicznego,
❖ wytyczne Narodowego Centrum Nauki
do sporządzania DMP
https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
2.2 Definition of FAIR The FAIR guiding principles: https://doi.org/10.1038/sdata.2016.18
To be Findable:
F1. (meta)data are assigned a globally unique and persistent identifier
F2. data are described with rich metadata (defined by R1 below)
F3. metadata clearly and explicitly include the identifier of the data it describes
F4. (meta)data are registered or indexed in a searchable resource
To be Accessible:
A1. (meta)data are retrievable by their identifier using a standardized communications protocol
A1.1. the protocol is free, open and universally implementable
A1.2. the protocol allows for an authentication and authorization procedure, where necessary
A2. metadata are accessible, even when the data are no longer available
To be Interoperable:
I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation
I2. (meta)data uses vocabularies that follow FAIR principles
I3. (meta)data include qualified references to other (meta)data
To be reusable:
R1. (meta)data are richly described with a plurality of accurate and relevant attributes
R1.1. (meta)data are released with a clear and accessible data usage license
R1.2. (meta)data are associated with data provenance
R1.3. (meta)data meet domain relevant community standards
https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
2.2 Definition of FAIR The FAIR guiding principles: https://doi.org/10.1038/sdata.2016.18
To be Findable:
F1. (meta)data are assigned a globally unique and persistent identifier
F2. data are described with rich metadata (defined by R1 below)
F3. metadata clearly and explicitly include the identifier of the data it describes
F4. (meta)data are registered or indexed in a searchable resource
To be Accessible:
A1. (meta)data are retrievable by their identifier using a standardized communications protocol
A1.1. the protocol is free, open and universally implementable
A1.2. the protocol allows for an authentication and authorization procedure, where necessary
A2. metadata are accessible, even when the data are no longer available
To be Interoperable:
I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation
I2. (meta)data uses vocabularies that follow FAIR principles
I3. (meta)data include qualified references to other (meta)data
To be reusable:
R1. (meta)data are richly described with a plurality of accurate and relevant attributes
R1.1. (meta)data are released with a clear and accessible data usage license
R1.2. (meta)data are associated with data provenance
R1.3. (meta)data meet domain relevant community standards
https://www.go-fair.org/fair-principles/
FAIR
self-assesment tool
https://ardc.edu.au/resources/working-with-data/fair-data/fair-self-assessment-tool/
Findable
Czy dane opatrzone zostaną
metadanymi? Czy będą opisane
zgodnie z przyjętymi standardami?
Czy dane będą posiadać trwałe
identyfikatory (DOI)?
Czy (meta)dane będą zamieszczone
lub indeksowane w serwisie, którego
zasoby można przeszukiwać?
http://www.dcc.ac.uk/resources/metadata-standards
Accesible
Które dane zostaną udostępnione
w sposób otwarty? Jeśli część danych
nie może zostać udostępniona -
dlaczego? Czy w takiej sytuacji
udostępnione zostaną metadane?
W jaki sposób i gdzie dane zostaną
udostępnione? Czy warunki dostępu
będą jasno określone?
FAIR jako
kontinuum
FAIR a otwartość
Turning FAIR into reality. Final Report and Action Plan from the European
Commission Expert Group on FAIR Data. European Union, 2018.
https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
Formaty plików
W jakich formatach zostaną zapisane dane?
Czy wymagają specjalnego, płatnego
oprogramowania? Czy będzie można
skorzystać z nich w przyszłości?
❖ rekomendowane: formaty otwarte,
bezstratne,
❖ akceptowane: formaty powszechnie
używane https://www.ukdataservice.ac.uk/manage-data/forma
t/recommended-formats.aspx
Interoperable
Czy możliwe będzie połączenie
danych z innymi zbiorami
pochodzącymi z innych źródeł?
https://public.flourish.studio/visualisation/213291/?utm_source=embed&utm_campaign=visualisation/213291
Rola dokumentacji
Czy do danych dołączona zostanie
dokumentacja? Czy wskazane
zostanie źródło (pochodzenie)
danych: kto i w jaki sposób je
wytworzył? Jak były przetwarzane?
Czy zawierają dane z innych źródeł?
Reusable
Czy dane zostaną opatrzone licencją,
która pozwoli na ich ponowne
wykorzystanie w stopniu tak
szerokim jak to możliwe?
Czy sposób pozyskiwania danych i
kontekst, w jakim zostały
wytworzone zostały dostatecznie
dobrze opisane?
Licencje Creative Commons - trzy warstwy:
● tekst prawny,
● przystępne podsumowanie,
● dane (kod) do odczytu maszynowego.
Unusable data „otwarty zbiór danych”
„dane publicznie dostępne”
„dane ogólnodostępne”
„brak ograniczeń”
„freely available”
„dane dostępne na licencji Creative
Commons”
Grafika pełnoekranowa
https://www.natureindex.com/news-blog/what-scientists-need-to-know-about-fair-data
➔ “FAIR means thinking about
the people who could benefit
from your data,”
➔ FAIR can also be good for
career advancement,
particularly for early-career
researchers.
➔ “FAIR helps you demonstrate
the impact of your research
when people re-use and cite
your dataset,” (...) “It gets your
name out there and can lead
to new collaborations.”
Grafika pełnoekranowa
https://researchdata.springernature.com/channels/2428-updates-in-data/posts/59542-4-barriers-to-an-open-data-world
➔ Most labs have developed their
own individual, non-standardised
data collection and storage
practices. This culminates in
poorly-named files (saved in a
hurry on shared drives) or a
whirlwind of different file types.
➔ Without clear information on
experimental conditions, data
collection methods and so on,
reproducibility is reduced.
➔ Knapen identified a gap in the
open science pipeline - the
methodology of data analysis or
experimentation are not well
documented.
Barrier 1: Non-standard practices
Barrier 2: Incomplete metadata
Barrier 3: Data security
Barrier 4: The methodology blackbox
Researchers need more training for open
science, regardless of career stage.
Infrastruktura służąca do
przechowywania i udostępniania
danych badawczych
Repozytoria danych badawczych
❖ bezpieczne długoterminowe przechowywanie danych,
❖ stały adres internetowy, możliwość uzyskania trwałego identyfikatora, np. DOI,
❖ łatwość wyszukiwania danych,
❖ łatwość cytowania danych,
❖ podstawowe statystyki, informacje o tym, jak często dane były pobierane i oglądane.
Grafika pełnoekranowa
Beneficjent projektu: Uniwersytet Warszawski,
jednostki realizujące: ICM UW, ISS UW
Partnerzy projektu: Instytut Filozofii i Socjologii PAN,
Uniwersytet Adama Mickiewicza w Poznaniu
Okres realizacji: 1 sierpnia 2018 r. - 31 lipca 2021 r.
Kwota dofinansowania: 4 998 889 PLN
(w tym UE 4 230 559,76 PLN,
budżet państwa 768 329,24 PLN).
RepOD
● Repozytorium otwarte dla wszystkich
zainteresowanych użytkowników.
● Zastąpi działającą pilotażową wersję repozytorium.
RDS: Repozytorium
Danych Społecznych
● Repozytorium otwarte dla wszystkich
zainteresowanych użytkowników.
● 400 zbiorów danych (jakościowych i ilościowych)
udostępnionych w ramach projektu.
MX-RDR: Repozytorium
Danych Krystalograficznych
● Repozytorium otwarte dla wszystkich
zainteresowanych użytkowników.
● 200 zbiorów surowych danych krystalograficznych
udostępnionych w ramach projektu.
Jak wybrać repozytorium?
1.
Repozytoria
dziedzinowe
2.
Repozytoria
instytucjonalne
3.
Repozytoria ogólnego
przeznaczenia
Jak wybrać repozytorium?
4. Katalog
repozytoriów danych
ponad 2 400
repozytoriów
możliwość przeszukiwania
katalogu wg różnych
kryteriów
Data journals ❖ czasopisma publikujące opisy
zestawów danych badawczych,
❖ artykuły są recenzowane, czasopisma
działają na wzór tradycyjnych
czasopism publikujących artykuły,
❖ zestawy danych zwykle deponowane
są w repozytoriach, czasami
publikowane jako załączniki do
artykułu
Open Research Data Pilot
w PR UE Horyzont 2020
Polityka Komisji
Europejskiej
„Komisja Europejska jest przekonana, że
nie powinno się płacić za dostęp lub
wykorzystanie informacji, których
uzyskanie zostało już sfinansowane z
publicznych pieniędzy. Europejskie
przedsiębiorstwa i obywatele powinni
móc w pełni z nich korzystać.”
https://ec.europa.eu/research/participants/data/ref/h
2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-g
uide_en.pdf
Horyzont 2020:
polityka otwartości
Otwarte udostępnianie publikacji:
❖ wszystkie recenzowane publikacje
naukowe,
❖ wersje: opublikowana lub
zaakceptowana do druku po
ostatecznej recenzji i poprawkach,
❖ w repozytorium,
❖ natychmiast (publikacja open
access) lub najpóźniej 6 miesięcy po
publikacji /12 miesięcy dla nauk
społecznych i humanistycznych/
PUBLIKACJE
Horyzont 2020:
polityka otwartości
Dwa elementy:
❖ sporządzanie planu zarządzania
danymi badawczymi,
❖ udostępnianie danych, w takim
zakresie w jakim jest to możliwe
DANE BADAWCZE
Dane
badawcze
Udostępnianie co
najmniej w zakresie
wymaganym do
weryfikacji wyników
badań zaprezentowanych
w publikacjach
naukowych.
https://www.openaire.eu/how-to-comply-to-h2020-mandates-for-data
Dane badawcze
➔ open by default
➔ as open as possible,
as closed as
necessary
➔ zasady FAIR
Ilustracja: OpenAIRE CC BY,
https://www.exeter.ac.uk/research/openresearc
h/opendata
Opt-out
➔ w uzasadnionych
sytuacjach,
➔ można z niej
skorzystać na
każdym etapie
Broszury informacyjne
https://drodb.icm.edu.pl/materialy-2/
https://www.openaire.eu/
Kontakt
Platforma Otwartej Nauki
pon@icm.edu.pl
Natalia Gruenpeter
n.gruenpeter@icm.edu.pl

Weitere ähnliche Inhalte

Ähnlich wie Praktyczne aspekty udostępniania danych badawczych

Information literacy w bibliotekach akademickich standardy
Information literacy w bibliotekach akademickich   standardyInformation literacy w bibliotekach akademickich   standardy
Information literacy w bibliotekach akademickich standardy
Ewa Rozkosz
 
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
Open Data Support
 
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
Sabina Cisek
 

Ähnlich wie Praktyczne aspekty udostępniania danych badawczych (20)

Information literacy w bibliotekach akademickich standardy
Information literacy w bibliotekach akademickich   standardyInformation literacy w bibliotekach akademickich   standardy
Information literacy w bibliotekach akademickich standardy
 
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
D2.1.2 training module 2.1 the linked open government data lifecycle v1.00
 
Badania Ewaluacyjne 2
Badania Ewaluacyjne 2Badania Ewaluacyjne 2
Badania Ewaluacyjne 2
 
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
 
Dane badawcze: warsztaty dla redaktorów i wydawców
Dane badawcze: warsztaty dla redaktorów i wydawcówDane badawcze: warsztaty dla redaktorów i wydawców
Dane badawcze: warsztaty dla redaktorów i wydawców
 
Zachowania związane z indywidualnym zarządzaniem wiedzą i informacją – w świe...
Zachowania związane z indywidualnym zarządzaniem wiedzą i informacją – w świe...Zachowania związane z indywidualnym zarządzaniem wiedzą i informacją – w świe...
Zachowania związane z indywidualnym zarządzaniem wiedzą i informacją – w świe...
 
Personal Knowledge and Information Management. Research results. Part 2
Personal Knowledge and Information Management. Research results. Part 2Personal Knowledge and Information Management. Research results. Part 2
Personal Knowledge and Information Management. Research results. Part 2
 
Michał Korzycki @ SFI
Michał Korzycki @ SFIMichał Korzycki @ SFI
Michał Korzycki @ SFI
 
Polityka otwartego dostępu, Uniwersytet Gdański
Polityka otwartego dostępu, Uniwersytet GdańskiPolityka otwartego dostępu, Uniwersytet Gdański
Polityka otwartego dostępu, Uniwersytet Gdański
 
Instytucjonalne polityki otwartości w Polsce, OpenAIRE
Instytucjonalne polityki otwartości w Polsce, OpenAIREInstytucjonalne polityki otwartości w Polsce, OpenAIRE
Instytucjonalne polityki otwartości w Polsce, OpenAIRE
 
Monitoring Krok Za Krokiem
Monitoring Krok Za KrokiemMonitoring Krok Za Krokiem
Monitoring Krok Za Krokiem
 
Otwarta Nauka w pigułce 06-2017
Otwarta Nauka w pigułce 06-2017Otwarta Nauka w pigułce 06-2017
Otwarta Nauka w pigułce 06-2017
 
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
Infobrokering – praktyczne podejście do optymalnego wykorzystywania narzędzi ...
 
Big data w strategii marketingowej
Big data w strategii marketingowejBig data w strategii marketingowej
Big data w strategii marketingowej
 
Wdrożenia Big Data - Seminarium
Wdrożenia Big Data - SeminariumWdrożenia Big Data - Seminarium
Wdrożenia Big Data - Seminarium
 
"Polskie repozytoria w OpenAIRE – czy warto się rejestrować?" - warsztaty, 27...
"Polskie repozytoria w OpenAIRE – czy warto się rejestrować?" - warsztaty, 27..."Polskie repozytoria w OpenAIRE – czy warto się rejestrować?" - warsztaty, 27...
"Polskie repozytoria w OpenAIRE – czy warto się rejestrować?" - warsztaty, 27...
 
Polityka otwartości, Międzynarodowy Instytut Biologii Molekularnej i Komórkow...
Polityka otwartości, Międzynarodowy Instytut Biologii Molekularnej i Komórkow...Polityka otwartości, Międzynarodowy Instytut Biologii Molekularnej i Komórkow...
Polityka otwartości, Międzynarodowy Instytut Biologii Molekularnej i Komórkow...
 
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
 
Publikuj i nie zgiń_lsu_mast
Publikuj i nie zgiń_lsu_mastPublikuj i nie zgiń_lsu_mast
Publikuj i nie zgiń_lsu_mast
 
Individualne srodowisko uczenia sie - niebedne kompetencje
Individualne srodowisko uczenia sie - niebedne kompetencjeIndividualne srodowisko uczenia sie - niebedne kompetencje
Individualne srodowisko uczenia sie - niebedne kompetencje
 

Mehr von Platforma Otwartej Nauki

Mehr von Platforma Otwartej Nauki (20)

Umowy dot. autorskich praw majątkowych w praktyce wydawców książek naukowych
Umowy dot. autorskich praw majątkowych w praktyce wydawców książek naukowychUmowy dot. autorskich praw majątkowych w praktyce wydawców książek naukowych
Umowy dot. autorskich praw majątkowych w praktyce wydawców książek naukowych
 
Prawne aspekty otwartego dostępu
Prawne aspekty otwartego dostępuPrawne aspekty otwartego dostępu
Prawne aspekty otwartego dostępu
 
Monografie Naukowe - Uniwersytet Śląski
Monografie Naukowe - Uniwersytet ŚląskiMonografie Naukowe - Uniwersytet Śląski
Monografie Naukowe - Uniwersytet Śląski
 
DSpace - doświadczenia Repozytorium Uniwersytetu Łódzkiego
DSpace - doświadczenia Repozytorium Uniwersytetu ŁódzkiegoDSpace - doświadczenia Repozytorium Uniwersytetu Łódzkiego
DSpace - doświadczenia Repozytorium Uniwersytetu Łódzkiego
 
Platforma czasopism Wydawnictwa Uniwersytetu Łódzkiego
Platforma czasopism Wydawnictwa Uniwersytetu ŁódzkiegoPlatforma czasopism Wydawnictwa Uniwersytetu Łódzkiego
Platforma czasopism Wydawnictwa Uniwersytetu Łódzkiego
 
Biblioteka Nauki - techniczne możliwości wymiany metadanych
Biblioteka Nauki - techniczne możliwości wymiany metadanychBiblioteka Nauki - techniczne możliwości wymiany metadanych
Biblioteka Nauki - techniczne możliwości wymiany metadanych
 
Monografie w Bibliotece Nauki
Monografie w Bibliotece Nauki Monografie w Bibliotece Nauki
Monografie w Bibliotece Nauki
 
Open Science Platform
Open Science PlatformOpen Science Platform
Open Science Platform
 
OpenAIRE Services for Open Science
OpenAIRE Services for Open ScienceOpenAIRE Services for Open Science
OpenAIRE Services for Open Science
 
Publikacje Ośrodka Badawczego Facta Ficta w Bibliotece Nauki
Publikacje Ośrodka Badawczego Facta Ficta w Bibliotece NaukiPublikacje Ośrodka Badawczego Facta Ficta w Bibliotece Nauki
Publikacje Ośrodka Badawczego Facta Ficta w Bibliotece Nauki
 
PRESSto Platfoma otwartych czasopism naukowych UAM
PRESSto Platfoma otwartych czasopism naukowych UAMPRESSto Platfoma otwartych czasopism naukowych UAM
PRESSto Platfoma otwartych czasopism naukowych UAM
 
Publikacje Instytutu Historii Ukrainy w Bibliotece Nauki
Publikacje Instytutu Historii Ukrainy w Bibliotece NaukiPublikacje Instytutu Historii Ukrainy w Bibliotece Nauki
Publikacje Instytutu Historii Ukrainy w Bibliotece Nauki
 
Polska Akademia Nauk a otwarta nauka
Polska Akademia Nauk a otwarta naukaPolska Akademia Nauk a otwarta nauka
Polska Akademia Nauk a otwarta nauka
 
Otwarty dostęp do publikacji naukowych GUS - doświadczenia i wyzwania
Otwarty dostęp do publikacji naukowych GUS - doświadczenia i wyzwaniaOtwarty dostęp do publikacji naukowych GUS - doświadczenia i wyzwania
Otwarty dostęp do publikacji naukowych GUS - doświadczenia i wyzwania
 
Making Open Access Book Funding Work Fairly
Making Open Access Book Funding Work FairlyMaking Open Access Book Funding Work Fairly
Making Open Access Book Funding Work Fairly
 
UCL Press. The UK's first fully open access university press
UCL Press. The UK's first fully open access university pressUCL Press. The UK's first fully open access university press
UCL Press. The UK's first fully open access university press
 
Funding open access books at Open Book Publishers
Funding open access books at Open Book PublishersFunding open access books at Open Book Publishers
Funding open access books at Open Book Publishers
 
Arianna Becerril García – Redalyc: A platform to advance non-commercial Open ...
Arianna Becerril García – Redalyc: A platform to advance non-commercial Open ...Arianna Becerril García – Redalyc: A platform to advance non-commercial Open ...
Arianna Becerril García – Redalyc: A platform to advance non-commercial Open ...
 
Abel L Packer – SciELO advances as an Open Science program
Abel L Packer – SciELO advances as an Open Science programAbel L Packer – SciELO advances as an Open Science program
Abel L Packer – SciELO advances as an Open Science program
 
Wsparcie naukowców w zakresie przygotowania planów zarządzania danymi badawcz...
Wsparcie naukowców w zakresie przygotowania planów zarządzania danymi badawcz...Wsparcie naukowców w zakresie przygotowania planów zarządzania danymi badawcz...
Wsparcie naukowców w zakresie przygotowania planów zarządzania danymi badawcz...
 

Praktyczne aspekty udostępniania danych badawczych

  • 1. Praktyczne aspekty udostępniania danych badawczych Natalia Gruenpeter Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego, Krajowe Biuro Otwartego Dostępu OpenAIRE CC-BY Treść licencji dostępna na stronie: https://creativecommons.org/licenses/by/4.0/legalcode.pl
  • 2. Plan wystąpienia • Udostępnianie danych badawczych – korzyści i polityki otwartości • Plan zarządzania danymi badawczymi (DMP) • Zasady FAIR w zarządzaniu danymi badawczymi • Infrastruktura służąca do przechowywania i udostępniania danych badawczych • Open Research Data Pilot w PR UE Horyzont 2020
  • 4. Deklaracja sorbońska 27.01.2020 w sprawie danych badawczych; podpisana przez przedstawicieli 9 sieci uniwersytetów badawczych z całego świata https://www.leru.org/files/Sorbonne-declaration.pdf
  • 6. Polityki otwartości ➔ mogą dotyczyć publikacji i/lub danych badawczych ➔ wymogi grantodawcy, np. Komisja Europejska, program Horyzont 2020 ➔ polityka przyjęta przez wydawcę czasopisma ➔ wymogi pracodawcy, uczelni lub instytutów naukowo-badawczych ➔ wymogi prawne: dane badawcze jako dane sektora publicznego w politykach otwartości zakres danych wymaganych do udostępnienia może być ograniczony do danych niezbędnych do weryfikacji wyników badań zaprezentowanych w publikacjach
  • 7. dane w formie nadającej się do odczytu maszynowego 6.06.2019 - dyrektywa zatwierdzona przez Radę Unii Europejskiej
  • 8. Dyrektywa w sprawie otwartych danych… https://eur-lex.europa.eu/legal-content/PL/TXT/PDF/?uri=CELEX:32019L1024&from=EN
  • 9. Dane badawcze w dyrektywie dot. udostępniania danych sektora publicznego „Dane badawcze” zdefiniowano jako „dokumenty w formie cyfrowej, inne niż publikacje naukowe, które są gromadzone lub opracowywane w ramach działalności badawczo-naukowej i są wykorzystywane jako dowody w procesie badawczym bądź też są powszechnie akceptowane w środowisku naukowym jako konieczne do weryfikacji poprawności ustaleń i wyników badań”. https://eur-lex.europa.eu/legal-content/PL/TXT/PDF/ ?uri=CELEX:32019L1024&from=EN
  • 10. Wymogi Narodowego Centrum Nauki sporządzanie planu zarządzania danymi badawczymi według wytycznych https://www.ncn.gov.pl/sites/default/file s/pliki/regulaminy/wytyczne_zarzadzani e_danymi.pdf
  • 11. plan zarządzania danymi badawczymi (DMP) - jako załącznik do wniosku o finansowanie projektu
  • 12. plan zarządzania danymi badawczymi (DMP) - jako załącznik do wniosku o finansowanie projektu
  • 13. Korzyści płynące z udostępniania danych ❖ dla społeczeństwa: rozwój społeczny i ekonomiczny, np. innowacje, rozwiązywanie globalnych problemów, ponowne wykorzystanie w innych kontekstach niż naukowy, ❖ dla nauki: przejrzystość, wiarygodność i integralność nauki, powtarzalność wyników badań, możliwość weryfikacji wyników badań i przeprowadzenia nowych analiz z wykorzystaniem udostępnionych danych, ❖ dla badaczy: promocja dorobku naukowego, możliwość powiązania danych z publikacją → większa widoczność i wpływ badań
  • 14. „W sytuacji braku jasnego i wiarygodnego sygnału, że naukowcy udostępniający zgromadzone przez siebie dane otrzymają za to uznanie, zrozumienie oraz nagrodę, trudno będzie podjąć ten wysiłek w sposób spontaniczny.” Bernard Rentier, Open Science, the Challenge of Transparency (2019)
  • 15. Zarządzanie danymi badawczymi ❖ właściwa organizacja danych: → ułatwia korzystanie z danych w przyszłości lub udostępnienie ich (np. na prośbę), → minimalizuje ryzyko w nieprzewidzianych sytuacjach (utrata lub zniszczenie danych/sprzętu) ❖ otwarte udostępnianie danych: → oszczędza czas, który trzeba poświęcić na obsługę wniosków o udostępnienie danych korzyści dla naukowców
  • 17. Udostępnianie danych badawczych: co należy wziąć pod uwagę? ❖ Do czego jesteśmy zobowiązani? ❖ Jaka jest wartość naukowa lub historyczna danych? ❖ Jak unikalne są nasze dane? Czy istnieje możliwość ich ponownego zebrania/wytworzenia? ❖ Czy dane mogą wykorzystać inni? ❖ Jakie koszty wiążą się z zarządzaniem i przechowywaniem danych? ❖ … ?
  • 19. Data Management Plan (DMP) ❖ różne wymogi → różne wzory; ❖ mogą być dostosowane do wymogów instytucji, grantodawcy ❖ żywy dokument, który może wspierać realizację projektu na każdym etapie: planowania, prowadzenia badań, upowszechniania wyników badań Formalny dokument, który zawiera zarys tego, co będziemy robić z danymi w trakcie projektu badawczego i po jego zakończeniu.
  • 20. DMP w wytycznych Narodowego Centrum Nauki ❖ opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych ❖ dokumentacja i jakość danych ❖ przechowywanie i tworzenie kopii zapasowych podczas badań ❖ wymogi prawne, kodeksy postępowania ❖ udostępnianie i długotrwałe przechowywanie danych ❖ zadania związane z zarządzaniem danymi oraz zasoby
  • 21. DMP w programie Horyzont 2020 ❖ sposób zajmowania się danymi badawczymi podczas realizacji i po zakończeniu projektu ❖ jakie dane będą zbierane, wytwarzane, przetwarzane? ❖ jakie metodologie i standardy będą używane? ❖ czy dane będą udostępniane w sposób otwarty? ❖ jak dane będą przechowywane? ❖ uwzględnienie zasad FAIR
  • 22. Data Management Plan (DMP) Ilustracja: The Data Management Expert Guide by CESSDA ERIC, CC BY SA.
  • 23. Dane w całym cyklu projektu badawczego Zarządzanie danymi badawczymi to sposób, w jaki organizujemy pracę z danymi badawczymi w toku całego projektu i po jego zakończeniu. wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 24. Planowanie → DMP ❖ przemyślenie kwestii prawnych na jak najwcześniejszym etapie ❖ przyjęcie jednolitego i spójnego sposobu organizacji i nazewnictwa plików ❖ wybór odpowiednich formatów zapisu danych ❖ tworzenie dokumentacji wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 25. Pozyskiwanie ❖ Jakie dane i w jaki sposób będziemy pozyskiwać? ❖ Jakie standardy, metody i/lub oprogramowanie posłużą do pozyskiwania danych? wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 26. Opis danych ➔ Rodzaj danych dane liczbowe, tekstowe, wizualne, audio, wideo, geolokalizacyjne... ➔ Źródło danych sposób pozyskania/wytworzenia danych: eksperyment, obserwacja, symulacja…, wykorzystanie istniejących danych ➔ Forma i format danych ➔ Rozmiar i złożoność danych
  • 27. Dokumentacja i analiza danych ❖ Co jest niezbędne do właściwego zrozumienia danych? ❖ Dokumentacja ułatwia odpowiednie zacytowanie i ponowne wykorzystanie danych ❖ Osobne pliki z dokumentacją: readme.txt wytwarzanie/ pozyskanie danych dokumentacja danych analiza danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 28. Dokumentacja: projekt ❖ W jakim celu/kontekście dane zostały wytworzone? Kto i kiedy to zrobił? ❖ Jak dane zostały wytworzone/pozyskane? Co zawierają zestawy danych? ❖ Jak dane były przetwarzane/opracowywane? ❖ Jakie zastosowano metody sprawdzania jakości danych? ❖ Jakie dane nie zostały udostępnione i dlaczego? ❖ Inne istotne elementy
  • 29. Dokumentacja: zestawy danych ❖ Opis przyjętego nazewnictwa, skrótów, zmiennych, schematów klasyfikacyjnych itp. ❖ Informacje o urządzeniach pomiarowych, aparaturze, kalibracji, ustawieniach, parametrach itp. ❖ Testy jakości ❖ Informacje o brakujących danych i dodatkowe informacje ❖ Inne istotne elementy
  • 30. Przechowywanie ❖ Jak bezpiecznie przechowywać dane w czasie realizacji projektu? ❖ Jak zapewnić dostęp do danych dla zespołu, osób uprawnionych? ❖ Tworzenie kopii zapasowych i procedur kontroli danych. wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 31. Udostępnianie ❖ Jakie dane jesteśmy zobowiązani udostępnić? ❖ Jakie dane chcemy i mamy możliwość udostępnić niezależnie od zobowiązań? ❖ Na jakich zasadach udostępniamy dane badawcze? ❖ Gdzie udostępnimy dane badawcze? wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 32. Archiwizacja ❖ Określenie zasad długotrwałego przechowywania danych, ❖ Wybór danych do długotrwałej archiwizacji, ❖ Okres przechowywania danych wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych
  • 33. Archiwizacja ❖ Określenie zasad długotrwałego przechowywania danych ❖ Wybór danych do długotrwałej archiwizacji ❖ Okres przechowywania danych wytwarzanie/ pozyskanie danych dokumentacja danych analiza, wykorzystanie danych przechowywanie danych udostępnianie danych archiwizacja danych https://www.ncn.gov.pl/sites/default/files/pliki/regulaminy/wytyczne_zarzadzanie_danymi.pdf
  • 34. Zasady FAIR w zarządzaniu danymi badawczymi
  • 35. Grafika pełnoekranowa Sungya Pundir, Wikimedia Commons, CC BY-SA 4.0, https://en.wikipedia.org/wiki/FAIR_data#/media/File:FAIR_data_principles.jpg
  • 36. FAIR w politykach otwartości ❖ Polityka Komisji Europejskiej, Horyzont 2020 (zasady FAIR uwzględnione w DMP), ❖ Dyrektywa o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego, ❖ wytyczne Narodowego Centrum Nauki do sporządzania DMP https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
  • 37. https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf 2.2 Definition of FAIR The FAIR guiding principles: https://doi.org/10.1038/sdata.2016.18 To be Findable: F1. (meta)data are assigned a globally unique and persistent identifier F2. data are described with rich metadata (defined by R1 below) F3. metadata clearly and explicitly include the identifier of the data it describes F4. (meta)data are registered or indexed in a searchable resource To be Accessible: A1. (meta)data are retrievable by their identifier using a standardized communications protocol A1.1. the protocol is free, open and universally implementable A1.2. the protocol allows for an authentication and authorization procedure, where necessary A2. metadata are accessible, even when the data are no longer available To be Interoperable: I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation I2. (meta)data uses vocabularies that follow FAIR principles I3. (meta)data include qualified references to other (meta)data To be reusable: R1. (meta)data are richly described with a plurality of accurate and relevant attributes R1.1. (meta)data are released with a clear and accessible data usage license R1.2. (meta)data are associated with data provenance R1.3. (meta)data meet domain relevant community standards
  • 38. https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf 2.2 Definition of FAIR The FAIR guiding principles: https://doi.org/10.1038/sdata.2016.18 To be Findable: F1. (meta)data are assigned a globally unique and persistent identifier F2. data are described with rich metadata (defined by R1 below) F3. metadata clearly and explicitly include the identifier of the data it describes F4. (meta)data are registered or indexed in a searchable resource To be Accessible: A1. (meta)data are retrievable by their identifier using a standardized communications protocol A1.1. the protocol is free, open and universally implementable A1.2. the protocol allows for an authentication and authorization procedure, where necessary A2. metadata are accessible, even when the data are no longer available To be Interoperable: I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation I2. (meta)data uses vocabularies that follow FAIR principles I3. (meta)data include qualified references to other (meta)data To be reusable: R1. (meta)data are richly described with a plurality of accurate and relevant attributes R1.1. (meta)data are released with a clear and accessible data usage license R1.2. (meta)data are associated with data provenance R1.3. (meta)data meet domain relevant community standards https://www.go-fair.org/fair-principles/
  • 40. Findable Czy dane opatrzone zostaną metadanymi? Czy będą opisane zgodnie z przyjętymi standardami? Czy dane będą posiadać trwałe identyfikatory (DOI)? Czy (meta)dane będą zamieszczone lub indeksowane w serwisie, którego zasoby można przeszukiwać? http://www.dcc.ac.uk/resources/metadata-standards
  • 41. Accesible Które dane zostaną udostępnione w sposób otwarty? Jeśli część danych nie może zostać udostępniona - dlaczego? Czy w takiej sytuacji udostępnione zostaną metadane? W jaki sposób i gdzie dane zostaną udostępnione? Czy warunki dostępu będą jasno określone?
  • 42. FAIR jako kontinuum FAIR a otwartość Turning FAIR into reality. Final Report and Action Plan from the European Commission Expert Group on FAIR Data. European Union, 2018. https://ec.europa.eu/info/sites/info/files/turning_fair_into_reality_1.pdf
  • 43. Formaty plików W jakich formatach zostaną zapisane dane? Czy wymagają specjalnego, płatnego oprogramowania? Czy będzie można skorzystać z nich w przyszłości? ❖ rekomendowane: formaty otwarte, bezstratne, ❖ akceptowane: formaty powszechnie używane https://www.ukdataservice.ac.uk/manage-data/forma t/recommended-formats.aspx
  • 44. Interoperable Czy możliwe będzie połączenie danych z innymi zbiorami pochodzącymi z innych źródeł? https://public.flourish.studio/visualisation/213291/?utm_source=embed&utm_campaign=visualisation/213291
  • 45. Rola dokumentacji Czy do danych dołączona zostanie dokumentacja? Czy wskazane zostanie źródło (pochodzenie) danych: kto i w jaki sposób je wytworzył? Jak były przetwarzane? Czy zawierają dane z innych źródeł?
  • 46. Reusable Czy dane zostaną opatrzone licencją, która pozwoli na ich ponowne wykorzystanie w stopniu tak szerokim jak to możliwe? Czy sposób pozyskiwania danych i kontekst, w jakim zostały wytworzone zostały dostatecznie dobrze opisane? Licencje Creative Commons - trzy warstwy: ● tekst prawny, ● przystępne podsumowanie, ● dane (kod) do odczytu maszynowego.
  • 47. Unusable data „otwarty zbiór danych” „dane publicznie dostępne” „dane ogólnodostępne” „brak ograniczeń” „freely available” „dane dostępne na licencji Creative Commons”
  • 48. Grafika pełnoekranowa https://www.natureindex.com/news-blog/what-scientists-need-to-know-about-fair-data ➔ “FAIR means thinking about the people who could benefit from your data,” ➔ FAIR can also be good for career advancement, particularly for early-career researchers. ➔ “FAIR helps you demonstrate the impact of your research when people re-use and cite your dataset,” (...) “It gets your name out there and can lead to new collaborations.”
  • 49. Grafika pełnoekranowa https://researchdata.springernature.com/channels/2428-updates-in-data/posts/59542-4-barriers-to-an-open-data-world ➔ Most labs have developed their own individual, non-standardised data collection and storage practices. This culminates in poorly-named files (saved in a hurry on shared drives) or a whirlwind of different file types. ➔ Without clear information on experimental conditions, data collection methods and so on, reproducibility is reduced. ➔ Knapen identified a gap in the open science pipeline - the methodology of data analysis or experimentation are not well documented. Barrier 1: Non-standard practices Barrier 2: Incomplete metadata Barrier 3: Data security Barrier 4: The methodology blackbox Researchers need more training for open science, regardless of career stage.
  • 50. Infrastruktura służąca do przechowywania i udostępniania danych badawczych
  • 51. Repozytoria danych badawczych ❖ bezpieczne długoterminowe przechowywanie danych, ❖ stały adres internetowy, możliwość uzyskania trwałego identyfikatora, np. DOI, ❖ łatwość wyszukiwania danych, ❖ łatwość cytowania danych, ❖ podstawowe statystyki, informacje o tym, jak często dane były pobierane i oglądane.
  • 52. Grafika pełnoekranowa Beneficjent projektu: Uniwersytet Warszawski, jednostki realizujące: ICM UW, ISS UW Partnerzy projektu: Instytut Filozofii i Socjologii PAN, Uniwersytet Adama Mickiewicza w Poznaniu Okres realizacji: 1 sierpnia 2018 r. - 31 lipca 2021 r. Kwota dofinansowania: 4 998 889 PLN (w tym UE 4 230 559,76 PLN, budżet państwa 768 329,24 PLN).
  • 53. RepOD ● Repozytorium otwarte dla wszystkich zainteresowanych użytkowników. ● Zastąpi działającą pilotażową wersję repozytorium.
  • 54. RDS: Repozytorium Danych Społecznych ● Repozytorium otwarte dla wszystkich zainteresowanych użytkowników. ● 400 zbiorów danych (jakościowych i ilościowych) udostępnionych w ramach projektu.
  • 55. MX-RDR: Repozytorium Danych Krystalograficznych ● Repozytorium otwarte dla wszystkich zainteresowanych użytkowników. ● 200 zbiorów surowych danych krystalograficznych udostępnionych w ramach projektu.
  • 57. Jak wybrać repozytorium? 4. Katalog repozytoriów danych ponad 2 400 repozytoriów możliwość przeszukiwania katalogu wg różnych kryteriów
  • 58. Data journals ❖ czasopisma publikujące opisy zestawów danych badawczych, ❖ artykuły są recenzowane, czasopisma działają na wzór tradycyjnych czasopism publikujących artykuły, ❖ zestawy danych zwykle deponowane są w repozytoriach, czasami publikowane jako załączniki do artykułu
  • 59. Open Research Data Pilot w PR UE Horyzont 2020
  • 60. Polityka Komisji Europejskiej „Komisja Europejska jest przekonana, że nie powinno się płacić za dostęp lub wykorzystanie informacji, których uzyskanie zostało już sfinansowane z publicznych pieniędzy. Europejskie przedsiębiorstwa i obywatele powinni móc w pełni z nich korzystać.” https://ec.europa.eu/research/participants/data/ref/h 2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-g uide_en.pdf
  • 61. Horyzont 2020: polityka otwartości Otwarte udostępnianie publikacji: ❖ wszystkie recenzowane publikacje naukowe, ❖ wersje: opublikowana lub zaakceptowana do druku po ostatecznej recenzji i poprawkach, ❖ w repozytorium, ❖ natychmiast (publikacja open access) lub najpóźniej 6 miesięcy po publikacji /12 miesięcy dla nauk społecznych i humanistycznych/ PUBLIKACJE
  • 62. Horyzont 2020: polityka otwartości Dwa elementy: ❖ sporządzanie planu zarządzania danymi badawczymi, ❖ udostępnianie danych, w takim zakresie w jakim jest to możliwe DANE BADAWCZE
  • 63. Dane badawcze Udostępnianie co najmniej w zakresie wymaganym do weryfikacji wyników badań zaprezentowanych w publikacjach naukowych. https://www.openaire.eu/how-to-comply-to-h2020-mandates-for-data
  • 64. Dane badawcze ➔ open by default ➔ as open as possible, as closed as necessary ➔ zasady FAIR Ilustracja: OpenAIRE CC BY, https://www.exeter.ac.uk/research/openresearc h/opendata
  • 65. Opt-out ➔ w uzasadnionych sytuacjach, ➔ można z niej skorzystać na każdym etapie
  • 68. Kontakt Platforma Otwartej Nauki pon@icm.edu.pl Natalia Gruenpeter n.gruenpeter@icm.edu.pl