SlideShare ist ein Scribd-Unternehmen logo
Webinar: Repository Nutzungsstatistiken und
der Open Research Analytics Service
Paul Borchert, GBV
Jochen Schirrwagen, UB-Bielefeld / OpenAIRE
Max Mosterd, Knowledge Unlatched
Übersicht
• Rückblende OA-Statistik
• electronic Publication Statistics – neue
Entwicklungen beim gbv
• OpenAIRE Usage Statistics – Stand und Ausblick
• Open Research Analytics Service – Community-
Projekt initiiert von Knowledge Unlatched
Rückblende OA-Statistik (OAS)
• Gestartet als DFG-Projekt mit zwei Förderphasen
2008 – 2013
• Unterstützt von DINI
• Ziel: Infrastruktur für standardisierte, international
vergleichbare Nutzungsstatistiken
• Aufbauend auf OAI-PMH als Transferprotokoll und
OpenURL ContextObjects als XML-Format
• Generierung von COUNTER R4 Reports
• Machbarkeitsstudie
https://dini.de/fileadmin/oa-statistik/Machbarkeitsstudie/OAS-
Machbarkeitsstudie.pdf
Rückblende OA-Statistik (OAS)
• Ab 2015 Inbetriebnahme als Dienst bei der
Verbundzentrale des GBV
• Abgestuftes Gebührenmodell für Teilnehmer
(Stand 2017)
• Nach Anzahl der Records: 160 – 470 EUR / annum
• Incl. OAS-Widget: 180 – 510 EUR / annum
• Eingeschränkte Nachnutzbarkeit der Statistiken
wegen CC-BY-NC-SA 3.0 Lizenz
• Teilnehmer: KOBV & BSZ: OPUS-Hosting, sowie 7
weitere Einrichtungen
OAS-Userinterface
OAS-API und
Einbettung mit OAS-Widget
Open-Access-Statistik (OAS)
• Beendigung von OAS zum 31.12.2019
• extremer Speicherplatzbedarf
• aufwändige Dienstbetreuung
• Intransparenz der ermittelten Zugriffszahlen
• Einnahmen- Aufwandverhältnis
OAS-Abwicklung
• kein umfassender Support mehr
• für ehemalige Nutzer
• lokale Weiternutzung der OAS Software
• Datenübernahme durch Dumps der
Datenbanktabellen oder über die OAS-API
OAS Nachfolger
• Eigenentwicklung für die Reposis – Repositoren
• Open Source
• neues Konzept zum Parsen der Logfiles
• OAS kompatible API
• neue REST-API (in der Entwicklung)
• Zusammenarbeit mit KOBV und BSZ
ePuSta
• electronic Publications Statistics
• ehm. ReposAS
• ePuSta-logfileparser
• https://github.com/gbv/ePuSta-logfileparser/
• Skriptbibliothek zur Erzeugung von angereicherten
Logfiles
• ePuSta-Server
• https://github.com/gbv/ePuSta-Server/
• Speicherung der Zugriffe SOLR
• OAS kompatible API
feel free to
- watch
- write issues
- commit
- fork
Roadmap
3.Q 2019 1 produktives Repository über OAS kompatible API
(perspectivia.net) (MyCoRe)
4.Q 2019 KOBV/BSZ für OPUS, OAS kompatible API
4.Q 2019 Umzug aller Reposis- Repositorien
- Verbesserung des logfileparser
2020 2020 neue REST-API und Oberfläche
- Nachvollziehbarkeit
Architektur
access.log
access.epusta.log
logfileparser
SOLR
OAS -API
REST-API
ePuSta-Server
OpenAIRE- usage-
statistics Sushi
Anreicherung der Logfiles
• markieren jeder Logzeile durch eine UUID
• Anreicherung mit statitikrelvanten
Informationen
• ID der Publikation, Art des Zugriffs, SessionID
• Textdatei (.epusta.log)
Anreicherung der Logfiles
access.log
apache2epusta.sh
access.epusta.log
access.epusta.log
createSessionID.sh
annonymize.sh access.epusta.log
*.sh
- UUID
- ePuSta Format
- Entfernen von personenbezogenen Daten
- Entfernen unwichtigen Loginformationen
- Profilvermeidung
- wiederholte Anreicherung
Repository
Anreicherung der Logfiles
cat test.log | ./log2epusta.php | ./addIdentifier.php | ./filter.php > test.epusta.log
• einfacher
• transparenter
Motivation Usage Statistics in
OpenAIRE
• Monitoring und Analyse über Nutzungsereignisse in OA-
Repositorien
• Mehrwertdienst als Teil eines paneuropäischen
Forschungsinformationssystems
• Akkumulation von Nutzungszahlen über Dokumente, die in
mehreren Quellen vorliegen
• Dank Metadaten-Deduplizierung
• Generierung der Nutzungsstatistiken nach COUNTER CoP
R4 bzw. R5
• Bereitstellung der Statistiken unter CC0 Lizenz
• Beschreibung des Dienstes in den OpenAIRE Usage
Statistics Guidelines, https://openaire.github.io/usage-statistics-guidelines/
Usage Statistics Service als Teil
der OpenAIRE-Infrastruktur
Workflows zur Aggregation von
Nutzungsereignissen in OpenAIRE
Metadata-Index
UsageStatistics-DB
● Repository
● CRIS
● eJournal
● National Statistics
Node
● Publisher
PULL
COUNTER Report
PUSH
tracked
event
IP-Anonym.
processing script
processing script
In vier Schritten zum
Nutzungsstatistik-Dienst
• Voraussetzung: Registrierung des Repositories
im Contentprovider-Dashboard
1. Download des generischen Matomo Usage
Activity Tracker (https://github.com/openaire/Generic-Matomo-Tracker)
2. Konfiguration, z.B. Matomo-SiteID für die
eigene Quelle
3. Installation
4. Test und Validierung durch OpenAIRE
User-Interface im
Contentprovider-Dashboard
Unterstütze Reporttypen
(COUNTER R4)
Abfrageinterface (SUSHI-Lite)
Mögliches Migrationsszenario OAS
nach OpenAIRE Usage Statistics
• Betrifft bestehende OAS-Kunden; historische
Nutzungszahlen sollen nicht verloren gehen
1. Abruf via OAS-API bzw. Bereitstellung eines Dumps
der in OAS generierten COUNTER Reports (als CSV,
XML oder JSON)
2. Ggf. Transformation der OAS-COUNTER Reports in das
SUSHI-Lite Schema
3. (semi)automatischer Import in OpenAIRE-Usage
Statistics DB
Open Research Analytics Service
• OAS Nachfolger, Knowledge Unlatched zusammen mit OpenAIRE (und OpenAPC)
Wieso ORAS?
• Offene Infrastruktur zur Verbesserung der Interoperabilität
von Nutzungsdaten und Analysemöglichkeiten von
Repositorien
• Zusammenführung mehrerer, unterschiedlicher Datenquellen
(OpenAIRE metadata, OpenAPC, etc.)
• Zunächst Fokus auf die Integration von Nutzungsdaten von
OpenAIRE-Repositorien und die Entwicklung der ORAS Public
API.
Wieso ORAS?
Researcher
• Wie viele Downloads hat mein Artikel auf dem Repository?
Wie sieht das im Vergleich zu anderen Artikeln aus?
Repository Manager
• Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie
hoch ist die Rate und Nutzung meiner IR-Einzahlung im
Vergleich zu anderen IRs im Land?
Bibliotheksleitung
• Sind unsere Gold- und Hybridartikel auch im Repository
hinterlegt? Werden teurere Gold Open Access auch vermehrt
von unseren Kunden genutzt?
Reporting to researchers
• Stellen Sie den Forschern mit wenigen Klicks Berichte zur
Verfügung, die den Forschern Einblicke in die Verwendung
ihrer hinterlegten Gegenstände geben
Benchmarking IR to IR managers
• Wie kann ich die Einlagenrate meiner Forscher
erhöhen? Wie hoch ist die Rate und Nutzung
meiner IR-Einzahlung im Vergleich zu anderen
IRs im Land?
Total Usage
15th
of 160 DE repositories
No. of Items
50th
of 160 DE repositories
Deposit Rate
10th
of 160 DE repositories
Repository Benchmarking
OpenAPC and IR integration
• Sind unsere Gold- und Hybridartikel auch im
Repository hinterlegt? Werden teurere Gold
Open Access auch vermehrt von unseren
Kunden genutzt?
OpenAPC Benchmarking
Total APC paid in 2019
15th
of 160 DE institutions
No. of Items in 2019
4th
of 160 DE institutions
Deposit Rate APC Items
15th
of 160 DE institutions
Wie funktioniert ORAS?
• Nahtlose Integration mit OpenAIRE-konformen
Repositories (via SUSHI lite) und OpenAPC
• Anbindung anderer Nutzung Datenquellen
(COUNTER reports, Google Analytics, etc.)
• Beginnen Sie mit der Analyse und dem
Reporting.
International Community
Knowledge Unlatched
InstitutionInstitutionInstitution
Open Research
Analytics
(Membership
Interface)
Sustainable funding (Membership)
OpenAIRE OpenAPC Open Analytics
Advisory Board
Other third-Party
Integrations
Public Roadmap
Usage Data Trans. Data Interface
Funding flows to all projects to
maintain + expand scope and
features (roadmap)
Public Open Database (CC 0 licence)
Mitgliedschaftsmodell Deutschland
• Freemium Model
• Basic (OpenAIRE-only) = free
• Membership (ORAS) = setup fee (1.500 EUR) + annual fee (1.250 EUR p.a.)
• Vorteile einer Mitgliedschaft:
• 2019Q1 Zugriff auf Repository Nutzungsdaten nach COUNTER, generiert durch
OpenAIRE
• Entwicklung neuer analytischer Anwendungsfälle auf Basis von Open Repositories
als Teil einer internationalen Community.
• Generierung von Nutzungsreports für die eigene Einrichtung / Fakultäten;
Stimulierung einer verstärkten Nutzung des Repositories und Erhöhung der Zahl
von (Open Access) Deposits.
• Zugriff auf IR-Benchmarking-Berichte auf Basis unterschiedlicher Dimensionen
Roadmap
• Bis zum 1. Dezember Interesse anmelden (pledge),
um einen reibungslosen Zugang im ersten Quartal
2019 zu gewährleisten:
• Umstellung von GBV auf Open Research Analytics
(inklusive OpenAIRE usage data)
• OpenAIRE Metadaten-Aggregationsdienst
• Registrierung über OpenAIRE Content Provider-
Dashboard
• Registriere Interesse am Mitgliedschaftsmodell hier:
• https://app.knowledgeunlatched.org/ku-
partners/knowledge-unlatched/open-research-analytics
Q&A
GBV, OpenAIRE und Knowledge Unlatched

Weitere ähnliche Inhalte

Ähnlich wie Repository Usage Statistics and the Open Research Analytics Service

Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
redsys
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
Martin Blenkle
 
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
flimm
 
Apache Solr Revisited 2015
Apache Solr Revisited 2015Apache Solr Revisited 2015
Apache Solr Revisited 2015
Olivier Dobberkau
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios Workshop
Icinga
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Martin Kaltenböck
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)
Peter Mayr
 
Nutzungsstatistiken für Repositorien - das Projekt OA-Statistik
Nutzungsstatistiken für Repositorien - das Projekt OA-StatistikNutzungsstatistiken für Repositorien - das Projekt OA-Statistik
Nutzungsstatistiken für Repositorien - das Projekt OA-Statistik
Daniel Beucke
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
GESIS
 
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Michael Riehemann
 
EPO API/4 Cloud als innovativer SAP-Konnektor
EPO API/4 Cloud als innovativer SAP-KonnektorEPO API/4 Cloud als innovativer SAP-Konnektor
EPO API/4 Cloud als innovativer SAP-Konnektor
Wolfgang Hornung
 
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Leander Seige
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Dennis Zielke
 
Bibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
Bibliographien für alle - Neue Entwicklungen zur Öffnung der KatalogeBibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
Bibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
Jakob .
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Martin Kaltenböck
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
Universitätsbibliothek der Technischen Universität Berlin
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
Pascal-Nicolas Becker
 
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System ProjectSeige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Leander Seige
 
171211 kitodo
171211 kitodo171211 kitodo

Ähnlich wie Repository Usage Statistics and the Open Research Analytics Service (20)

Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
 
Apache Solr Revisited 2015
Apache Solr Revisited 2015Apache Solr Revisited 2015
Apache Solr Revisited 2015
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios Workshop
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)Literaturverwaltungssysteme im Überblick (2012)
Literaturverwaltungssysteme im Überblick (2012)
 
Nutzungsstatistiken für Repositorien - das Projekt OA-Statistik
Nutzungsstatistiken für Repositorien - das Projekt OA-StatistikNutzungsstatistiken für Repositorien - das Projekt OA-Statistik
Nutzungsstatistiken für Repositorien - das Projekt OA-Statistik
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
 
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
Entwicklung eines Webportals zur Anbindung von digitalen Bibliotheken (Vorste...
 
EPO API/4 Cloud als innovativer SAP-Konnektor
EPO API/4 Cloud als innovativer SAP-KonnektorEPO API/4 Cloud als innovativer SAP-Konnektor
EPO API/4 Cloud als innovativer SAP-Konnektor
 
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 
Bibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
Bibliographien für alle - Neue Entwicklungen zur Öffnung der KatalogeBibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
Bibliographien für alle - Neue Entwicklungen zur Öffnung der Kataloge
 
Ogc
OgcOgc
Ogc
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
 
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System ProjectSeige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System Project
 
171211 kitodo
171211 kitodo171211 kitodo
171211 kitodo
 

Mehr von OpenAIRE

10th OpenAIRE Content Providers Community Call
10th OpenAIRE Content Providers Community Call10th OpenAIRE Content Providers Community Call
10th OpenAIRE Content Providers Community Call
OpenAIRE
 
9th Content Providers Community Call\
9th Content Providers Community Call\9th Content Providers Community Call\
9th Content Providers Community Call\
OpenAIRE
 
OpenAIRE in the European Open Science Cloud (EOSC)
OpenAIRE in the European Open Science Cloud (EOSC)OpenAIRE in the European Open Science Cloud (EOSC)
OpenAIRE in the European Open Science Cloud (EOSC)
OpenAIRE
 
8th Content Providers Community Call
8th Content Providers Community Call8th Content Providers Community Call
8th Content Providers Community Call
OpenAIRE
 
7th Content Providers Community Call
7th Content Providers Community Call7th Content Providers Community Call
7th Content Providers Community Call
OpenAIRE
 
OpenAIRE PROVIDE Dashboard for Turkish repository managers
OpenAIRE PROVIDE Dashboard for Turkish repository managersOpenAIRE PROVIDE Dashboard for Turkish repository managers
OpenAIRE PROVIDE Dashboard for Turkish repository managers
OpenAIRE
 
What will it cost to manage and share my data?
What will it cost to manage and share my data?What will it cost to manage and share my data?
What will it cost to manage and share my data?
OpenAIRE
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
OpenAIRE
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
OpenAIRE
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
OpenAIRE
 
6th Content Providers Community Call
6th Content Providers Community Call6th Content Providers Community Call
6th Content Providers Community Call
OpenAIRE
 
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
OpenAIRE
 
20200504_Research Data & the GDPR: How Open is Open?
20200504_Research Data & the GDPR: How Open is Open?20200504_Research Data & the GDPR: How Open is Open?
20200504_Research Data & the GDPR: How Open is Open?
OpenAIRE
 
20200504_Data, Data Ownership and Open Science
20200504_Data, Data Ownership and Open Science20200504_Data, Data Ownership and Open Science
20200504_Data, Data Ownership and Open Science
OpenAIRE
 
20200429_Research Data & the GDPR: How Open is Open? (updated version)
20200429_Research Data & the GDPR: How Open is Open? (updated version)20200429_Research Data & the GDPR: How Open is Open? (updated version)
20200429_Research Data & the GDPR: How Open is Open? (updated version)
OpenAIRE
 
20200429_Data, Data Ownership and Open Science
20200429_Data, Data Ownership and Open Science20200429_Data, Data Ownership and Open Science
20200429_Data, Data Ownership and Open Science
OpenAIRE
 
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
OpenAIRE
 
COVID-19: Activities, tools, best practice and contact points in Greece
 COVID-19: Activities, tools, best practice and contact points in Greece COVID-19: Activities, tools, best practice and contact points in Greece
COVID-19: Activities, tools, best practice and contact points in Greece
OpenAIRE
 
5th Content Providers Community Call
5th Content Providers Community Call5th Content Providers Community Call
5th Content Providers Community Call
OpenAIRE
 
4th Content Providers Community Call
4th Content Providers Community Call4th Content Providers Community Call
4th Content Providers Community Call
OpenAIRE
 

Mehr von OpenAIRE (20)

10th OpenAIRE Content Providers Community Call
10th OpenAIRE Content Providers Community Call10th OpenAIRE Content Providers Community Call
10th OpenAIRE Content Providers Community Call
 
9th Content Providers Community Call\
9th Content Providers Community Call\9th Content Providers Community Call\
9th Content Providers Community Call\
 
OpenAIRE in the European Open Science Cloud (EOSC)
OpenAIRE in the European Open Science Cloud (EOSC)OpenAIRE in the European Open Science Cloud (EOSC)
OpenAIRE in the European Open Science Cloud (EOSC)
 
8th Content Providers Community Call
8th Content Providers Community Call8th Content Providers Community Call
8th Content Providers Community Call
 
7th Content Providers Community Call
7th Content Providers Community Call7th Content Providers Community Call
7th Content Providers Community Call
 
OpenAIRE PROVIDE Dashboard for Turkish repository managers
OpenAIRE PROVIDE Dashboard for Turkish repository managersOpenAIRE PROVIDE Dashboard for Turkish repository managers
OpenAIRE PROVIDE Dashboard for Turkish repository managers
 
What will it cost to manage and share my data?
What will it cost to manage and share my data?What will it cost to manage and share my data?
What will it cost to manage and share my data?
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 3)
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 2)
 
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
Open Research Gateway for the ELIXIR-GR Infrastructure (Part 1)
 
6th Content Providers Community Call
6th Content Providers Community Call6th Content Providers Community Call
6th Content Providers Community Call
 
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200504_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
 
20200504_Research Data & the GDPR: How Open is Open?
20200504_Research Data & the GDPR: How Open is Open?20200504_Research Data & the GDPR: How Open is Open?
20200504_Research Data & the GDPR: How Open is Open?
 
20200504_Data, Data Ownership and Open Science
20200504_Data, Data Ownership and Open Science20200504_Data, Data Ownership and Open Science
20200504_Data, Data Ownership and Open Science
 
20200429_Research Data & the GDPR: How Open is Open? (updated version)
20200429_Research Data & the GDPR: How Open is Open? (updated version)20200429_Research Data & the GDPR: How Open is Open? (updated version)
20200429_Research Data & the GDPR: How Open is Open? (updated version)
 
20200429_Data, Data Ownership and Open Science
20200429_Data, Data Ownership and Open Science20200429_Data, Data Ownership and Open Science
20200429_Data, Data Ownership and Open Science
 
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
20200429_OpenAIRE Legal Policy Webinar: GDPR and Sharing Data
 
COVID-19: Activities, tools, best practice and contact points in Greece
 COVID-19: Activities, tools, best practice and contact points in Greece COVID-19: Activities, tools, best practice and contact points in Greece
COVID-19: Activities, tools, best practice and contact points in Greece
 
5th Content Providers Community Call
5th Content Providers Community Call5th Content Providers Community Call
5th Content Providers Community Call
 
4th Content Providers Community Call
4th Content Providers Community Call4th Content Providers Community Call
4th Content Providers Community Call
 

Repository Usage Statistics and the Open Research Analytics Service

  • 1. Webinar: Repository Nutzungsstatistiken und der Open Research Analytics Service Paul Borchert, GBV Jochen Schirrwagen, UB-Bielefeld / OpenAIRE Max Mosterd, Knowledge Unlatched
  • 2. Übersicht • Rückblende OA-Statistik • electronic Publication Statistics – neue Entwicklungen beim gbv • OpenAIRE Usage Statistics – Stand und Ausblick • Open Research Analytics Service – Community- Projekt initiiert von Knowledge Unlatched
  • 3. Rückblende OA-Statistik (OAS) • Gestartet als DFG-Projekt mit zwei Förderphasen 2008 – 2013 • Unterstützt von DINI • Ziel: Infrastruktur für standardisierte, international vergleichbare Nutzungsstatistiken • Aufbauend auf OAI-PMH als Transferprotokoll und OpenURL ContextObjects als XML-Format • Generierung von COUNTER R4 Reports • Machbarkeitsstudie https://dini.de/fileadmin/oa-statistik/Machbarkeitsstudie/OAS- Machbarkeitsstudie.pdf
  • 4. Rückblende OA-Statistik (OAS) • Ab 2015 Inbetriebnahme als Dienst bei der Verbundzentrale des GBV • Abgestuftes Gebührenmodell für Teilnehmer (Stand 2017) • Nach Anzahl der Records: 160 – 470 EUR / annum • Incl. OAS-Widget: 180 – 510 EUR / annum • Eingeschränkte Nachnutzbarkeit der Statistiken wegen CC-BY-NC-SA 3.0 Lizenz • Teilnehmer: KOBV & BSZ: OPUS-Hosting, sowie 7 weitere Einrichtungen
  • 7. Open-Access-Statistik (OAS) • Beendigung von OAS zum 31.12.2019 • extremer Speicherplatzbedarf • aufwändige Dienstbetreuung • Intransparenz der ermittelten Zugriffszahlen • Einnahmen- Aufwandverhältnis
  • 8. OAS-Abwicklung • kein umfassender Support mehr • für ehemalige Nutzer • lokale Weiternutzung der OAS Software • Datenübernahme durch Dumps der Datenbanktabellen oder über die OAS-API
  • 9. OAS Nachfolger • Eigenentwicklung für die Reposis – Repositoren • Open Source • neues Konzept zum Parsen der Logfiles • OAS kompatible API • neue REST-API (in der Entwicklung) • Zusammenarbeit mit KOBV und BSZ
  • 10. ePuSta • electronic Publications Statistics • ehm. ReposAS • ePuSta-logfileparser • https://github.com/gbv/ePuSta-logfileparser/ • Skriptbibliothek zur Erzeugung von angereicherten Logfiles • ePuSta-Server • https://github.com/gbv/ePuSta-Server/ • Speicherung der Zugriffe SOLR • OAS kompatible API feel free to - watch - write issues - commit - fork
  • 11. Roadmap 3.Q 2019 1 produktives Repository über OAS kompatible API (perspectivia.net) (MyCoRe) 4.Q 2019 KOBV/BSZ für OPUS, OAS kompatible API 4.Q 2019 Umzug aller Reposis- Repositorien - Verbesserung des logfileparser 2020 2020 neue REST-API und Oberfläche - Nachvollziehbarkeit
  • 13. Anreicherung der Logfiles • markieren jeder Logzeile durch eine UUID • Anreicherung mit statitikrelvanten Informationen • ID der Publikation, Art des Zugriffs, SessionID • Textdatei (.epusta.log)
  • 14. Anreicherung der Logfiles access.log apache2epusta.sh access.epusta.log access.epusta.log createSessionID.sh annonymize.sh access.epusta.log *.sh - UUID - ePuSta Format - Entfernen von personenbezogenen Daten - Entfernen unwichtigen Loginformationen - Profilvermeidung - wiederholte Anreicherung Repository
  • 15. Anreicherung der Logfiles cat test.log | ./log2epusta.php | ./addIdentifier.php | ./filter.php > test.epusta.log • einfacher • transparenter
  • 16. Motivation Usage Statistics in OpenAIRE • Monitoring und Analyse über Nutzungsereignisse in OA- Repositorien • Mehrwertdienst als Teil eines paneuropäischen Forschungsinformationssystems • Akkumulation von Nutzungszahlen über Dokumente, die in mehreren Quellen vorliegen • Dank Metadaten-Deduplizierung • Generierung der Nutzungsstatistiken nach COUNTER CoP R4 bzw. R5 • Bereitstellung der Statistiken unter CC0 Lizenz • Beschreibung des Dienstes in den OpenAIRE Usage Statistics Guidelines, https://openaire.github.io/usage-statistics-guidelines/
  • 17. Usage Statistics Service als Teil der OpenAIRE-Infrastruktur
  • 18. Workflows zur Aggregation von Nutzungsereignissen in OpenAIRE Metadata-Index UsageStatistics-DB ● Repository ● CRIS ● eJournal ● National Statistics Node ● Publisher PULL COUNTER Report PUSH tracked event IP-Anonym. processing script processing script
  • 19. In vier Schritten zum Nutzungsstatistik-Dienst • Voraussetzung: Registrierung des Repositories im Contentprovider-Dashboard 1. Download des generischen Matomo Usage Activity Tracker (https://github.com/openaire/Generic-Matomo-Tracker) 2. Konfiguration, z.B. Matomo-SiteID für die eigene Quelle 3. Installation 4. Test und Validierung durch OpenAIRE
  • 23. Mögliches Migrationsszenario OAS nach OpenAIRE Usage Statistics • Betrifft bestehende OAS-Kunden; historische Nutzungszahlen sollen nicht verloren gehen 1. Abruf via OAS-API bzw. Bereitstellung eines Dumps der in OAS generierten COUNTER Reports (als CSV, XML oder JSON) 2. Ggf. Transformation der OAS-COUNTER Reports in das SUSHI-Lite Schema 3. (semi)automatischer Import in OpenAIRE-Usage Statistics DB
  • 24. Open Research Analytics Service • OAS Nachfolger, Knowledge Unlatched zusammen mit OpenAIRE (und OpenAPC)
  • 25. Wieso ORAS? • Offene Infrastruktur zur Verbesserung der Interoperabilität von Nutzungsdaten und Analysemöglichkeiten von Repositorien • Zusammenführung mehrerer, unterschiedlicher Datenquellen (OpenAIRE metadata, OpenAPC, etc.) • Zunächst Fokus auf die Integration von Nutzungsdaten von OpenAIRE-Repositorien und die Entwicklung der ORAS Public API.
  • 26. Wieso ORAS? Researcher • Wie viele Downloads hat mein Artikel auf dem Repository? Wie sieht das im Vergleich zu anderen Artikeln aus? Repository Manager • Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie hoch ist die Rate und Nutzung meiner IR-Einzahlung im Vergleich zu anderen IRs im Land? Bibliotheksleitung • Sind unsere Gold- und Hybridartikel auch im Repository hinterlegt? Werden teurere Gold Open Access auch vermehrt von unseren Kunden genutzt?
  • 27. Reporting to researchers • Stellen Sie den Forschern mit wenigen Klicks Berichte zur Verfügung, die den Forschern Einblicke in die Verwendung ihrer hinterlegten Gegenstände geben
  • 28. Benchmarking IR to IR managers • Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie hoch ist die Rate und Nutzung meiner IR-Einzahlung im Vergleich zu anderen IRs im Land? Total Usage 15th of 160 DE repositories No. of Items 50th of 160 DE repositories Deposit Rate 10th of 160 DE repositories Repository Benchmarking
  • 29. OpenAPC and IR integration • Sind unsere Gold- und Hybridartikel auch im Repository hinterlegt? Werden teurere Gold Open Access auch vermehrt von unseren Kunden genutzt? OpenAPC Benchmarking Total APC paid in 2019 15th of 160 DE institutions No. of Items in 2019 4th of 160 DE institutions Deposit Rate APC Items 15th of 160 DE institutions
  • 30. Wie funktioniert ORAS? • Nahtlose Integration mit OpenAIRE-konformen Repositories (via SUSHI lite) und OpenAPC • Anbindung anderer Nutzung Datenquellen (COUNTER reports, Google Analytics, etc.) • Beginnen Sie mit der Analyse und dem Reporting.
  • 31. International Community Knowledge Unlatched InstitutionInstitutionInstitution Open Research Analytics (Membership Interface) Sustainable funding (Membership) OpenAIRE OpenAPC Open Analytics Advisory Board Other third-Party Integrations Public Roadmap Usage Data Trans. Data Interface Funding flows to all projects to maintain + expand scope and features (roadmap) Public Open Database (CC 0 licence)
  • 32. Mitgliedschaftsmodell Deutschland • Freemium Model • Basic (OpenAIRE-only) = free • Membership (ORAS) = setup fee (1.500 EUR) + annual fee (1.250 EUR p.a.) • Vorteile einer Mitgliedschaft: • 2019Q1 Zugriff auf Repository Nutzungsdaten nach COUNTER, generiert durch OpenAIRE • Entwicklung neuer analytischer Anwendungsfälle auf Basis von Open Repositories als Teil einer internationalen Community. • Generierung von Nutzungsreports für die eigene Einrichtung / Fakultäten; Stimulierung einer verstärkten Nutzung des Repositories und Erhöhung der Zahl von (Open Access) Deposits. • Zugriff auf IR-Benchmarking-Berichte auf Basis unterschiedlicher Dimensionen
  • 33. Roadmap • Bis zum 1. Dezember Interesse anmelden (pledge), um einen reibungslosen Zugang im ersten Quartal 2019 zu gewährleisten: • Umstellung von GBV auf Open Research Analytics (inklusive OpenAIRE usage data) • OpenAIRE Metadaten-Aggregationsdienst • Registrierung über OpenAIRE Content Provider- Dashboard • Registriere Interesse am Mitgliedschaftsmodell hier: • https://app.knowledgeunlatched.org/ku- partners/knowledge-unlatched/open-research-analytics
  • 34. Q&A GBV, OpenAIRE und Knowledge Unlatched