SlideShare ist ein Scribd-Unternehmen logo
1 von 32
Le projet du SCD de Nice:
une approche globale des données de la recherche
Mathieu Saby, SCD de Nice
Journée d’études « Données de la recherche: enjeux, pratiques et services »
23/6/2016
1
Principales orientations et grandes étapes
2
De l’expérience ponctuelle à l’offre de services
été 2014
–
été 2015
(Préfiguration)
été 2015
–
hiver 2015
Préparation et analyse
printemps 2016
–
automne 2016
Expérimentation et définition de l’offre
2016-2017 Déploiement d’une offre de services
3
Deux volets
1. Accompagner la gestion des données de la recherche
S’adapter aux évolutions de la recherche et de la communication scientifique
Les données sont (ou deviennent) des objets scientifiques à part entière
Elles peuvent gagner à être partagées, citées et réutilisées
Ce qui suppose qu’elles soient gérées, décrites, protégées, pérennisées
Exigences croissantes de financeurs (Horizon 2020) et d’éditeurs (Nature, PLOS)
Pouvons-nous intervenir? Oui… mais plusieurs questions à éclaircir
Différents niveaux pertinents: local, national, international
Compétences documentaires, informatiques, archivistiques, juridiques, éthiques
Suppose une implication des chercheurs eux-mêmes
4
Deux volets
2. Soutenir le processus de recherche lui-même
Nous intervenons traditionnellement en amont (accès à la documentation) et en
aval (diffusion des publications) de la recherche
Notre hypothèse: les BU ont des compétences utiles à certains projets de
recherche
Pouvons-nous intervenir? Oui… mais plusieurs questions à éclaircir
Démarche inédite : tout est à inventer (nature exacte des services proposés,
niveaux de service, positionnement, méthodologie, communication…)
Besoin de consolider et développer certaines compétences
Nécessité d’une meilleure connaissance du fonctionnement de la recherche et
des besoins des chercheurs
5
Deux volets
2. Soutenir le processus de recherche lui-même
Notre proposition: ingénierie documentaire et de l’information au
service de la recherche (manipulation de documents, de données et
de métadonnées)
– Identifier et utiliser des jeux de données existants
– Extraire à partir de sources diverses
– Traiter et transformer
– Décrire et organiser
– Mettre en ligne
– Visualiser
6
Principes de mise en œuvre
(proposition susceptible d’évolution)
7
Bénéficiaires
• Toute personne impliquée dans la recherche à l’UNS (chercheur,
enseignant-chercheur, ingénieur, doctorant, M2 recherche)
• Chercheurs de la COMUE hors unité mixtes ? Envisageable mais
modalités à définir, par exemple dans le cadre de projets IDEX.
• Attention particulière
– aux laboratoires dépourvus de personnel technique et/ou de
documentalistes
– aux laboratoires de SHS pour l’ingénierie documentaire
8
Niveaux d’actions
1. Information et orientation
– Communication générale (plaquette sur les services aux chercheurs, page
sur le site des BU)
– [À venir] Diffusion d’informations détaillées sur la gestion et la
manipulation de données, les services d’Humanum, etc. (Site dédié? Blog?
Supports imprimés?)
– [À venir] Diffuser des supports d’autoformation, notamment produits dans
le cadre du projet Doranum
9
Niveaux d’actions
2. Formations et démonstrations pour doctorants et/ou chercheurs
– Formation sur la gestion des données de la recherche, pour deux écoles
doctorales (avril/mai 2016)
– [À venir] Formations à des outils génériques de manipulation de données:
extraction (web scraping), nettoyage (OpenRefine?), traitement (Talend?),
visualisation (Tableau, Voyant tools…), mise en ligne (Omeka?)
– [À venir] Réflexion sur les formats des formations
10
Collab.
URFIST
Niveaux d’actions
3. Assistance et conseils personnalisés
– Conseils sur la rédaction de plans de gestion de données ou sur des
aspects spécifiques, en particulier pour les projets Horizon 2020
– Conseil techniques ou méthodologiques pour la manipulation de
documents, données ou métadonnées
11
Collab.
DirVed
Collab.
Humanum
Niveaux d’actions
4. Travail technique en partenariat avec des chercheurs [expérimental]
– Paramétrage d’outils
– Opérations de manipulation de documents, données ou métadonnées,
petits développements informatiques
12
Collab.
Humanum
Ce que nous ne proposons pas
• Traitement manuel de données, sauf marginalement
• Traitement nécessitant des outils ou compétences très
spécialisés (« Big data », images, sons, vidéos, données
géographiques…)
• Analyse statistique ou interprétation des données
• Développements informatiques complexes
• Infrastructures de calcul, stockage ou archivage
• Administration d’une base de données ou d’un outil destiné à un
projet
 Ne pas se substituer aux chercheurs, documentalistes, ingénieurs
et techniciens ou post-doctorants impliqués dans un projet
13
Partenariats et collaborations actuels
• Partenariats
– Humanum : accompagnement de projets en SHS
– URFIST PACA-C: formations doctorales, partenaire du projet Doranum
• Collaboration interne à l’université
– DirVed : pour les projets Horizon 2020
14
Quelques exemples d’interventions
15
Livre blanc sur les études africaines
Assistance à la rédaction d’un livre blanc sur les études africaines :
extraction de données bibliographiques (thèses et articles de revues
traitant de l’Afrique)
Données fournies par le SCD, et analysées par les chercheurs du GIS
Afrique, dont des chercheurs de l’URMIS.
16
Livre blanc sur les études africaines
Exemple (simplifié): extraction, enrichissement et nettoyage des
données sur les thèses
17
Livre blanc sur les études africaines
Résultat : Livre blanc Les études africaines en France (mars 2016)
Participation à la 3e partie (L’Afrique dans les thèses et les revues)
18
Livre blanc sur les études africaines
Quelques exemples d’analyse des données fournies:
Fig. 1 : évolution de la part des disciplines les plus représentées
19
Livre blanc sur les études africaines
Quelques exemples d’analyse des données fournies:
Fig. 2 : évolution du sex ratio des doctorants par disciplines
20
Livre blanc sur les études africaines
Quelques exemples d’analyse des données fournies:
Fig. 3 : part de l’Afrique dans un panel de revues généralistes
21
Livre blanc sur les études africaines
Bilan
• Des chercheurs globalement satisfaits
• Malgré des difficultés et quelques déceptions
– Travail plus long et complexe que prévu, pour le SCD et les chercheurs
– Sources hétérogènes (nature, mode d’accès, qualité des données)
– Certaines données non accessibles en ligne
– « Bruit » et « silence » important, parfois difficilement explicable
– Limites de l’automatisation : retraitement manuel indispensable
– Écart de « culture » entre SCD et chercheurs
• Pistes d’amélioration
– Renforcer le contrôle sur la qualité et la pertinence des données
– Intensifier les échanges
– Développer des outils réutisables
22
Évolution de la base Navigocorpus
• Projet ANR 2007-2011 (CMMC/Lyon/Brest)
• Base de données d’histoire maritime
• Réalisée avec Filemaker, hébergée par Humanum
23
Évolution de la base Navigocorpus
• Besoin : valoriser le contenu de la base, réfléchir à son évolution
• Réponse : échanges avec l’ingénieur d’Humanum chargé de son
administration, prototype de visualisation (en cours)
24
Visualisation de concepts
Visualisation de concepts pour une collègue doctorante
Données en
RDF
25
Scraping d’un site web
Scraping d’un site web (Communication limitée, projet en cours)
Outil de scraping
Site source
Données tabulées
Traitements
26
3 projets à l’étude
• Zoomathia (CEPAM) : constitution, stockage, annotation et
consultation d’un corpus de textes antiques
• ICEM (CMMC) : pérennisation et évolution d’une base de
données prosopographique
• Fiduciae (CMMC) : mise en ligne de reproductions de documents
d’archives
27
Conclusion
28
Travailler ensemble
Collaboration effective
URFIST de Nice
DirVed UNS
Humanum
Collaboration envisageable
Service formation UNS
DSI UNS
CIL UNS
MSHS Sud-Est
Documentalistes UNS et UCA
Ingénieurs et techniciens
présents dans les laboratoires
INIST
PROGEDO
29
Structurer les services aux chercheurs
Nouvelle mission transversale du SCD à la rentrée : structurer et
développer nos services aux chercheurs, numériques et non
numériques
30
S’inscrire dans l’UCA et soutenir l’IDEX
Futur schéma directeur documentaire UCA
Soutien à des projets IDEX
31
Icones par Freepik sur www.flaticon.com
32
Pour nous contacter : donnees-scd@unice.fr

Weitere ähnliche Inhalte

Was ist angesagt?

Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
ADBSAquidoc
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
infoclio.ch
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
AssociationAF
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
AssociationAF
 
Écologie numérique ou archiver le Développement durable
Écologie numérique ou archiver le Développement durableÉcologie numérique ou archiver le Développement durable
Écologie numérique ou archiver le Développement durable
AssociationAF
 

Was ist angesagt? (20)

Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives
 
Estampages_EfA_dec2016
Estampages_EfA_dec2016Estampages_EfA_dec2016
Estampages_EfA_dec2016
 
121203 04 mistral_doc
121203 04 mistral_doc121203 04 mistral_doc
121203 04 mistral_doc
 
Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
 
2016 alod troyes.ppt
2016 alod troyes.ppt2016 alod troyes.ppt
2016 alod troyes.ppt
 
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suissesJABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
 
Introduction aux données de la recherche
Introduction aux données de la rechercheIntroduction aux données de la recherche
Introduction aux données de la recherche
 
ANF - Assemblée Générale réseau Isore
ANF - Assemblée Générale réseau IsoreANF - Assemblée Générale réseau Isore
ANF - Assemblée Générale réseau Isore
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...
 
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
 
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
 
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
 
Écologie numérique ou archiver le Développement durable
Écologie numérique ou archiver le Développement durableÉcologie numérique ou archiver le Développement durable
Écologie numérique ou archiver le Développement durable
 
Jabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'AbesJabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'Abes
 

Andere mochten auch

Andere mochten auch (12)

Mixité accompagner une équipe
Mixité   accompagner une équipeMixité   accompagner une équipe
Mixité accompagner une équipe
 
JE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPauJE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPau
 
e-learning et sport sables d'olonnes mars 2016
e-learning et sport sables d'olonnes mars 2016e-learning et sport sables d'olonnes mars 2016
e-learning et sport sables d'olonnes mars 2016
 
Compétences transversales et niveaux de maîtrise
Compétences transversales et niveaux de maîtriseCompétences transversales et niveaux de maîtrise
Compétences transversales et niveaux de maîtrise
 
Espaces collaboratifs, labs : quels liens avec les bibliothèques?
Espaces collaboratifs, labs : quels liens avec les bibliothèques?Espaces collaboratifs, labs : quels liens avec les bibliothèques?
Espaces collaboratifs, labs : quels liens avec les bibliothèques?
 
Usage des tablettes en bibliothèque à destination des publics adultes
Usage des tablettes en bibliothèque à destination des publics adultesUsage des tablettes en bibliothèque à destination des publics adultes
Usage des tablettes en bibliothèque à destination des publics adultes
 
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
 
Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeux
 
Le cours de Stéphane Mercier
Le cours de Stéphane MercierLe cours de Stéphane Mercier
Le cours de Stéphane Mercier
 
Tutoriel Mendeley 1.8
Tutoriel Mendeley 1.8Tutoriel Mendeley 1.8
Tutoriel Mendeley 1.8
 
Panorama des logiciels de gestion de références bibliographiques
Panorama des logiciels de gestion de références bibliographiquesPanorama des logiciels de gestion de références bibliographiques
Panorama des logiciels de gestion de références bibliographiques
 

Ähnlich wie Le projet du SCD de Nice: une approche globale des données de la recherche

Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
AssociationAF
 
Le documentaliste et le dépôt numérique
Le documentaliste et le dépôt numériqueLe documentaliste et le dépôt numérique
Le documentaliste et le dépôt numérique
Adou Jean Constant ATTA
 
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
infoclio.ch
 

Ähnlich wie Le projet du SCD de Nice: une approche globale des données de la recherche (20)

Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
 
Conduire un projet de dématérialisation.pdf
Conduire un projet de dématérialisation.pdfConduire un projet de dématérialisation.pdf
Conduire un projet de dématérialisation.pdf
 
Duchesne Medialab Mai09
Duchesne Medialab Mai09Duchesne Medialab Mai09
Duchesne Medialab Mai09
 
IST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élanIST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élan
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
 
Jabes 2019 - Session parallèle "Evolution de la fonction de Coordinateur Sudoc"
Jabes 2019 - Session parallèle "Evolution de la fonction de Coordinateur Sudoc"Jabes 2019 - Session parallèle "Evolution de la fonction de Coordinateur Sudoc"
Jabes 2019 - Session parallèle "Evolution de la fonction de Coordinateur Sudoc"
 
Introduction au Plan de Gestion de Données
Introduction au Plan de Gestion de DonnéesIntroduction au Plan de Gestion de Données
Introduction au Plan de Gestion de Données
 
Jabes 2012 - Session plénière "L'Abes, à la croisée des chemins"
Jabes 2012 - Session plénière "L'Abes, à la croisée des chemins"Jabes 2012 - Session plénière "L'Abes, à la croisée des chemins"
Jabes 2012 - Session plénière "L'Abes, à la croisée des chemins"
 
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
 
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
 
Le réseau des Urfist
Le réseau des UrfistLe réseau des Urfist
Le réseau des Urfist
 
Le documentaliste et le dépôt numérique
Le documentaliste et le dépôt numériqueLe documentaliste et le dépôt numérique
Le documentaliste et le dépôt numérique
 
DÉCALCQ : archives scientifiques et environnement de recherche en SHS
DÉCALCQ : archives scientifiques et environnement de recherche en SHSDÉCALCQ : archives scientifiques et environnement de recherche en SHS
DÉCALCQ : archives scientifiques et environnement de recherche en SHS
 
IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?
 
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
Raymond Werlen (CRUS) - Les enjeux de l’information scientifique. Le point de...
 
Indexation portail idneuf
Indexation portail idneufIndexation portail idneuf
Indexation portail idneuf
 
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
 
Atelier Mazedia Multitouch SITEM 2011 Expérience Fontevraud - Rétrospective
Atelier Mazedia Multitouch SITEM 2011 Expérience Fontevraud - RétrospectiveAtelier Mazedia Multitouch SITEM 2011 Expérience Fontevraud - Rétrospective
Atelier Mazedia Multitouch SITEM 2011 Expérience Fontevraud - Rétrospective
 
Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...
 

Mehr von Mathieu Saby

Mehr von Mathieu Saby (9)

Science ouverte et appels à projets
Science ouverte et appels à projetsScience ouverte et appels à projets
Science ouverte et appels à projets
 
Programmer dans Openrefine avec GREL
Programmer dans Openrefine avec GRELProgrammer dans Openrefine avec GREL
Programmer dans Openrefine avec GREL
 
Usage des expressions régulières dans Openrefine
Usage des expressions régulières dans OpenrefineUsage des expressions régulières dans Openrefine
Usage des expressions régulières dans Openrefine
 
Analyse de données JSON dans Openrefine
Analyse de données JSON dans OpenrefineAnalyse de données JSON dans Openrefine
Analyse de données JSON dans Openrefine
 
Aide mémoire Openrefine 3.3 béta
Aide mémoire Openrefine 3.3 béta Aide mémoire Openrefine 3.3 béta
Aide mémoire Openrefine 3.3 béta
 
Nettoyer et transformer ses données avec Openrefine : partie 2
Nettoyer et transformer ses données avec Openrefine : partie 2Nettoyer et transformer ses données avec Openrefine : partie 2
Nettoyer et transformer ses données avec Openrefine : partie 2
 
Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1
 
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
 
Nettoyer et préparer des données avec OpenRefine
Nettoyer et préparer des données avec OpenRefineNettoyer et préparer des données avec OpenRefine
Nettoyer et préparer des données avec OpenRefine
 

Kürzlich hochgeladen

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 

Kürzlich hochgeladen (20)

Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 

Le projet du SCD de Nice: une approche globale des données de la recherche

  • 1. Le projet du SCD de Nice: une approche globale des données de la recherche Mathieu Saby, SCD de Nice Journée d’études « Données de la recherche: enjeux, pratiques et services » 23/6/2016 1
  • 2. Principales orientations et grandes étapes 2
  • 3. De l’expérience ponctuelle à l’offre de services été 2014 – été 2015 (Préfiguration) été 2015 – hiver 2015 Préparation et analyse printemps 2016 – automne 2016 Expérimentation et définition de l’offre 2016-2017 Déploiement d’une offre de services 3
  • 4. Deux volets 1. Accompagner la gestion des données de la recherche S’adapter aux évolutions de la recherche et de la communication scientifique Les données sont (ou deviennent) des objets scientifiques à part entière Elles peuvent gagner à être partagées, citées et réutilisées Ce qui suppose qu’elles soient gérées, décrites, protégées, pérennisées Exigences croissantes de financeurs (Horizon 2020) et d’éditeurs (Nature, PLOS) Pouvons-nous intervenir? Oui… mais plusieurs questions à éclaircir Différents niveaux pertinents: local, national, international Compétences documentaires, informatiques, archivistiques, juridiques, éthiques Suppose une implication des chercheurs eux-mêmes 4
  • 5. Deux volets 2. Soutenir le processus de recherche lui-même Nous intervenons traditionnellement en amont (accès à la documentation) et en aval (diffusion des publications) de la recherche Notre hypothèse: les BU ont des compétences utiles à certains projets de recherche Pouvons-nous intervenir? Oui… mais plusieurs questions à éclaircir Démarche inédite : tout est à inventer (nature exacte des services proposés, niveaux de service, positionnement, méthodologie, communication…) Besoin de consolider et développer certaines compétences Nécessité d’une meilleure connaissance du fonctionnement de la recherche et des besoins des chercheurs 5
  • 6. Deux volets 2. Soutenir le processus de recherche lui-même Notre proposition: ingénierie documentaire et de l’information au service de la recherche (manipulation de documents, de données et de métadonnées) – Identifier et utiliser des jeux de données existants – Extraire à partir de sources diverses – Traiter et transformer – Décrire et organiser – Mettre en ligne – Visualiser 6
  • 7. Principes de mise en œuvre (proposition susceptible d’évolution) 7
  • 8. Bénéficiaires • Toute personne impliquée dans la recherche à l’UNS (chercheur, enseignant-chercheur, ingénieur, doctorant, M2 recherche) • Chercheurs de la COMUE hors unité mixtes ? Envisageable mais modalités à définir, par exemple dans le cadre de projets IDEX. • Attention particulière – aux laboratoires dépourvus de personnel technique et/ou de documentalistes – aux laboratoires de SHS pour l’ingénierie documentaire 8
  • 9. Niveaux d’actions 1. Information et orientation – Communication générale (plaquette sur les services aux chercheurs, page sur le site des BU) – [À venir] Diffusion d’informations détaillées sur la gestion et la manipulation de données, les services d’Humanum, etc. (Site dédié? Blog? Supports imprimés?) – [À venir] Diffuser des supports d’autoformation, notamment produits dans le cadre du projet Doranum 9
  • 10. Niveaux d’actions 2. Formations et démonstrations pour doctorants et/ou chercheurs – Formation sur la gestion des données de la recherche, pour deux écoles doctorales (avril/mai 2016) – [À venir] Formations à des outils génériques de manipulation de données: extraction (web scraping), nettoyage (OpenRefine?), traitement (Talend?), visualisation (Tableau, Voyant tools…), mise en ligne (Omeka?) – [À venir] Réflexion sur les formats des formations 10 Collab. URFIST
  • 11. Niveaux d’actions 3. Assistance et conseils personnalisés – Conseils sur la rédaction de plans de gestion de données ou sur des aspects spécifiques, en particulier pour les projets Horizon 2020 – Conseil techniques ou méthodologiques pour la manipulation de documents, données ou métadonnées 11 Collab. DirVed Collab. Humanum
  • 12. Niveaux d’actions 4. Travail technique en partenariat avec des chercheurs [expérimental] – Paramétrage d’outils – Opérations de manipulation de documents, données ou métadonnées, petits développements informatiques 12 Collab. Humanum
  • 13. Ce que nous ne proposons pas • Traitement manuel de données, sauf marginalement • Traitement nécessitant des outils ou compétences très spécialisés (« Big data », images, sons, vidéos, données géographiques…) • Analyse statistique ou interprétation des données • Développements informatiques complexes • Infrastructures de calcul, stockage ou archivage • Administration d’une base de données ou d’un outil destiné à un projet  Ne pas se substituer aux chercheurs, documentalistes, ingénieurs et techniciens ou post-doctorants impliqués dans un projet 13
  • 14. Partenariats et collaborations actuels • Partenariats – Humanum : accompagnement de projets en SHS – URFIST PACA-C: formations doctorales, partenaire du projet Doranum • Collaboration interne à l’université – DirVed : pour les projets Horizon 2020 14
  • 16. Livre blanc sur les études africaines Assistance à la rédaction d’un livre blanc sur les études africaines : extraction de données bibliographiques (thèses et articles de revues traitant de l’Afrique) Données fournies par le SCD, et analysées par les chercheurs du GIS Afrique, dont des chercheurs de l’URMIS. 16
  • 17. Livre blanc sur les études africaines Exemple (simplifié): extraction, enrichissement et nettoyage des données sur les thèses 17
  • 18. Livre blanc sur les études africaines Résultat : Livre blanc Les études africaines en France (mars 2016) Participation à la 3e partie (L’Afrique dans les thèses et les revues) 18
  • 19. Livre blanc sur les études africaines Quelques exemples d’analyse des données fournies: Fig. 1 : évolution de la part des disciplines les plus représentées 19
  • 20. Livre blanc sur les études africaines Quelques exemples d’analyse des données fournies: Fig. 2 : évolution du sex ratio des doctorants par disciplines 20
  • 21. Livre blanc sur les études africaines Quelques exemples d’analyse des données fournies: Fig. 3 : part de l’Afrique dans un panel de revues généralistes 21
  • 22. Livre blanc sur les études africaines Bilan • Des chercheurs globalement satisfaits • Malgré des difficultés et quelques déceptions – Travail plus long et complexe que prévu, pour le SCD et les chercheurs – Sources hétérogènes (nature, mode d’accès, qualité des données) – Certaines données non accessibles en ligne – « Bruit » et « silence » important, parfois difficilement explicable – Limites de l’automatisation : retraitement manuel indispensable – Écart de « culture » entre SCD et chercheurs • Pistes d’amélioration – Renforcer le contrôle sur la qualité et la pertinence des données – Intensifier les échanges – Développer des outils réutisables 22
  • 23. Évolution de la base Navigocorpus • Projet ANR 2007-2011 (CMMC/Lyon/Brest) • Base de données d’histoire maritime • Réalisée avec Filemaker, hébergée par Humanum 23
  • 24. Évolution de la base Navigocorpus • Besoin : valoriser le contenu de la base, réfléchir à son évolution • Réponse : échanges avec l’ingénieur d’Humanum chargé de son administration, prototype de visualisation (en cours) 24
  • 25. Visualisation de concepts Visualisation de concepts pour une collègue doctorante Données en RDF 25
  • 26. Scraping d’un site web Scraping d’un site web (Communication limitée, projet en cours) Outil de scraping Site source Données tabulées Traitements 26
  • 27. 3 projets à l’étude • Zoomathia (CEPAM) : constitution, stockage, annotation et consultation d’un corpus de textes antiques • ICEM (CMMC) : pérennisation et évolution d’une base de données prosopographique • Fiduciae (CMMC) : mise en ligne de reproductions de documents d’archives 27
  • 29. Travailler ensemble Collaboration effective URFIST de Nice DirVed UNS Humanum Collaboration envisageable Service formation UNS DSI UNS CIL UNS MSHS Sud-Est Documentalistes UNS et UCA Ingénieurs et techniciens présents dans les laboratoires INIST PROGEDO 29
  • 30. Structurer les services aux chercheurs Nouvelle mission transversale du SCD à la rentrée : structurer et développer nos services aux chercheurs, numériques et non numériques 30
  • 31. S’inscrire dans l’UCA et soutenir l’IDEX Futur schéma directeur documentaire UCA Soutien à des projets IDEX 31
  • 32. Icones par Freepik sur www.flaticon.com 32 Pour nous contacter : donnees-scd@unice.fr