SlideShare ist ein Scribd-Unternehmen logo
1 von 52
Downloaden Sie, um offline zu lesen
28   AVRIL



2 0 1 0

                Mettre en place un
              projet de numérisation
             ------------------------------------

                      Sylvain Machefert
[[1]]

                                              Contexte

                                                    [[2]]

                                              Objectifs

                                                    [[3]]

                                              Facteurs

                                                    [[4]]

                                    Aspects légaux




Numérisation // Médiaquitaine // 28-04-2010
[[5]]

                               Aspects techniques

                                               [[6]]

                                  La mise en ligne

                                               [[7]]

                                Rappel des étapes




Numérisation // Médiaquitaine // 28-04-2010
1
           Contexte




CC-BY-SA // Manfrys // Flickr
Un sujet d'actualité

Sujet d'actualité et de surcroît « brûlant » en matière de
bibliothéconomie, la numérisation ne laisse pas de susciter
maints commentaires
                                  Conduire un projet de numérisation / 2002




      1992                    2005                                  2010




                                                                              Contexte
Les bibliothèques numériques

●   Corpus de documents, le plus souvent du domaine
    public, numérisés et disponibles en ligne
●   Développées principalement par les
    bibliothèques
●   Volumétries très variables
●   Qualité très variable
    –   Qualité du contenu
    –   Qualité de la présentation




                                                     Contexte
Projet Gutenberg
                                      http://www.gutenberg.org

●   Projet bénévole lancé en 1971
●   30 000 ouvrages
●   Vérification manuelle




                                                       Contexte
Gallica
                                            http://gallica.bnf.fr/

●   Lancé par la BnF en 1997
●   1 million de documents
    –   150 000 livres
    –   700 000 fascicules de périodiques
●   Mode texte et image
●   Documents sous droits
    –   Depuis 2007
    –   20 000 livres




                                                            Contexte
Wikisource
                                                http://fr.wikisource.org

●   Projet frère de Wikipedia, lancé en 2003
●   Ouvrages du domaine public (plusieurs dizaines
    de milliers)
●   Partenariat avec la BnF
●   Désaccord avec Gallimard   (informations)




                                                                  Contexte
Google Books
                                               http://books.google.fr/

●   Lancé en décembre 2004
●   10 millions d'ouvrages numérisés
    –   1,5 millions du domaine public
    –   2 millions en partenariat avec les éditeurs
●   Un accueil mitigé chez les professionnels
    –   300 000 € de dommages et intérêts à La
        Martinière (déc. 2009)
    –   ~ 20 bibliothèques partenaires



                                  Le téléchargement dans Google Books




                                                                  Contexte
Un avis sur la numérisation de masse


Quantitatif : avantage Google
⟶ Plus, plus vite et moins
cher que tout le monde

 Qualitatif : avantage Google
⟶ Presque aussi bien que tout
le monde

 Accès : avantage Google
⟶ Plus rapide, plus efficace,
plus « pratique », plus
central

   Source : Olivier Ertzscheid




                                 CC-BY-NC-SA // Kathelinejeanpierre.ca // Flickr
2
              Les objectifs




CC-BY-SA // Multimotyl // Wikimedia Commons
Diffuser

●   Document aisément reproductible
●   Palliatif intéressant pour les ouvrages
    difficilement communicables
●   Ne nécessite pas de matériel spécifique (≠
    microfiches)
●   Non exclusif




                                                  Objectifs
Valoriser

●   Mise en avant sur un site Internet
●   Diffusion élargie
    –   Moissonnage par des bibliothèques
        d'envergure
    –   intégration dans des projets externes aux
        bibliothèques
        –   Flickr Commons
        –   Wikimedia Commons




                                                    Objectifs
Préserver



                                        ⚠
●   Limite les manipulations des originaux
●   Pérennité des supports numériques




                                                  Objectifs
3
 Les facteurs




CC-BY // Cat & Nat // Flickr
Type de document

●   Forme de l'objet
    –   Texte ou graphique
    –   Imprimé ou manuscrit
    –   Couleur / Noir et blanc
●   Contenu
    –   Texte
    –   Formulaire
    –   Niveau de structuration




                                              Facteurs
Format du document

●   Taille (A4, A3, format spécifique ...)
●   Couleur
●   Papier
●   Pagination
    –   Automatisation
    –   Choix du format de sortie (multipage ?)




                                                  Facteurs
Volume

●   Méthode et coût
    –   Automatisation, sous-traitance
●   OCR et recherche plein texte (plutôt
    qu'indexation ?)
●   Gestion des transferts vers le prestataire
●   Ressources disponibles en interne
●   Stockage des documents numériques




                                                   Facteurs
Homogénéité du fonds

●   Formats différents
    –   Méthode de scannage à adapter ?
    –   Qualité de l'OCR sur un corpus hétérogène ?
    –   Coût
●   Documents de nature différente
    –   Pertinence du traitement dans un seul projet
        ?




                                                      Facteurs
État des documents

●   Choix du scanner et de la méthode
●   Traitement sur place
    –   Création d'un atelier
    –   Main d'œuvre dédiée




                                                 Facteurs
Coût

●   15 à 75 centimes par page (très variable)
●   60 à 75 % du coût en main d'œuvre
●   Ne pas négliger les coûts induits en local
    –   Sélection des documents
    –   Préparation des trains de numérisation
    –   Contrôle qualité




                                                 Facteurs
4
Aspects légaux




 CC-BY // Lnanimatt // Flickr
« Les opérations de numérisation de documents ne confèrent à la
bibliothèque aucun droit de propriété littéraire et artistique
              sur les œuvres ainsi reproduites. »

               http://www.culture.gouv.fr/culture/mrt/numerisation/fr/dll/juridi.html
Le droit moral
● Droit   de divulgation
● Droit   de paternité
● Droit   au respect de
l'œuvre
● Droit   au repentir




      CC-BY // Midgefrazel // Flickr
Les droits
      patrimoniaux
 ●   Droits de reproduction
 ●   Droits de représentation




CC-BY-NC-SA // France.Diplomatie // Flickr
L'auteur jouit, sa vie durant, du droit exclusif d'exploiter
son œuvre sous quelque forme que ce soit et d'en tirer un
profit pécuniaire.
Au décès de l'auteur, ce droit persiste au bénéfice de ses
ayants droit pendant l'année civile en cours et les soixante-
dix années qui suivent.

                          Art. L.123-1 du code de la propriété intellectuelle
Creative Commons
    BY
    Attribution

    NC
    Non Commercial

    ND
    No Derivative

    SA
    Share Alike




   CC-BY-SA // Arnij // Flickr
Aspects
             5
  techniques




CC-BY // Dolarz // Flickr
Modes de numérisation
        Idéal : une combinaison des deux numérisations



               Mode texte                        Mode image
    ● Donne du sens au contenu          ● Restitution du document 

    ● Permet l'indexation, la recherche original à l'identique
+


    ● Plus cher                        ● Limite les possibilités en terme 
    ● Nécessite d'avoir des outils     d'usage
­   performants




                                                                             Technique
OCR

 ●   Reconnaissance optique de caractères
 ●   Taux de reconnaissance > 99% pour des textes
     propres
 ●   Plus compliqué sur du document ancien ou
     manuscrit




http://gallica.bnf.fr/ark:/12148/bpt6k56800101.f7


                                               http://gallica.bnf.fr/ark:/12148/bpt6k56800101.texte.f7


                                                                                               Technique
ICR

●   Reconnaissance intelligente de caractères
●   Mécanisme d'apprentissage
●   Plus adapté aux manuscrits




                                                Technique
L 'expérience reCAPTCHA




Source   OCR              reCAPTCHA




                                      Technique
Résolution

●   Se mesure en point par pouce
    –   1 pouce = 2,54 cm
    –   1 pouce = 1 inch
●   Résolutions standards (BnF, 2008) :
    –   Fichiers de conservation : 300 dpi
    –   Fichiers de diffusion : 150 dpi
    –   Fichier de visualisation : 72 dpi




                                                   Technique
Couleurs

●   Noir & Blanc
●   Niveau de gris
●   Couleurs
●   Échantillonage (bits par pixel)
    –   1 bit → 2 couleurs (noir et blanc)
    –   2 bits → 4 couleurs ou niveaux de gris
    –   8 bits → 256 couleurs ou niveaux de gris
    –   24 bits → 16 millions de couleurs (vraies
        couleurs)




                                                     Technique
Métadonnées EXIF
●   Exchangeable Image File
●   Dernière version en 2002 (2.2)
●   Standard de fait
                                      CC­BY­SA // YellowShark // Wikimedia Commons

●   Produite par un appareil photo ou ajoutées a
    posteriori
●   Décrit :
    –   Résolution, dimension, orientation de
        l'image
    –   Date et heure de la prise de vue
    –   Informations sur l'appareil (fabricant,
        type, réglages)
    –   Coordonnées géographiques

                                                                        Technique
Métadonnées IPTC-IIM

●   International Press and Telecommunications
    Council Information Interchange Model
●   Utilisé dès 1994 par Adobe
●   Métadonnées descriptives :
    –   Titre
    –   Auteur
    –   Agence
    –   ...




                                                 Technique
XMP

●   eXtensible Metadata Platform
●   Créé par Adobe en 2001
●   Basé sur XML / Dublin Core, IPTC-IIM et EXIF
●   Encapsulable dans des fichiers JPG, TIFF, DNG,
    PDF




                                                   Technique
6
   La mise en ligne




CC-BY // Arnoldius // Wikimedia Commons
Une étape obligatoire
●   Pour répondre à nos décideurs / financeurs
●   Pour répondre à nos usagers
●   Pour rencontrer un nouveau public


                         CC-BY-SA // Roulex_45 // Wikimedia Commons
Priorités
           ●
               Ouverture
           ●
               Interopérabilité
           ●
               Accessibilité




Libre de droits // Rundvald // Wikimedia Commons
OAI - PMH

●   Format d'échange basé sur XML
●   Fourniture des données en Dublin Core
●   Protocole très simple
    –    Informations sur un serveur
    –    Liste des enregistrements
●       Nécessite d'avoir des urls pérennes
Choix des outils
●
     Libre / Propriétaire
●
     Local / Hébergé
●
     Full-web ou pas




            CC-BY // SophieA // Flickr
BM Toulouse

                 Sur son site
●   Logiciel libre : Greenstone (unesco)
●   Application web
●   Classement par collections

      http://numerique.bibliotheque.toulouse.fr


                  Sur Flickr
●   Projet The Commons
●   Dissémination du contenu
●   920 images

http://www.flickr.com/photos/bibliothequedetoulouse/




                                       Mise en ligne
BM Lille
●   Logiciel libre : SDX
●   Application web

    http://numerique.bibliotheque.bm-lille.fr
BM Fréjus
●   Hébergement chez Arkhenum
● Numérisation des archives d'un
journal local
●   Numérisation PDF / Texte

    http://www1.arkhenum.fr/bm_frejus_le_var/




                                 Mise en ligne
Université Rennes 2
   ●   Logiciel libre : Omeka
   ●   Application web
   ●   Plugins variés :
       ●   Serveur OAI
       ●   Géolocalisation
       ●   Visualisation

   http://bibnum.univ-rennes2.fr




                         Mise en ligne
7
                    Étapes du
                       projet




CC-BY-SA // Sémhur // Wikimedia Commons
La numérisation

●   Définir les objectifs de la numérisation
●   Sélectionner le fonds à traiter
    –   Fonds préexistant ou sélection d'un sous-
        corpus
    –   Importance de l'homogénéité de l'ensemble
    –   S'assurer des contraintes législatives
●   Répartir les rôles




                                                    Étapes
La numérisation

●   Définir les questions techniques
    –   Résolution
    –   Format
    –   OCR
    –   Métadonnées
    –   Support de livraison
●   Définir une règle de nommage
●   Contrôler la qualité des documents produits
●   Archiver les documents




                                                     Étapes
La diffusion

●   Choisir ce qui doit être diffusé
●   Choisir la manière de diffuser
    –   Via un outil interne
    –   Via un site web externe
●   Si on diffuse via un outil interne, s'assurer
    de :
    –   Son ouverture
    –   Son interopérable
    –   Son accessibilité




                                                    Étapes
Support
                sous licence
           Creative Commons BY SA




        MERCI


           Inspiré du support

symac      de cours de Claire
                  Scopsi
               (INTD-CNAM)

Weitere ähnliche Inhalte

Andere mochten auch

Ah les femmes_pp11 (1)
Ah les femmes_pp11 (1)Ah les femmes_pp11 (1)
Ah les femmes_pp11 (1)
Albert Antebi
 
Pr sentation ag 2009
Pr sentation ag 2009Pr sentation ag 2009
Pr sentation ag 2009
ilendil
 
Birds high fashion_show___1
Birds high fashion_show___1Birds high fashion_show___1
Birds high fashion_show___1
baseandromeda1
 
Compte rendu en-grèce_par_espagnols
Compte rendu en-grèce_par_espagnolsCompte rendu en-grèce_par_espagnols
Compte rendu en-grèce_par_espagnols
IES El Chaparil
 

Andere mochten auch (20)

Ecouter les enquêtes de terrain : analyse, numérisation, valorisation des arc...
Ecouter les enquêtes de terrain : analyse, numérisation, valorisation des arc...Ecouter les enquêtes de terrain : analyse, numérisation, valorisation des arc...
Ecouter les enquêtes de terrain : analyse, numérisation, valorisation des arc...
 
Oai dublincore format de métadonnées requis par le protocole oai pmh
Oai dublincore format de métadonnées requis par le protocole oai pmhOai dublincore format de métadonnées requis par le protocole oai pmh
Oai dublincore format de métadonnées requis par le protocole oai pmh
 
Rio Info 2015 - Palestra IoT e o bem-estar das pessoas - Manoel vitório barbin
Rio Info 2015 - Palestra IoT e o bem-estar das pessoas - Manoel vitório barbinRio Info 2015 - Palestra IoT e o bem-estar das pessoas - Manoel vitório barbin
Rio Info 2015 - Palestra IoT e o bem-estar das pessoas - Manoel vitório barbin
 
CNUDST Workshops -Why quality articles
CNUDST Workshops -Why quality articlesCNUDST Workshops -Why quality articles
CNUDST Workshops -Why quality articles
 
Gestion des conflits : la démarche gagnant / gagnant
Gestion des conflits : la démarche gagnant / gagnantGestion des conflits : la démarche gagnant / gagnant
Gestion des conflits : la démarche gagnant / gagnant
 
Gestion des conflits par la Méthode Thomas-Kilmann
Gestion des conflits par la Méthode Thomas-KilmannGestion des conflits par la Méthode Thomas-Kilmann
Gestion des conflits par la Méthode Thomas-Kilmann
 
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
 
Ah les femmes_pp11 (1)
Ah les femmes_pp11 (1)Ah les femmes_pp11 (1)
Ah les femmes_pp11 (1)
 
Affut' pro - Affûtage pour professionnels
Affut' pro   - Affûtage pour professionnelsAffut' pro   - Affûtage pour professionnels
Affut' pro - Affûtage pour professionnels
 
Pr sentation ag 2009
Pr sentation ag 2009Pr sentation ag 2009
Pr sentation ag 2009
 
Résultats des contrôles dans le secteur de l’ameublement
Résultats des contrôles  dans le secteur de l’ameublement Résultats des contrôles  dans le secteur de l’ameublement
Résultats des contrôles dans le secteur de l’ameublement
 
L'ancien
L'ancienL'ancien
L'ancien
 
Paris
ParisParis
Paris
 
Was zufriedene Kunden über Alleinunterhalter CoolCat sagen
Was zufriedene Kunden über Alleinunterhalter CoolCat sagenWas zufriedene Kunden über Alleinunterhalter CoolCat sagen
Was zufriedene Kunden über Alleinunterhalter CoolCat sagen
 
Comment définir son business model dans l'ère du temps ?
Comment définir son business model dans l'ère du temps ?Comment définir son business model dans l'ère du temps ?
Comment définir son business model dans l'ère du temps ?
 
Birds high fashion_show___1
Birds high fashion_show___1Birds high fashion_show___1
Birds high fashion_show___1
 
Entfernen Sie PC Bedrohung
Entfernen Sie PC BedrohungEntfernen Sie PC Bedrohung
Entfernen Sie PC Bedrohung
 
PQ-Formel
PQ-FormelPQ-Formel
PQ-Formel
 
Compte rendu en-grèce_par_espagnols
Compte rendu en-grèce_par_espagnolsCompte rendu en-grèce_par_espagnols
Compte rendu en-grèce_par_espagnols
 
digitalis xplorer 2015 winter
digitalis xplorer 2015 winterdigitalis xplorer 2015 winter
digitalis xplorer 2015 winter
 

Ähnlich wie Éléments pour la mise en place d'un projet de numérisation

Connectez-vous !
Connectez-vous !Connectez-vous !
Connectez-vous !
Ulrich Fischer
 
Médiation Numérique Montpellier
Médiation Numérique MontpellierMédiation Numérique Montpellier
Médiation Numérique Montpellier
Laurent Magnac
 
L’édition en shs face à l’ère du numérique 2011
L’édition en shs face à l’ère du numérique 2011L’édition en shs face à l’ère du numérique 2011
L’édition en shs face à l’ère du numérique 2011
verdeil
 
La diffusion multi-canal, formation ADBS
La diffusion multi-canal, formation ADBSLa diffusion multi-canal, formation ADBS
La diffusion multi-canal, formation ADBS
Jean-Baptiste Soufron
 

Ähnlich wie Éléments pour la mise en place d'un projet de numérisation (20)

Les bibliothèques et leurs catalogues 20110324
Les bibliothèques et leurs catalogues   20110324Les bibliothèques et leurs catalogues   20110324
Les bibliothèques et leurs catalogues 20110324
 
Construire un espace culturel numérique commun (exposé de 2004)
Construire un espace culturel numérique commun (exposé de 2004)Construire un espace culturel numérique commun (exposé de 2004)
Construire un espace culturel numérique commun (exposé de 2004)
 
Jabes 2008 - Session sponsor : Le partenariat public/privé dans les projets d...
Jabes 2008 - Session sponsor : Le partenariat public/privé dans les projets d...Jabes 2008 - Session sponsor : Le partenariat public/privé dans les projets d...
Jabes 2008 - Session sponsor : Le partenariat public/privé dans les projets d...
 
Ressources numériques
Ressources numériquesRessources numériques
Ressources numériques
 
Digitheque des Archives & Bibliotheque ULB
Digitheque des Archives & Bibliotheque ULBDigitheque des Archives & Bibliotheque ULB
Digitheque des Archives & Bibliotheque ULB
 
Informatique documentaire - Cours Licence pro bib 2013
Informatique documentaire - Cours Licence pro bib 2013Informatique documentaire - Cours Licence pro bib 2013
Informatique documentaire - Cours Licence pro bib 2013
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
 
Formation initiale informatique 2011
Formation initiale informatique 2011Formation initiale informatique 2011
Formation initiale informatique 2011
 
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
 
Connectez-vous !
Connectez-vous !Connectez-vous !
Connectez-vous !
 
Nouveau site web pour bibliothèques ups
Nouveau site web pour bibliothèques upsNouveau site web pour bibliothèques ups
Nouveau site web pour bibliothèques ups
 
Une médiathèque numérique ? Exemple de la médiathèque de Berre l'étang
Une médiathèque numérique ? Exemple de la médiathèque de Berre l'étangUne médiathèque numérique ? Exemple de la médiathèque de Berre l'étang
Une médiathèque numérique ? Exemple de la médiathèque de Berre l'étang
 
Médiation Numérique Montpellier
Médiation Numérique MontpellierMédiation Numérique Montpellier
Médiation Numérique Montpellier
 
L’édition en shs face à l’ère du numérique 2011
L’édition en shs face à l’ère du numérique 2011L’édition en shs face à l’ère du numérique 2011
L’édition en shs face à l’ère du numérique 2011
 
La diffusion multi-canal, formation ADBS
La diffusion multi-canal, formation ADBSLa diffusion multi-canal, formation ADBS
La diffusion multi-canal, formation ADBS
 
Numérisation: collaborations, projets et réalisation à la Bibliothèque nation...
Numérisation: collaborations, projets et réalisation à la Bibliothèque nation...Numérisation: collaborations, projets et réalisation à la Bibliothèque nation...
Numérisation: collaborations, projets et réalisation à la Bibliothèque nation...
 
Publications scientifiques en sciences humaines et sociales à l'ère du numéri...
Publications scientifiques en sciences humaines et sociales à l'ère du numéri...Publications scientifiques en sciences humaines et sociales à l'ère du numéri...
Publications scientifiques en sciences humaines et sociales à l'ère du numéri...
 
Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche Tendances et innovation des outils de recherche
Tendances et innovation des outils de recherche
 
L'Observatoire Biblissima : état des lieux et perspectives
L'Observatoire Biblissima : état des lieux et perspectivesL'Observatoire Biblissima : état des lieux et perspectives
L'Observatoire Biblissima : état des lieux et perspectives
 
DÉCALCQ : archives scientifiques et environnement de recherche en SHS
DÉCALCQ : archives scientifiques et environnement de recherche en SHSDÉCALCQ : archives scientifiques et environnement de recherche en SHS
DÉCALCQ : archives scientifiques et environnement de recherche en SHS
 

Mehr von Sylvain Machefert

Journées Abes 2012 - Présentation bordeaux 3
Journées Abes 2012 - Présentation bordeaux 3Journées Abes 2012 - Présentation bordeaux 3
Journées Abes 2012 - Présentation bordeaux 3
Sylvain Machefert
 

Mehr von Sylvain Machefert (20)

Improving modern art articles on wikipedia, a partnership between Wikimédia F...
Improving modern art articles on wikipedia, a partnership between Wikimédia F...Improving modern art articles on wikipedia, a partnership between Wikimédia F...
Improving modern art articles on wikipedia, a partnership between Wikimédia F...
 
OpenData : Kézako
OpenData : KézakoOpenData : Kézako
OpenData : Kézako
 
Open Access - Quel intérêt pour le doctorant ?
Open Access - Quel intérêt pour le doctorant ?Open Access - Quel intérêt pour le doctorant ?
Open Access - Quel intérêt pour le doctorant ?
 
Recherche d'images librement utilisables sur Internet : atelier
Recherche d'images librement utilisables sur Internet : atelierRecherche d'images librement utilisables sur Internet : atelier
Recherche d'images librement utilisables sur Internet : atelier
 
Présentation de Wikipédia en 10 diapositives (Angers en biens communs)
Présentation de Wikipédia en 10 diapositives (Angers en biens communs)Présentation de Wikipédia en 10 diapositives (Angers en biens communs)
Présentation de Wikipédia en 10 diapositives (Angers en biens communs)
 
Présentation de Babord+ (interne Bordeaux 3)
Présentation de Babord+ (interne Bordeaux 3)Présentation de Babord+ (interne Bordeaux 3)
Présentation de Babord+ (interne Bordeaux 3)
 
Présentation résolveur de liens
Présentation résolveur de liensPrésentation résolveur de liens
Présentation résolveur de liens
 
Présentation Omeka - Journée ARPIST, juin 2013
Présentation Omeka - Journée ARPIST, juin 2013Présentation Omeka - Journée ARPIST, juin 2013
Présentation Omeka - Journée ARPIST, juin 2013
 
Notes sur l'atelier firefox
Notes sur l'atelier firefoxNotes sur l'atelier firefox
Notes sur l'atelier firefox
 
Atelier Firefox - Trucs & Astuces
Atelier Firefox - Trucs & AstucesAtelier Firefox - Trucs & Astuces
Atelier Firefox - Trucs & Astuces
 
Wikipedia, une encyclopédie collaborative (février 2013)
Wikipedia, une encyclopédie collaborative (février 2013)Wikipedia, une encyclopédie collaborative (février 2013)
Wikipedia, une encyclopédie collaborative (février 2013)
 
1886 - Présentation à la journée réseau des bibliothèques (10/12/2012)
1886 - Présentation à la journée réseau des bibliothèques (10/12/2012)1886 - Présentation à la journée réseau des bibliothèques (10/12/2012)
1886 - Présentation à la journée réseau des bibliothèques (10/12/2012)
 
Tour d'horizon des fonctionnalités de Zotero 3
Tour d'horizon des fonctionnalités de Zotero 3Tour d'horizon des fonctionnalités de Zotero 3
Tour d'horizon des fonctionnalités de Zotero 3
 
Journées Abes 2012 - Présentation bordeaux 3
Journées Abes 2012 - Présentation bordeaux 3Journées Abes 2012 - Présentation bordeaux 3
Journées Abes 2012 - Présentation bordeaux 3
 
Factiva - Présentation interne Bordeaux 3
Factiva - Présentation interne Bordeaux 3Factiva - Présentation interne Bordeaux 3
Factiva - Présentation interne Bordeaux 3
 
Zotero en 30 minutes
Zotero en 30 minutesZotero en 30 minutes
Zotero en 30 minutes
 
Wikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaireWikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaire
 
Web 2.0 en bibliothèque - éléments de réflexion
Web 2.0 en bibliothèque - éléments de réflexionWeb 2.0 en bibliothèque - éléments de réflexion
Web 2.0 en bibliothèque - éléments de réflexion
 
Services mobiles en BU - Réflexions à Bordeaux 3
Services mobiles en BU - Réflexions à Bordeaux 3Services mobiles en BU - Réflexions à Bordeaux 3
Services mobiles en BU - Réflexions à Bordeaux 3
 
Wikipédia, découvrir et enrichir (en 30 minutes)
Wikipédia, découvrir et enrichir (en 30 minutes)Wikipédia, découvrir et enrichir (en 30 minutes)
Wikipédia, découvrir et enrichir (en 30 minutes)
 

Kürzlich hochgeladen

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 

Kürzlich hochgeladen (18)

Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 

Éléments pour la mise en place d'un projet de numérisation

  • 1. 28 AVRIL 2 0 1 0 Mettre en place un projet de numérisation ------------------------------------ Sylvain Machefert
  • 2. [[1]] Contexte [[2]] Objectifs [[3]] Facteurs [[4]] Aspects légaux Numérisation // Médiaquitaine // 28-04-2010
  • 3. [[5]] Aspects techniques [[6]] La mise en ligne [[7]] Rappel des étapes Numérisation // Médiaquitaine // 28-04-2010
  • 4. 1 Contexte CC-BY-SA // Manfrys // Flickr
  • 5. Un sujet d'actualité Sujet d'actualité et de surcroît « brûlant » en matière de bibliothéconomie, la numérisation ne laisse pas de susciter maints commentaires Conduire un projet de numérisation / 2002 1992 2005 2010 Contexte
  • 6. Les bibliothèques numériques ● Corpus de documents, le plus souvent du domaine public, numérisés et disponibles en ligne ● Développées principalement par les bibliothèques ● Volumétries très variables ● Qualité très variable – Qualité du contenu – Qualité de la présentation Contexte
  • 7. Projet Gutenberg http://www.gutenberg.org ● Projet bénévole lancé en 1971 ● 30 000 ouvrages ● Vérification manuelle Contexte
  • 8. Gallica http://gallica.bnf.fr/ ● Lancé par la BnF en 1997 ● 1 million de documents – 150 000 livres – 700 000 fascicules de périodiques ● Mode texte et image ● Documents sous droits – Depuis 2007 – 20 000 livres Contexte
  • 9. Wikisource http://fr.wikisource.org ● Projet frère de Wikipedia, lancé en 2003 ● Ouvrages du domaine public (plusieurs dizaines de milliers) ● Partenariat avec la BnF ● Désaccord avec Gallimard (informations) Contexte
  • 10. Google Books http://books.google.fr/ ● Lancé en décembre 2004 ● 10 millions d'ouvrages numérisés – 1,5 millions du domaine public – 2 millions en partenariat avec les éditeurs ● Un accueil mitigé chez les professionnels – 300 000 € de dommages et intérêts à La Martinière (déc. 2009) – ~ 20 bibliothèques partenaires Le téléchargement dans Google Books Contexte
  • 11. Un avis sur la numérisation de masse Quantitatif : avantage Google ⟶ Plus, plus vite et moins cher que tout le monde Qualitatif : avantage Google ⟶ Presque aussi bien que tout le monde Accès : avantage Google ⟶ Plus rapide, plus efficace, plus « pratique », plus central Source : Olivier Ertzscheid CC-BY-NC-SA // Kathelinejeanpierre.ca // Flickr
  • 12. 2 Les objectifs CC-BY-SA // Multimotyl // Wikimedia Commons
  • 13. Diffuser ● Document aisément reproductible ● Palliatif intéressant pour les ouvrages difficilement communicables ● Ne nécessite pas de matériel spécifique (≠ microfiches) ● Non exclusif Objectifs
  • 14. Valoriser ● Mise en avant sur un site Internet ● Diffusion élargie – Moissonnage par des bibliothèques d'envergure – intégration dans des projets externes aux bibliothèques – Flickr Commons – Wikimedia Commons Objectifs
  • 15. Préserver ⚠ ● Limite les manipulations des originaux ● Pérennité des supports numériques Objectifs
  • 16. 3 Les facteurs CC-BY // Cat & Nat // Flickr
  • 17. Type de document ● Forme de l'objet – Texte ou graphique – Imprimé ou manuscrit – Couleur / Noir et blanc ● Contenu – Texte – Formulaire – Niveau de structuration Facteurs
  • 18. Format du document ● Taille (A4, A3, format spécifique ...) ● Couleur ● Papier ● Pagination – Automatisation – Choix du format de sortie (multipage ?) Facteurs
  • 19. Volume ● Méthode et coût – Automatisation, sous-traitance ● OCR et recherche plein texte (plutôt qu'indexation ?) ● Gestion des transferts vers le prestataire ● Ressources disponibles en interne ● Stockage des documents numériques Facteurs
  • 20. Homogénéité du fonds ● Formats différents – Méthode de scannage à adapter ? – Qualité de l'OCR sur un corpus hétérogène ? – Coût ● Documents de nature différente – Pertinence du traitement dans un seul projet ? Facteurs
  • 21. État des documents ● Choix du scanner et de la méthode ● Traitement sur place – Création d'un atelier – Main d'œuvre dédiée Facteurs
  • 22. Coût ● 15 à 75 centimes par page (très variable) ● 60 à 75 % du coût en main d'œuvre ● Ne pas négliger les coûts induits en local – Sélection des documents – Préparation des trains de numérisation – Contrôle qualité Facteurs
  • 23. 4 Aspects légaux CC-BY // Lnanimatt // Flickr
  • 24. « Les opérations de numérisation de documents ne confèrent à la bibliothèque aucun droit de propriété littéraire et artistique sur les œuvres ainsi reproduites. » http://www.culture.gouv.fr/culture/mrt/numerisation/fr/dll/juridi.html
  • 25. Le droit moral ● Droit de divulgation ● Droit de paternité ● Droit au respect de l'œuvre ● Droit au repentir CC-BY // Midgefrazel // Flickr
  • 26. Les droits patrimoniaux ● Droits de reproduction ● Droits de représentation CC-BY-NC-SA // France.Diplomatie // Flickr
  • 27. L'auteur jouit, sa vie durant, du droit exclusif d'exploiter son œuvre sous quelque forme que ce soit et d'en tirer un profit pécuniaire. Au décès de l'auteur, ce droit persiste au bénéfice de ses ayants droit pendant l'année civile en cours et les soixante- dix années qui suivent. Art. L.123-1 du code de la propriété intellectuelle
  • 28. Creative Commons BY Attribution NC Non Commercial ND No Derivative SA Share Alike CC-BY-SA // Arnij // Flickr
  • 29. Aspects 5 techniques CC-BY // Dolarz // Flickr
  • 30. Modes de numérisation Idéal : une combinaison des deux numérisations Mode texte Mode image ● Donne du sens au contenu ● Restitution du document  ● Permet l'indexation, la recherche original à l'identique + ● Plus cher ● Limite les possibilités en terme  ● Nécessite d'avoir des outils  d'usage ­ performants Technique
  • 31. OCR ● Reconnaissance optique de caractères ● Taux de reconnaissance > 99% pour des textes propres ● Plus compliqué sur du document ancien ou manuscrit http://gallica.bnf.fr/ark:/12148/bpt6k56800101.f7 http://gallica.bnf.fr/ark:/12148/bpt6k56800101.texte.f7 Technique
  • 32. ICR ● Reconnaissance intelligente de caractères ● Mécanisme d'apprentissage ● Plus adapté aux manuscrits Technique
  • 33. L 'expérience reCAPTCHA Source OCR reCAPTCHA Technique
  • 34. Résolution ● Se mesure en point par pouce – 1 pouce = 2,54 cm – 1 pouce = 1 inch ● Résolutions standards (BnF, 2008) : – Fichiers de conservation : 300 dpi – Fichiers de diffusion : 150 dpi – Fichier de visualisation : 72 dpi Technique
  • 35. Couleurs ● Noir & Blanc ● Niveau de gris ● Couleurs ● Échantillonage (bits par pixel) – 1 bit → 2 couleurs (noir et blanc) – 2 bits → 4 couleurs ou niveaux de gris – 8 bits → 256 couleurs ou niveaux de gris – 24 bits → 16 millions de couleurs (vraies couleurs) Technique
  • 36. Métadonnées EXIF ● Exchangeable Image File ● Dernière version en 2002 (2.2) ● Standard de fait CC­BY­SA // YellowShark // Wikimedia Commons ● Produite par un appareil photo ou ajoutées a posteriori ● Décrit : – Résolution, dimension, orientation de l'image – Date et heure de la prise de vue – Informations sur l'appareil (fabricant, type, réglages) – Coordonnées géographiques Technique
  • 37. Métadonnées IPTC-IIM ● International Press and Telecommunications Council Information Interchange Model ● Utilisé dès 1994 par Adobe ● Métadonnées descriptives : – Titre – Auteur – Agence – ... Technique
  • 38. XMP ● eXtensible Metadata Platform ● Créé par Adobe en 2001 ● Basé sur XML / Dublin Core, IPTC-IIM et EXIF ● Encapsulable dans des fichiers JPG, TIFF, DNG, PDF Technique
  • 39. 6 La mise en ligne CC-BY // Arnoldius // Wikimedia Commons
  • 40. Une étape obligatoire ● Pour répondre à nos décideurs / financeurs ● Pour répondre à nos usagers ● Pour rencontrer un nouveau public CC-BY-SA // Roulex_45 // Wikimedia Commons
  • 41. Priorités ● Ouverture ● Interopérabilité ● Accessibilité Libre de droits // Rundvald // Wikimedia Commons
  • 42. OAI - PMH ● Format d'échange basé sur XML ● Fourniture des données en Dublin Core ● Protocole très simple – Informations sur un serveur – Liste des enregistrements ● Nécessite d'avoir des urls pérennes
  • 43. Choix des outils ● Libre / Propriétaire ● Local / Hébergé ● Full-web ou pas CC-BY // SophieA // Flickr
  • 44. BM Toulouse Sur son site ● Logiciel libre : Greenstone (unesco) ● Application web ● Classement par collections http://numerique.bibliotheque.toulouse.fr Sur Flickr ● Projet The Commons ● Dissémination du contenu ● 920 images http://www.flickr.com/photos/bibliothequedetoulouse/ Mise en ligne
  • 45. BM Lille ● Logiciel libre : SDX ● Application web http://numerique.bibliotheque.bm-lille.fr
  • 46. BM Fréjus ● Hébergement chez Arkhenum ● Numérisation des archives d'un journal local ● Numérisation PDF / Texte http://www1.arkhenum.fr/bm_frejus_le_var/ Mise en ligne
  • 47. Université Rennes 2 ● Logiciel libre : Omeka ● Application web ● Plugins variés : ● Serveur OAI ● Géolocalisation ● Visualisation http://bibnum.univ-rennes2.fr Mise en ligne
  • 48. 7 Étapes du projet CC-BY-SA // Sémhur // Wikimedia Commons
  • 49. La numérisation ● Définir les objectifs de la numérisation ● Sélectionner le fonds à traiter – Fonds préexistant ou sélection d'un sous- corpus – Importance de l'homogénéité de l'ensemble – S'assurer des contraintes législatives ● Répartir les rôles Étapes
  • 50. La numérisation ● Définir les questions techniques – Résolution – Format – OCR – Métadonnées – Support de livraison ● Définir une règle de nommage ● Contrôler la qualité des documents produits ● Archiver les documents Étapes
  • 51. La diffusion ● Choisir ce qui doit être diffusé ● Choisir la manière de diffuser – Via un outil interne – Via un site web externe ● Si on diffuse via un outil interne, s'assurer de : – Son ouverture – Son interopérable – Son accessibilité Étapes
  • 52. Support sous licence Creative Commons BY SA MERCI Inspiré du support symac de cours de Claire Scopsi (INTD-CNAM)