Intervention au Forum des Archivistes (Angers, 22 mars 2013) #Angers2013
Indexation collaborative, identification de photographies, transcription de manuscrits, les exemples ne manquent pas… Les services d’archives mettent en place, en France et un peu partout dans le monde, des projets innovants et ambitieux de coopération numérique avec leurs usagers, pour enrichir la description de leurs fonds, pour en améliorer et faciliter l’accès. S’emparant des potentialités du web social et participatif, et s’intégrant dans l’écosystème vertueux du web fondé sur les interactions avec et entre les internautes, les Archives vont bien au-delà d’échanges superficiels avec leurs usagers, et développent des projets fondés sur l’apport de connaissances et de compétences par les internautes.
5. Inventer de nouvelles
relations avec nos
usagers
CC BY-NC-SA Emily Taliaferro Prince, Flick
6. … pour enrichir
nos inventaires,
nos fonds, et les
services à nos
usagers
CC BY fibroblast, Flickr
7. Explorer la blogosphère
Des réponses différentes…
Médiation
numérique
Communication,
animation de
communautés
BIBLIOTHEQUES
MUSEES
ARCHIVES
CC BY-NC Jon Wiley, Flickr
Web
participatif
8. Une terminologie fluctuante…
qui reflète les attentes des
institutions culturelles
Crowdsourcing
Web collaboratif Métadonnées
sociales
Web participatif
CC BY-NC-SA monmimoun, Flickr
9. Les archives participatives
Un organisme, un site ou une collection
auxquels des personnes qui ne sont pas
des professionnels des archives apportent
leur connaissance ou ajoutent des
contenus, généralement dans un contexte
numérique en ligne. Il en résulte une
meilleure compréhension des documents
d’archives.
Kate Theimer
11. La loi de
participation :
« 90-9-1 »
Source: BBC
Et à l’heure du web social ?
12. rquoi ça marche
M a i s p ou HIVES ?
POUR LES ARC
CC BY-ND Hampton University, Flickr
13. La nature même des
documents d’archives
CC BY-NC-ND _NDenis, Flickr
14. La numérisation:
un élan pour des
projets
participatifs
300 millions de
CC BY-NC-ND Rustman, Flickr
pages mises en ligne
par les services
d’archives en France
Source
15. Source
Une diffusion massive
de documents
Les Archives fédérales allemandes sur
Wikimedia Commons : 80 000 images
16. Collecte de
documents privés
La cartothèque des Archives du Lot-et-
Garonne
29. Transcription et
édition critique
Monasterium et les chartes médiévales
30. Appel aux compétences
scientifiques des usagers
Le Laboratoire des internautes des AD Vendée
31. CC BY-NC-ND Piblet, Flickr
Des wikipédiens en
résidence
Aux Archives nationales des Etats-Unis
32. Et si la participation des usagers
était le moteur des archives ?
Source : Internet Archive
33. Merci de votre attention
pauline.moirez@bnf.fr
@archives_masala
CC BY-NC Go Esewhere, flickr
Hinweis der Redaktion
Les données des archives sont parfaitement à leur place sur le web : elles diffusent des contenus riches, des informations qualifiées et structurées.
Parce que c’est bien de cela qu’il s’agit ! Donner une nouvelle visibilité à nos catalogues et à nos inventaires, les enrichir des données produites par nos usagers. On parle de web collaboratif et d’institutions culturelles en insistant sur la richesse des interactions avec les usagers, sur les volumes produits, sur les enjeux incroyables que représente le crowdsourcing pour les bibs et les archives, mais rarement en se posant la question concrète de l’apport pour nos catalogues. Alors que concrètement le but est bien d’enrichir nos catalogues, nos inventaires, nos instruments de recherches, nos bases de données ! Bref, produire de nouvelles métadonnées, des données d’un nouveau genre…
si les différents domaines patrimoniaux et culturels s’approprient tous peu à peu les usages du web social pour la mise en valeur et la médiation de leurs collections, leurs projets et réalisations montrent des choix résolument différents, en termes de stratégie, de relations avec les usagers, de technologies.
La fluctuation de la terminologie ne reflète pas tant la diversité des projets (qui est réelle mais qui peut être désignée de façons différentes) que les enjeux que l’on y met. Interroger la terminologie permet donc de multiplier les angles d’analyse de ce web … collaboratif, participatif…?
MASSE DIVERSITE UNICITE VALEURS
La numérisation et la mise en ligne ouvrent des possibilités nouvelles pour la constitution de métadonnées sociales INDEXATION COLLABORATIVE IDENTIFICATION DE PHOTOGRAPHIES CORRECTION D’OCR TRANSCRIPTION COLLABORATIVE Cette participation des usagers, qui peut exister sur de simples données bibliographiques, est renforcée par la mise en ligne des bibliothèques numériques. En effet, la mise à disposition des usagers de documents numérisés, images voire textes OCRisés, permet des opérations de crowdsourcing plus ambitieuses qui enrichissent notablement la description des documents : indexation, identification de photographies, correction d’OCR, ou encore transcription collaborative. La mise en ligne des documents numérisés permet de donner aux usagers les clefs pour contribuer à leur description.
Diffusion de cette masse documentaire sur les sites web des services d’archives, ou bien directement sur des médias sociaux, support d’une participation des usagers,
Les Archives départementales du Lot-et-Garonne ont ainsi ouvert en 2011 une cartothèque départementale [1] où les internautes peuvent déposer en ligne les fichiers de leurs cartes postales numérisées, mais aussi contribuer à l’indexation des cartes postales conservées par les Archives.
Enquête sur les usages des doctorants dans les universités de Bretagne : ressources documentaires utilisées : Google 96% - catalogue de la bibliothèque 65%
Pour les archives, le web demande des inventaires plus précis, à la pièce, des bases de données nominatives identification, description et indexation au niveau de la pièce, voire transcription des contenus pour permettre une recherche en plein texte.
TNA : Africa through a lens, pour l’identification de photographies de l’Afrique
Les Archives nationales du Royaume-Uni participent au projet Old Weather [1] de transcription et géolocalisation collaborative des relevés météorologiques manuscrits réalisés par les navires de la Marine royale au début du XXe siècle. L’objectif est de disposer de bases de données météorologiques complètes et fiables, sur lesquelles les météorologues pourront appuyer des études scientifiques pour comprendre et modéliser le climat d’aujourd’hui et ses évolutions demain.
Citizen archivist
tagging encadré et contrôlé qui évite l’écueil du vandalisme documentaire Les facteurs de succès de cette indexation collaborative reposent sur : les contributeurs : des généalogistes nombreux et investis dans les pratiques collaboratives, parfois encadrés par une association généalogique, bons connaisseurs des patronymes du territoire qu’ils étudient, et intéressés au premier chef par l’utilisation des bases de données nominatives produites dans le cadre de ces projets, la nature de l’indexation demandée : il ne s’agit pas d’un tagging libre difficilement réutilisable dans le cadre d’instruments de recherche, mais de formulaires simples et structurés (indexation de la date, des noms et prénoms, des professions exercées, etc.). Les pages à annoter sont parfois attribuées par « lot » aux contributeurs (Archives de l’Aube, Archives de l’Ain), afin de disposer d’une indexation d’ensembles cohérents plutôt que d’un saupoudrage, le souci de la qualité des données produites : une inscription du contributeur est généralement obligatoire, parfois assortie d’un test de paléographie (Archives de l’Ain) pour évaluer son niveau, et d’une double indexation pour croiser les données, le service d’archives assurant une modération en cas d’erreur signalée, l’ergonomie de l’interface d’indexation : souvent simple et intuitive, intégrée souplement dans l’interface de consultation des archives numérisées, surtout pour les applications les plus récentes (Archives du Cantal, Archives du Rhône) le soutien des collectivités territoriales, qui intègrent ces projets participatifs innovants dans leur stratégie numérique et de services aux usagers. Les Archives départementales du Cantal ont ainsi reçu en 2010 un prix Territoria d’Or pour leur outil d’indexation collaborative de l’état civil. Les chiffres sont parlants : aux Archives départementales de l’Ain, 500 000 pages ont été indexées en 2 ans ; aux Archives départementales du Cantal, 1000 indexations sont réalisées chaque jour… g encadré et contrôlé qui évite l’écueil du vandalisme documentaire
Les Archives départementales des Alpes-Maritimes collaborent depuis janvier 2012 avec Wikimedia France sur Wikisource afin d'utiliser cet outil collaboratif pour transcrire des sources manuscrites autour d'une petite communauté de paléographes. Ont déjà été mises en ligne trois visites pastorales des XVIIe-XVIIIe siècles.
Ou correction collaborative d’OCR
Par ailleurs, le projet européen Monasterium [1] , portail numérique de sources diplomatiques porté par le réseau ICARus (International Centre for Archival Research), propose aux chercheurs médiévistes de participer à la transcription mais aussi à l’édition critique et scientifique de documents de l’Europe médiévale (à ce jour, 250 000 documents originaux conservés dans plus de 50 institutions d'archives en Europe).