SlideShare ist ein Scribd-Unternehmen logo
1 von 54
Downloaden Sie, um offline zu lesen
Archivage du Web :
Quelle mise en œuvre ?
Mercredi 25 septembre 2012
ADBS, Paris
Chloé Martin chloe@internetmemory.net
Leïla Medjkoune leila.medjkoune@internetmemory.net
1
vendredi 19 octobre 2012
Internet Memory
Leïla Medjkoune
Responsable des services d’archivage
Depuis 2007
Chloé Martin
Responsable des partenariats et du
développement
Depuis 2010
2
Deux entités pour une même cause, l’archivage du Web :
✓ Internet Memory Foundation, 2005 (anciennement European Archive)
✓ Internet Memory Research, spin-off d’IMF, 2011
➡ 150 To de données, une douzaine d’institutions partenaires,
plusieurs projets de recherche, 20+ ETP motivés !
vendredi 19 octobre 2012
Archivage du Web :
Quelle mise en œuvre ?
• Etat des lieux
• Vous avez dit Archivage du Web ?
• Cas Pratiques
• Pour aller plus loin...
3
vendredi 19 octobre 2012
Etat des lieux
• Omniprésence du Web et de ses contenus
• Pourquoi archiver le Web ?
• Qui archive le Web ?
• Enquête
4
vendredi 19 octobre 2012
Le Web ? Ici, là et ailleurs...
Omniprésent
Dynamique
Contenu Web
diversité des formats
Ephémère
précieux
5
vendredi 19 octobre 2012
Omniprésence du Web
• De 50 millions de sites actifs (déc.06) à 190
millions (sept.11)
• 2,3 milliards d’utilisateurs Internet en déc.11
pour une population mondiale de 6,9 milliards
• Boom des Média sociaux
• Facebook (n°1): 250 millions de photos par jour
• YouTube (n°2): 830 millions de vidéos par jour
• Twitter (n°15): 175 millions de Tweets par jour
• LinkedIn (n°29):135 millions de profils
• E-gouvernement : 44% des procédures
administratives des entreprises eur. sont
traitées par voie électronique
!"
#!"
$!"
%!"
&!"
'!"
(!"
)!"
*!"
+!"
,
-./0"1232456.74"
189-:0"
;-<38=
0"6.7">??0=
3@.0"
A93.B0"
C3:-."
!"#$%&'%()*)+,"-.*%/%
6
vendredi 19 octobre 2012
Etat des lieux
• Omniprésence du Web et de ses contenus
• Pourquoi archiver le Web ?
• Qui archive le Web ?
• Enquête
7
vendredi 19 octobre 2012
• Patrimoine: le Web, un nouveau media
• Contraintes légales
• dépôt légal,
• e-gouvernement,
• publications en ligne,
• corporate
• Recherche
• Knowledge Management, Data mining
Pourquoi archiver le Web ?
8
vendredi 19 octobre 2012
Etat des lieux
• Omniprésence du Web et de ses contenus
• Pourquoi archiver le Web ?
• Qui archive le Web ?
• Enquête
9
vendredi 19 octobre 2012
Qui archive le Web?
• Institutions privées
(Fondations)
• Institutions publiques à
vocation patrimoniale
• Archives nationales et régionales
• Bibliothèques nationales, régionales
et universitaires
• Musées
• Organisations internationales
➡ IIPC
• Sociétés commerciales
10
vendredi 19 octobre 2012
Quelques initiatives...
๏ Internet Archive Foundation
๏ Bibliothèque du Congrès
๏ Archives Nationales UK
๏ ...
๏ International Internet
Preservation Consortium
๏ International Web Archiving
Workshop
๏ En France
‣ Bibliothèque nationale de
France (BnF)
‣ Institut national de
l’Audiovisuel (InA)
‣ Quelques initiatives
universitaires : IEP, université de
Lorraine,...
11
vendredi 19 octobre 2012
Etat des lieux
• Omniprésence du Web et de ses contenus
• Pourquoi archiver le Web ?
• Qui archive le Web ?
• Enquête
12
vendredi 19 octobre 2012
Enquête 2010 (Europe)
74 réponses sur 365 institutions
8%
7%
1%
7%
23%
5%
19%
30%
Yes, fully operational
Yes, operational but still experimenting
Yes, just starting a Web Archiving project
No, but we plan to do it
No, no funding
No, not in our mandate
No, an other institution is already in charge
answered question
Legal Aspects % Nb
Yes, law is enacted or passed 50% 34
Yes, law is expected 16,2% 11
Lobbying are in progress 7,4% 5
No, we do not applicable law 26,5% 18
Answered question 68
Access restriction % Nb
Access is online for anyone 41% 25
Access is online with restrictions 28% 17
Access is on site for anyone 18% 11
Access is on site with restrictions 21% 13
We do not have access: contents are
in a completely dark archive
21% 13
Answered questionAnswered question 61
Archive policy % Nb
Domain crawls - TLD (.uk, .eu, .com…) 23% 12
Thematic/selective crawls 71% 37
Only our Websites and associated Websites 30,8% 16
Answered questionAnswered question 52
13
vendredi 19 octobre 2012
Archivage du Web :
Quelle mise en œuvre ?
• Etat des lieux
• Vous avez dit Archivage du Web ?
• Cas Pratiques
• Pour aller plus loin...
14
vendredi 19 octobre 2012
Vous avez dit Archivage Web ?
• L’archivage du Web en un clin d’oeil
• Besoin de compétences particulières ?
• Solutions : en interne ou en externe ?
Quid du Retour sur Investissement
15
vendredi 19 octobre 2012
Quid ?
Qu’est-ce qu’une archive Web ?
Une copie d’un site web
enregistrée par un robot (crawler)
à une date et heure spécifique
sur lequel on peut naviguer
comme un site en ligne
(vs copie d’écran et back-up)
Ex: http://collections.europarchive.org/tna/*/www.tate.org.uk
16
vendredi 19 octobre 2012
Défis d’un projet d’Archive Web
• Sélectionner ce qui sera préservé
• Définir des frontières
• Relever des défis technologiques
• Préserver un contenu non stable
• Rendre accessible
17
vendredi 19 octobre 2012
Comment ? Workflow
18
vendredi 19 octobre 2012
Collecte
Collection horizontale (extensif)
vs.
Collection verticale (intensif)
19
vendredi 19 octobre 2012
Vous avez dit Archivage Web ?
• L’archivage du Web en un clin d’oeil
• Besoin de compétences particulières ?
• Solutions : en interne ou en externe ?
Quid du Retour sur Investissement
20
vendredi 19 octobre 2012
Compétences
• Mettre en place une équipe multi-disciplinaire
‣ Sélection/contrôle qualité: Bibliothécaire / Conservateur /
Archiviste,Assistant qualité, Chef de projet
‣ Capture de contenu Web/développements: Ingénieur, technicien
‣ Création et administration de l’infrastructure: Ingénieur,
administrateur système
➡ L’archivage duWeb nécessite des compétences et une expérience
cruciales, surtout dans le cas d’une solution entièrement en interne.
21
vendredi 19 octobre 2012
Vous avez dit Archivage Web ?
• L’archivage du Web en un clin d’oeil
• Besoin de compétences particulières ?
• Solutions : en interne ou en externe ?
Quid du Retour sur Investissement
22
vendredi 19 octobre 2012
Archive
Web
+ -
solution
interne
Contrôle de tout le processus
Budgets internes
Equipe en interne
Autonome
Ressources humaines
Infrastructures
solution
externe
Déploiement rapide
Coûts adaptables aux volumes
collectés
Economie d’échelle
Etat de l’art
Dépendance à une société
Problèmes organisationnels
(langue, décalage horaire, IP,...)
En interne ou en externe ?
23
vendredi 19 octobre 2012
Outils d’archivage
24
• Netarchivesuite (http://netarchive.dk/suite/)
‣ Open source, développé au Danemark par la Royal
Library et la State and University Library
• Web curator tool: (http://webcurator.sourceforge.net)
‣ Open source, développé par la National Library of New
Zealand, la British Library, à l’initiative de IIPC
(International Internet Preservation Consortium)
• Archive-it (http://www.archive-it.org/)
‣ service payant d’archivage Web, développé par Internet
Archive
vendredi 19 octobre 2012
ArchivetheNet
• Software-as-a-Service ergonomique et intuitif
• 3 modules de gestion automatisés :
• Administration
• Collection
• Rapports
• Processus entièrement automatisé (montée en charge)
• Personnalisation du services grâce à des options (QA,...)
• Actualisation en continu de l’outils
➡ Rapide déploiement
➡ Bon Retour sur Investissement (ROI)
25
vendredi 19 octobre 2012
Archivage du Web :
Quelle mise en œuvre ?
• Etat des lieux
• Vous avez dit Archivage du Web ?
• Cas Pratiques
• Pour aller plus loin...
26
vendredi 19 octobre 2012
Cas pratiques
• Préservation
• Garder une trace de l'information en ligne au fil des années
• Construire une mémoire thématique
• Fin de projet de recherche
• Refonte complète des sites
• Multimedia et réseaux sociaux
• Archives Web contextualisées dans l'audiovisuel
• Capture et accès: You Tube,Twitter, etc.
• Au delà de la préservation, l’usage des Archives Web
• Transparence et visibilité
• Allègement des sites
• Statistiques d’usage
• Recherche
27
vendredi 19 octobre 2012
Préservation
• Garder une trace de l'information en ligne au fil des ans
✓ Parlement du Royaume-Uni
✓ CERN (où le Web est né il y a plus de 20 ans!)
• Construire une mémoire thématique de contenus en ligne
✓ Bibliothèque nationale d'Irlande
• Fin de projets de recherche, disparition du site et du domaine
✓ Retour sur les projets de recherche européens,
✓ Inside Installations
• Refonte complète de sites
✓ RTS
28
vendredi 19 octobre 2012
Pour une institution
Archives Web du Parlement anglais
29
vendredi 19 octobre 2012
Pour un événement
Bibliothèque nationale d’Irlande
146 sites archivés, avant, pendant et après la campagne électorale
30
vendredi 19 octobre 2012
Projets de recherche
• FP6 (2000-2007): 10’000+ projets
financés, soit 17+ milliards d’€
• Analyse de 200 projets (avril 2012)
• 65% des projets ont fait l’objet d’un
site Web :
➡ Tous les sites de projets finis depuis
moins de 2 ans sont encore
accessibles
➡ 23% des sites de projets finis depuis
3 ans ont disparu
➡ 32% des sites de projets finis depuis
6 ans ont disparu
31
vendredi 19 octobre 2012
RTS: Refonte de site
D’une refonte de site à un changement d’identité
2010 début 2012 aujourd’hui
version archivée version archivée version en ligne
32
vendredi 19 octobre 2012
Cas pratiques
• Préservation
• Garder une trace de l'information en ligne au fil des années
• Construire une mémoire thématique
• Fin de projet de recherche
• Refonte complète des sites
• Multimedia et réseaux sociaux
• Archives Web contextualisées dans l'audiovisuel
• Capture et accès: You Tube,Twitter, etc.
• Au delà de la préservation, l’usage des Archives Web
• Transparence et visibilité
• Allègement des sites
• Statistiques d’usage
• Recherche
33
vendredi 19 octobre 2012
Multimedia & Réseaux sociaux
• Constituer des archives Web contextualisées
✓ Südwestrundfunk (SWR)
• Résoudre les difficultés d’Accès pour les réseaux sociaux
✓ YouTube
✓ Twitter
34
vendredi 19 octobre 2012
SWR: Festival Rock am Ring
Contexte
- Evénement sur 3 jours
Taille de la campagne
- Site officiel
- Site de la TV
- Sites des médias sociaux
- Forum
- Sites des médias
traditionnels
Fréquence: 5 fois
- 3 jour avant l’événement
- les 3 jours de l’événement
- 3 jour après l’événement
Profondeur
- Complète pour 1re et 5e
captures
- Partiellement pour 2,3 et 4
Limites
- Budget
- Limites techniques
- Restrictions légales
- Ressources humaines
Bénéfices
- une vue d’ensemble
- suivre l’événement en
temps réel
- garder une trace de la
présence médiatique
Festival Rock-am-Ring
Complete
Crawl
Complete
CrawlPartial
Crawl
Partial
Crawl
Partial
Crawl
35
vendredi 19 octobre 2012
SWR: Festival Rock am Ring
36
vendredi 19 octobre 2012
Défi:Video
37
• Développement d’une
méthode de capture
• Remplacement du
player utilisé
•Modification de l’outil
d’accès pour reproduire
l’accès en ligne
vendredi 19 octobre 2012
Défi :You Tube
38
Capture archivée Solution générique
vendredi 19 octobre 2012
Défi :Twitter
39
Capture archivée Solution générique
vendredi 19 octobre 2012
Cas pratiques
• Préservation
• Garder une trace de l'information en ligne au fil des années
• Construire une mémoire thématique
• Fin de projet de recherche
• Refonte complète des sites
• Multimedia et réseaux sociaux
• Archives Web contextualisées dans l'audiovisuel
• Capture et accès: You Tube,Twitter, etc.
• Au delà de la préservation, l’usage des Archives Web
• Transparence et visibilité
• Allègement des sites
• Statistiques d’usage
• Recherche
40
vendredi 19 octobre 2012
Usages : Cas des Archives
Nationales du Royaume Uni
• Transparence et visibilité :
✓ Redirection automatique
✓ Memento
• Alléger le poids de son site
✓ Redirection des Archives des sites vers l’Archive Web
• Statistiques d'usage
✓ Exemple de l’Archive Web d’Irlande
41
vendredi 19 octobre 2012
Visibilité
•Accès public
•Recherche
• par URL et par date de capture
• plein texte
• navigation par catégorie
•Personnalisation
• Logo
• Bannière
• Catégorie dans la recherche
avancée
42
vendredi 19 octobre 2012
D’un site qui n’est plus en ligne
43
vendredi 19 octobre 2012
aux archives du web
44
vendredi 19 octobre 2012
et retour au web vivant
45
vendredi 19 octobre 2012
Memento
• Développement piloté
par le Los Alamos
National Laboratory et
financé par la
Bibliothèque du Congrès
• Vise à intégrer les
archives Web à la
navigation Web
vendredi 19 octobre 2012
Usage et Presse
0
100
200
300
400
500
600
700
800
900
1000
M
ay
11June
11July
11
August11Sept.11O
ct.11N
ov.11D
ec.11Jan.12Feb.12
M
arch
12April12M
ay
12
Unique visitors per month
• 21/09/2011: Lancement officiel de l’archive
Web (Tweets)
• 26/10/2011: Post sur le Blog nli.ie/blog et
article dans thejournal.ie
• 25/11/2011: article dans irishtimes.com
• 20/01/2012: article dans irishtimes.com
• 17/03/2012: post sur
soundofthearchives.wordpress.com
• 04/05/2012: article dans irisheconomy.ie
Communication de la Bibliothèque nationale d’Irlande (NLI)
sur son archive Web
47
vendredi 19 octobre 2012
Cas pratiques
• Préservation
• Garder une trace de l'information en ligne au fil des années
• Construire une mémoire thématique
• Fin de projet de recherche
• Refonte complète des sites
• Multimedia et réseaux sociaux
• Archives Web contextualisées dans l'audiovisuel
• Capture et accès: You Tube,Twitter, etc.
• Au delà de la préservation, l’usage des Archives Web
• Transparence et visibilité
• Allègement des sites
• Statistiques d’usage
• Recherche
48
vendredi 19 octobre 2012
Exemples - Recherche
Projet de recherche thématique : enpolitique.com
• Etude de l'évolution des sites web politiques lors de
campagnes nationales (France & Québec)
• Pertinence du projet face à la disparition des sites
Ex: http://toushollande.fr fermé et redirigé
vers la page Facebook du candidat élu
49
vendredi 19 octobre 2012
Archivage du Web :
Quelle mise en œuvre ?
• Etat des lieux
• Vous avez dit Archivage du Web ?
• Cas Pratiques
• Pour aller plus loin...
50
vendredi 19 octobre 2012
Pour aller plus loin...
... face aux nombreux challenges du Web et de son archivage
• Web caché & profond
• Spams & boucles
• Sites dynamiques
• Média sociaux
• Multimedia
• Web Mining
51
vendredi 19 octobre 2012
Internet Memory relève le défi
• Crawl sélectif :
✓ LiWA (2007-2010)
✓ ARCOMEM (2010-2013)
• Préservation :
✓ SCAPE (2010-2013)
• Big Data et traitement de
l’information Web :
✓ LK (2009-2012)
✓ LAWA (2010-2013)
✓ TrendMiner (2011-2014)
✓ DOPA (2012-2014)
✓ AnnoMarket (2012-2014)
... et s’engage dans des projets de recherche
52
vendredi 19 octobre 2012
Internet Memory
Internet Memory Foundation
Amsterdam - Paris
• Fondation à but non lucratif
• Préservation & Open Access
http://internetmemory.org
@InternetMemory
Internet Memory Research
Paris
• Services d’Archivage
http://archivethe.net
@ArchivetheNet
• Services de traitement de
l’information à grande échelle
http://mignify.com
@mignify
53
vendredi 19 octobre 2012
Merci de votre attention
54
vendredi 19 octobre 2012

Weitere ähnliche Inhalte

Andere mochten auch

Document
DocumentDocument
DocumentViewOn
 
Document
DocumentDocument
DocumentViewOn
 
Keynote Example Document
Keynote Example DocumentKeynote Example Document
Keynote Example DocumentGeoff McGhee
 
Les messages subliminaux
Les messages subliminauxLes messages subliminaux
Les messages subliminauxasbl darna
 
Td10 conception et réalisation d'un diaporama
Td10  conception et réalisation d'un diaporamaTd10  conception et réalisation d'un diaporama
Td10 conception et réalisation d'un diaporama111161
 
Diaporama Agenda 21 Comité de Pilotage
Diaporama Agenda 21 Comité de PilotageDiaporama Agenda 21 Comité de Pilotage
Diaporama Agenda 21 Comité de Pilotagewebmaster87
 
Diapo 50-cent
Diapo 50-centDiapo 50-cent
Diapo 50-centlucifer
 
2. clinimetria en reumatologia pediatrica ultima version
2. clinimetria en reumatologia pediatrica ultima version2. clinimetria en reumatologia pediatrica ultima version
2. clinimetria en reumatologia pediatrica ultima versionRafael Ospina
 
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011A Mon Boss
 
Document
DocumentDocument
DocumentViewOn
 
Economie des Médias
Economie des MédiasEconomie des Médias
Economie des MédiasLaure Neria
 
Diaporama sur la ville de Nantes
Diaporama sur la ville de NantesDiaporama sur la ville de Nantes
Diaporama sur la ville de NantesFreeSong
 
Trojan Fake Alert 5 Fr
Trojan Fake Alert 5   FrTrojan Fake Alert 5   Fr
Trojan Fake Alert 5 FrCatalin Cosoi
 
Présentation de Vinternet et des services Wine Media Library et Vincod
Présentation de Vinternet et des services Wine Media Library et VincodPrésentation de Vinternet et des services Wine Media Library et Vincod
Présentation de Vinternet et des services Wine Media Library et VincodVinternet
 

Andere mochten auch (20)

Document
DocumentDocument
Document
 
Document
DocumentDocument
Document
 
Keynote Example Document
Keynote Example DocumentKeynote Example Document
Keynote Example Document
 
Edad media
Edad mediaEdad media
Edad media
 
Les messages subliminaux
Les messages subliminauxLes messages subliminaux
Les messages subliminaux
 
Td10 conception et réalisation d'un diaporama
Td10  conception et réalisation d'un diaporamaTd10  conception et réalisation d'un diaporama
Td10 conception et réalisation d'un diaporama
 
Diaporama Agenda 21 Comité de Pilotage
Diaporama Agenda 21 Comité de PilotageDiaporama Agenda 21 Comité de Pilotage
Diaporama Agenda 21 Comité de Pilotage
 
Generaciones de computadoras.!
Generaciones de computadoras.!Generaciones de computadoras.!
Generaciones de computadoras.!
 
Trabajo de las faltas de lengua
Trabajo de las faltas de lenguaTrabajo de las faltas de lengua
Trabajo de las faltas de lengua
 
Diapo 50-cent
Diapo 50-centDiapo 50-cent
Diapo 50-cent
 
2. clinimetria en reumatologia pediatrica ultima version
2. clinimetria en reumatologia pediatrica ultima version2. clinimetria en reumatologia pediatrica ultima version
2. clinimetria en reumatologia pediatrica ultima version
 
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011
Jean-Marc GOACHET - Mines ParisTech - Conference Media Aces fevrier 2011
 
Document
DocumentDocument
Document
 
Economie des Médias
Economie des MédiasEconomie des Médias
Economie des Médias
 
Bilitis
BilitisBilitis
Bilitis
 
Diaporama sur la ville de Nantes
Diaporama sur la ville de NantesDiaporama sur la ville de Nantes
Diaporama sur la ville de Nantes
 
Trojan Fake Alert 5 Fr
Trojan Fake Alert 5   FrTrojan Fake Alert 5   Fr
Trojan Fake Alert 5 Fr
 
Recuerdos para Claudina
Recuerdos para ClaudinaRecuerdos para Claudina
Recuerdos para Claudina
 
Présentation de Vinternet et des services Wine Media Library et Vincod
Présentation de Vinternet et des services Wine Media Library et VincodPrésentation de Vinternet et des services Wine Media Library et Vincod
Présentation de Vinternet et des services Wine Media Library et Vincod
 
Retraites
RetraitesRetraites
Retraites
 

Ähnlich wie Archiva duweb

Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...
Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...
Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...ABES
 
La bibliothèque numérique de l'Institut national d'histoire de l'art
La bibliothèque numérique de l'Institut national d'histoire de l'artLa bibliothèque numérique de l'Institut national d'histoire de l'art
La bibliothèque numérique de l'Institut national d'histoire de l'artLesticetlart Invisu
 
C. Oury_Archivage du web à la BNF (2012)
C. Oury_Archivage du web à la BNF (2012)C. Oury_Archivage du web à la BNF (2012)
C. Oury_Archivage du web à la BNF (2012)Audrey Leblanc
 
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013Sophie Roy
 
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion Web 2.0, Outils et Usages pour la recherche, la production et la diffusion
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion Stefano Amekoudi
 
Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012Alexandre Monnin
 
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Frédérique Couffignal
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheABES
 
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCord
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCordUtilité du Web 2.0 pour les archivistes : l'exemple du Musée McCord
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCordSophie Roy
 
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French)
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French) [Nuxeo World 2013] Construire un portail pour Nuxeo (in French)
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French) Nuxeo
 
Omeka, une solution open source pour diffuser une collection numérique
Omeka, une solution open source pour diffuser une collection numériqueOmeka, une solution open source pour diffuser une collection numérique
Omeka, une solution open source pour diffuser une collection numériqueJulien Sicot
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
 
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...EricFontaineTeknov
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...SemWebPro
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked DataGenève Lab
 
La conservation du patrimoine culturel numérique (2009)
La conservation du patrimoine culturel numérique (2009)La conservation du patrimoine culturel numérique (2009)
La conservation du patrimoine culturel numérique (2009)Ardesi Midi-Pyrénées
 

Ähnlich wie Archiva duweb (20)

Introduction à IIIF
Introduction à IIIFIntroduction à IIIF
Introduction à IIIF
 
Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...
Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...
Jabes 2010 - Sessions 1 - Expériences et projets des bibliothèques "Omeka ou ...
 
TNA Portail Discovery
TNA Portail DiscoveryTNA Portail Discovery
TNA Portail Discovery
 
La bibliothèque numérique de l'Institut national d'histoire de l'art
La bibliothèque numérique de l'Institut national d'histoire de l'artLa bibliothèque numérique de l'Institut national d'histoire de l'art
La bibliothèque numérique de l'Institut national d'histoire de l'art
 
C. Oury_Archivage du web à la BNF (2012)
C. Oury_Archivage du web à la BNF (2012)C. Oury_Archivage du web à la BNF (2012)
C. Oury_Archivage du web à la BNF (2012)
 
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
 
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion Web 2.0, Outils et Usages pour la recherche, la production et la diffusion
Web 2.0, Outils et Usages pour la recherche, la production et la diffusion
 
Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012
 
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
 
Jabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de rechercheJabes 2007 - OCLC : projets de développement et de recherche
Jabes 2007 - OCLC : projets de développement et de recherche
 
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCord
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCordUtilité du Web 2.0 pour les archivistes : l'exemple du Musée McCord
Utilité du Web 2.0 pour les archivistes : l'exemple du Musée McCord
 
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French)
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French) [Nuxeo World 2013] Construire un portail pour Nuxeo (in French)
[Nuxeo World 2013] Construire un portail pour Nuxeo (in French)
 
Garder le controle de vos donnees
Garder le controle de vos donneesGarder le controle de vos donnees
Garder le controle de vos donnees
 
Omeka, une solution open source pour diffuser une collection numérique
Omeka, une solution open source pour diffuser une collection numériqueOmeka, une solution open source pour diffuser une collection numérique
Omeka, une solution open source pour diffuser une collection numérique
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...
SharePoint Online comme GED à la ville de Victoriaville - Congrès des archivi...
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked Data
 
Une introduction à la Bibliothèque numérique des Caraïbes, Stéphanie CHANCY
Une introduction à la Bibliothèque numérique des Caraïbes, Stéphanie CHANCYUne introduction à la Bibliothèque numérique des Caraïbes, Stéphanie CHANCY
Une introduction à la Bibliothèque numérique des Caraïbes, Stéphanie CHANCY
 
La conservation du patrimoine culturel numérique (2009)
La conservation du patrimoine culturel numérique (2009)La conservation du patrimoine culturel numérique (2009)
La conservation du patrimoine culturel numérique (2009)
 

Mehr von ADBS

Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012
Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012
Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012ADBS
 
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...ADBS
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
Open data territorial benjamin jean vf
Open data territorial   benjamin jean vfOpen data territorial   benjamin jean vf
Open data territorial benjamin jean vfADBS
 
20121006 open data-adbs-charles népote
20121006   open data-adbs-charles népote20121006   open data-adbs-charles népote
20121006 open data-adbs-charles népoteADBS
 
Archivage du web quelle mise en oeuvre 5à7_sep2012
Archivage du web   quelle mise en oeuvre 5à7_sep2012Archivage du web   quelle mise en oeuvre 5à7_sep2012
Archivage du web quelle mise en oeuvre 5à7_sep2012ADBS
 
120313 curation5 7_adb_sb
120313 curation5 7_adb_sb120313 curation5 7_adb_sb
120313 curation5 7_adb_sbADBS
 
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012ADBS
 
Medline 2.0 : les alternatives à PubMed
Medline 2.0 : les alternatives à PubMedMedline 2.0 : les alternatives à PubMed
Medline 2.0 : les alternatives à PubMedADBS
 
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...ADBS
 
Internet Santé, quel intérêt pour le patient ?
Internet Santé, quel intérêt pour le patient ?Internet Santé, quel intérêt pour le patient ?
Internet Santé, quel intérêt pour le patient ?ADBS
 
Introduction aux médias sociaux pour la santé
Introduction aux médias sociaux pour la santéIntroduction aux médias sociaux pour la santé
Introduction aux médias sociaux pour la santéADBS
 
Enquete MIS
Enquete MISEnquete MIS
Enquete MISADBS
 
Atelier adbs 27 mars 2012 présentation pmb
Atelier adbs 27 mars 2012   présentation pmbAtelier adbs 27 mars 2012   présentation pmb
Atelier adbs 27 mars 2012 présentation pmbADBS
 
"Recherche d’informations & veille en PME industrielle" Jacques Loigerot
"Recherche d’informations & veille en PME industrielle" Jacques Loigerot"Recherche d’informations & veille en PME industrielle" Jacques Loigerot
"Recherche d’informations & veille en PME industrielle" Jacques LoigerotADBS
 
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanetADBS
 
Magali Guibert de Eric Salmon & Partners
Magali Guibert de Eric Salmon & PartnersMagali Guibert de Eric Salmon & Partners
Magali Guibert de Eric Salmon & PartnersADBS
 
Asuncion valderrama unesco
Asuncion valderrama unescoAsuncion valderrama unesco
Asuncion valderrama unescoADBS
 
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...ADBS
 
Evolutions des compétences des professionnels de l'information
Evolutions des compétences des professionnels de l'informationEvolutions des compétences des professionnels de l'information
Evolutions des compétences des professionnels de l'informationADBS
 

Mehr von ADBS (20)

Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012
Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012
Usage mobile de l'information. "5 à 7 ADBS", 4 décembre 2012
 
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...
“Open Data” & “Big Data” présentation de Romain Lacombe, mission Etalab, févr...
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Open data territorial benjamin jean vf
Open data territorial   benjamin jean vfOpen data territorial   benjamin jean vf
Open data territorial benjamin jean vf
 
20121006 open data-adbs-charles népote
20121006   open data-adbs-charles népote20121006   open data-adbs-charles népote
20121006 open data-adbs-charles népote
 
Archivage du web quelle mise en oeuvre 5à7_sep2012
Archivage du web   quelle mise en oeuvre 5à7_sep2012Archivage du web   quelle mise en oeuvre 5à7_sep2012
Archivage du web quelle mise en oeuvre 5à7_sep2012
 
120313 curation5 7_adb_sb
120313 curation5 7_adb_sb120313 curation5 7_adb_sb
120313 curation5 7_adb_sb
 
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012
Vous avez dit "curation" ? 5 à 7 ADBS, 13 mars 2012
 
Medline 2.0 : les alternatives à PubMed
Medline 2.0 : les alternatives à PubMedMedline 2.0 : les alternatives à PubMed
Medline 2.0 : les alternatives à PubMed
 
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...
Innovation 2.0 : solution Seek & Share pour le documentaliste embarqué dans l...
 
Internet Santé, quel intérêt pour le patient ?
Internet Santé, quel intérêt pour le patient ?Internet Santé, quel intérêt pour le patient ?
Internet Santé, quel intérêt pour le patient ?
 
Introduction aux médias sociaux pour la santé
Introduction aux médias sociaux pour la santéIntroduction aux médias sociaux pour la santé
Introduction aux médias sociaux pour la santé
 
Enquete MIS
Enquete MISEnquete MIS
Enquete MIS
 
Atelier adbs 27 mars 2012 présentation pmb
Atelier adbs 27 mars 2012   présentation pmbAtelier adbs 27 mars 2012   présentation pmb
Atelier adbs 27 mars 2012 présentation pmb
 
"Recherche d’informations & veille en PME industrielle" Jacques Loigerot
"Recherche d’informations & veille en PME industrielle" Jacques Loigerot"Recherche d’informations & veille en PME industrielle" Jacques Loigerot
"Recherche d’informations & veille en PME industrielle" Jacques Loigerot
 
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet
"Méthode et outils de veille e-réputation" Marie Paniez, AltnetPlanet
 
Magali Guibert de Eric Salmon & Partners
Magali Guibert de Eric Salmon & PartnersMagali Guibert de Eric Salmon & Partners
Magali Guibert de Eric Salmon & Partners
 
Asuncion valderrama unesco
Asuncion valderrama unescoAsuncion valderrama unesco
Asuncion valderrama unesco
 
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...
Solutions de gestion de l’information en Saas et cloud. (2) Quel cloud pour l...
 
Evolutions des compétences des professionnels de l'information
Evolutions des compétences des professionnels de l'informationEvolutions des compétences des professionnels de l'information
Evolutions des compétences des professionnels de l'information
 

Archiva duweb

  • 1. Archivage du Web : Quelle mise en œuvre ? Mercredi 25 septembre 2012 ADBS, Paris Chloé Martin chloe@internetmemory.net Leïla Medjkoune leila.medjkoune@internetmemory.net 1 vendredi 19 octobre 2012
  • 2. Internet Memory Leïla Medjkoune Responsable des services d’archivage Depuis 2007 Chloé Martin Responsable des partenariats et du développement Depuis 2010 2 Deux entités pour une même cause, l’archivage du Web : ✓ Internet Memory Foundation, 2005 (anciennement European Archive) ✓ Internet Memory Research, spin-off d’IMF, 2011 ➡ 150 To de données, une douzaine d’institutions partenaires, plusieurs projets de recherche, 20+ ETP motivés ! vendredi 19 octobre 2012
  • 3. Archivage du Web : Quelle mise en œuvre ? • Etat des lieux • Vous avez dit Archivage du Web ? • Cas Pratiques • Pour aller plus loin... 3 vendredi 19 octobre 2012
  • 4. Etat des lieux • Omniprésence du Web et de ses contenus • Pourquoi archiver le Web ? • Qui archive le Web ? • Enquête 4 vendredi 19 octobre 2012
  • 5. Le Web ? Ici, là et ailleurs... Omniprésent Dynamique Contenu Web diversité des formats Ephémère précieux 5 vendredi 19 octobre 2012
  • 6. Omniprésence du Web • De 50 millions de sites actifs (déc.06) à 190 millions (sept.11) • 2,3 milliards d’utilisateurs Internet en déc.11 pour une population mondiale de 6,9 milliards • Boom des Média sociaux • Facebook (n°1): 250 millions de photos par jour • YouTube (n°2): 830 millions de vidéos par jour • Twitter (n°15): 175 millions de Tweets par jour • LinkedIn (n°29):135 millions de profils • E-gouvernement : 44% des procédures administratives des entreprises eur. sont traitées par voie électronique !" #!" $!" %!" &!" '!" (!" )!" *!" +!" , -./0"1232456.74" 189-:0" ;-<38= 0"6.7">??0= 3@.0" A93.B0" C3:-." !"#$%&'%()*)+,"-.*%/% 6 vendredi 19 octobre 2012
  • 7. Etat des lieux • Omniprésence du Web et de ses contenus • Pourquoi archiver le Web ? • Qui archive le Web ? • Enquête 7 vendredi 19 octobre 2012
  • 8. • Patrimoine: le Web, un nouveau media • Contraintes légales • dépôt légal, • e-gouvernement, • publications en ligne, • corporate • Recherche • Knowledge Management, Data mining Pourquoi archiver le Web ? 8 vendredi 19 octobre 2012
  • 9. Etat des lieux • Omniprésence du Web et de ses contenus • Pourquoi archiver le Web ? • Qui archive le Web ? • Enquête 9 vendredi 19 octobre 2012
  • 10. Qui archive le Web? • Institutions privées (Fondations) • Institutions publiques à vocation patrimoniale • Archives nationales et régionales • Bibliothèques nationales, régionales et universitaires • Musées • Organisations internationales ➡ IIPC • Sociétés commerciales 10 vendredi 19 octobre 2012
  • 11. Quelques initiatives... ๏ Internet Archive Foundation ๏ Bibliothèque du Congrès ๏ Archives Nationales UK ๏ ... ๏ International Internet Preservation Consortium ๏ International Web Archiving Workshop ๏ En France ‣ Bibliothèque nationale de France (BnF) ‣ Institut national de l’Audiovisuel (InA) ‣ Quelques initiatives universitaires : IEP, université de Lorraine,... 11 vendredi 19 octobre 2012
  • 12. Etat des lieux • Omniprésence du Web et de ses contenus • Pourquoi archiver le Web ? • Qui archive le Web ? • Enquête 12 vendredi 19 octobre 2012
  • 13. Enquête 2010 (Europe) 74 réponses sur 365 institutions 8% 7% 1% 7% 23% 5% 19% 30% Yes, fully operational Yes, operational but still experimenting Yes, just starting a Web Archiving project No, but we plan to do it No, no funding No, not in our mandate No, an other institution is already in charge answered question Legal Aspects % Nb Yes, law is enacted or passed 50% 34 Yes, law is expected 16,2% 11 Lobbying are in progress 7,4% 5 No, we do not applicable law 26,5% 18 Answered question 68 Access restriction % Nb Access is online for anyone 41% 25 Access is online with restrictions 28% 17 Access is on site for anyone 18% 11 Access is on site with restrictions 21% 13 We do not have access: contents are in a completely dark archive 21% 13 Answered questionAnswered question 61 Archive policy % Nb Domain crawls - TLD (.uk, .eu, .com…) 23% 12 Thematic/selective crawls 71% 37 Only our Websites and associated Websites 30,8% 16 Answered questionAnswered question 52 13 vendredi 19 octobre 2012
  • 14. Archivage du Web : Quelle mise en œuvre ? • Etat des lieux • Vous avez dit Archivage du Web ? • Cas Pratiques • Pour aller plus loin... 14 vendredi 19 octobre 2012
  • 15. Vous avez dit Archivage Web ? • L’archivage du Web en un clin d’oeil • Besoin de compétences particulières ? • Solutions : en interne ou en externe ? Quid du Retour sur Investissement 15 vendredi 19 octobre 2012
  • 16. Quid ? Qu’est-ce qu’une archive Web ? Une copie d’un site web enregistrée par un robot (crawler) à une date et heure spécifique sur lequel on peut naviguer comme un site en ligne (vs copie d’écran et back-up) Ex: http://collections.europarchive.org/tna/*/www.tate.org.uk 16 vendredi 19 octobre 2012
  • 17. Défis d’un projet d’Archive Web • Sélectionner ce qui sera préservé • Définir des frontières • Relever des défis technologiques • Préserver un contenu non stable • Rendre accessible 17 vendredi 19 octobre 2012
  • 19. Collecte Collection horizontale (extensif) vs. Collection verticale (intensif) 19 vendredi 19 octobre 2012
  • 20. Vous avez dit Archivage Web ? • L’archivage du Web en un clin d’oeil • Besoin de compétences particulières ? • Solutions : en interne ou en externe ? Quid du Retour sur Investissement 20 vendredi 19 octobre 2012
  • 21. Compétences • Mettre en place une équipe multi-disciplinaire ‣ Sélection/contrôle qualité: Bibliothécaire / Conservateur / Archiviste,Assistant qualité, Chef de projet ‣ Capture de contenu Web/développements: Ingénieur, technicien ‣ Création et administration de l’infrastructure: Ingénieur, administrateur système ➡ L’archivage duWeb nécessite des compétences et une expérience cruciales, surtout dans le cas d’une solution entièrement en interne. 21 vendredi 19 octobre 2012
  • 22. Vous avez dit Archivage Web ? • L’archivage du Web en un clin d’oeil • Besoin de compétences particulières ? • Solutions : en interne ou en externe ? Quid du Retour sur Investissement 22 vendredi 19 octobre 2012
  • 23. Archive Web + - solution interne Contrôle de tout le processus Budgets internes Equipe en interne Autonome Ressources humaines Infrastructures solution externe Déploiement rapide Coûts adaptables aux volumes collectés Economie d’échelle Etat de l’art Dépendance à une société Problèmes organisationnels (langue, décalage horaire, IP,...) En interne ou en externe ? 23 vendredi 19 octobre 2012
  • 24. Outils d’archivage 24 • Netarchivesuite (http://netarchive.dk/suite/) ‣ Open source, développé au Danemark par la Royal Library et la State and University Library • Web curator tool: (http://webcurator.sourceforge.net) ‣ Open source, développé par la National Library of New Zealand, la British Library, à l’initiative de IIPC (International Internet Preservation Consortium) • Archive-it (http://www.archive-it.org/) ‣ service payant d’archivage Web, développé par Internet Archive vendredi 19 octobre 2012
  • 25. ArchivetheNet • Software-as-a-Service ergonomique et intuitif • 3 modules de gestion automatisés : • Administration • Collection • Rapports • Processus entièrement automatisé (montée en charge) • Personnalisation du services grâce à des options (QA,...) • Actualisation en continu de l’outils ➡ Rapide déploiement ➡ Bon Retour sur Investissement (ROI) 25 vendredi 19 octobre 2012
  • 26. Archivage du Web : Quelle mise en œuvre ? • Etat des lieux • Vous avez dit Archivage du Web ? • Cas Pratiques • Pour aller plus loin... 26 vendredi 19 octobre 2012
  • 27. Cas pratiques • Préservation • Garder une trace de l'information en ligne au fil des années • Construire une mémoire thématique • Fin de projet de recherche • Refonte complète des sites • Multimedia et réseaux sociaux • Archives Web contextualisées dans l'audiovisuel • Capture et accès: You Tube,Twitter, etc. • Au delà de la préservation, l’usage des Archives Web • Transparence et visibilité • Allègement des sites • Statistiques d’usage • Recherche 27 vendredi 19 octobre 2012
  • 28. Préservation • Garder une trace de l'information en ligne au fil des ans ✓ Parlement du Royaume-Uni ✓ CERN (où le Web est né il y a plus de 20 ans!) • Construire une mémoire thématique de contenus en ligne ✓ Bibliothèque nationale d'Irlande • Fin de projets de recherche, disparition du site et du domaine ✓ Retour sur les projets de recherche européens, ✓ Inside Installations • Refonte complète de sites ✓ RTS 28 vendredi 19 octobre 2012
  • 29. Pour une institution Archives Web du Parlement anglais 29 vendredi 19 octobre 2012
  • 30. Pour un événement Bibliothèque nationale d’Irlande 146 sites archivés, avant, pendant et après la campagne électorale 30 vendredi 19 octobre 2012
  • 31. Projets de recherche • FP6 (2000-2007): 10’000+ projets financés, soit 17+ milliards d’€ • Analyse de 200 projets (avril 2012) • 65% des projets ont fait l’objet d’un site Web : ➡ Tous les sites de projets finis depuis moins de 2 ans sont encore accessibles ➡ 23% des sites de projets finis depuis 3 ans ont disparu ➡ 32% des sites de projets finis depuis 6 ans ont disparu 31 vendredi 19 octobre 2012
  • 32. RTS: Refonte de site D’une refonte de site à un changement d’identité 2010 début 2012 aujourd’hui version archivée version archivée version en ligne 32 vendredi 19 octobre 2012
  • 33. Cas pratiques • Préservation • Garder une trace de l'information en ligne au fil des années • Construire une mémoire thématique • Fin de projet de recherche • Refonte complète des sites • Multimedia et réseaux sociaux • Archives Web contextualisées dans l'audiovisuel • Capture et accès: You Tube,Twitter, etc. • Au delà de la préservation, l’usage des Archives Web • Transparence et visibilité • Allègement des sites • Statistiques d’usage • Recherche 33 vendredi 19 octobre 2012
  • 34. Multimedia & Réseaux sociaux • Constituer des archives Web contextualisées ✓ Südwestrundfunk (SWR) • Résoudre les difficultés d’Accès pour les réseaux sociaux ✓ YouTube ✓ Twitter 34 vendredi 19 octobre 2012
  • 35. SWR: Festival Rock am Ring Contexte - Evénement sur 3 jours Taille de la campagne - Site officiel - Site de la TV - Sites des médias sociaux - Forum - Sites des médias traditionnels Fréquence: 5 fois - 3 jour avant l’événement - les 3 jours de l’événement - 3 jour après l’événement Profondeur - Complète pour 1re et 5e captures - Partiellement pour 2,3 et 4 Limites - Budget - Limites techniques - Restrictions légales - Ressources humaines Bénéfices - une vue d’ensemble - suivre l’événement en temps réel - garder une trace de la présence médiatique Festival Rock-am-Ring Complete Crawl Complete CrawlPartial Crawl Partial Crawl Partial Crawl 35 vendredi 19 octobre 2012
  • 36. SWR: Festival Rock am Ring 36 vendredi 19 octobre 2012
  • 37. Défi:Video 37 • Développement d’une méthode de capture • Remplacement du player utilisé •Modification de l’outil d’accès pour reproduire l’accès en ligne vendredi 19 octobre 2012
  • 38. Défi :You Tube 38 Capture archivée Solution générique vendredi 19 octobre 2012
  • 39. Défi :Twitter 39 Capture archivée Solution générique vendredi 19 octobre 2012
  • 40. Cas pratiques • Préservation • Garder une trace de l'information en ligne au fil des années • Construire une mémoire thématique • Fin de projet de recherche • Refonte complète des sites • Multimedia et réseaux sociaux • Archives Web contextualisées dans l'audiovisuel • Capture et accès: You Tube,Twitter, etc. • Au delà de la préservation, l’usage des Archives Web • Transparence et visibilité • Allègement des sites • Statistiques d’usage • Recherche 40 vendredi 19 octobre 2012
  • 41. Usages : Cas des Archives Nationales du Royaume Uni • Transparence et visibilité : ✓ Redirection automatique ✓ Memento • Alléger le poids de son site ✓ Redirection des Archives des sites vers l’Archive Web • Statistiques d'usage ✓ Exemple de l’Archive Web d’Irlande 41 vendredi 19 octobre 2012
  • 42. Visibilité •Accès public •Recherche • par URL et par date de capture • plein texte • navigation par catégorie •Personnalisation • Logo • Bannière • Catégorie dans la recherche avancée 42 vendredi 19 octobre 2012
  • 43. D’un site qui n’est plus en ligne 43 vendredi 19 octobre 2012
  • 44. aux archives du web 44 vendredi 19 octobre 2012
  • 45. et retour au web vivant 45 vendredi 19 octobre 2012
  • 46. Memento • Développement piloté par le Los Alamos National Laboratory et financé par la Bibliothèque du Congrès • Vise à intégrer les archives Web à la navigation Web vendredi 19 octobre 2012
  • 47. Usage et Presse 0 100 200 300 400 500 600 700 800 900 1000 M ay 11June 11July 11 August11Sept.11O ct.11N ov.11D ec.11Jan.12Feb.12 M arch 12April12M ay 12 Unique visitors per month • 21/09/2011: Lancement officiel de l’archive Web (Tweets) • 26/10/2011: Post sur le Blog nli.ie/blog et article dans thejournal.ie • 25/11/2011: article dans irishtimes.com • 20/01/2012: article dans irishtimes.com • 17/03/2012: post sur soundofthearchives.wordpress.com • 04/05/2012: article dans irisheconomy.ie Communication de la Bibliothèque nationale d’Irlande (NLI) sur son archive Web 47 vendredi 19 octobre 2012
  • 48. Cas pratiques • Préservation • Garder une trace de l'information en ligne au fil des années • Construire une mémoire thématique • Fin de projet de recherche • Refonte complète des sites • Multimedia et réseaux sociaux • Archives Web contextualisées dans l'audiovisuel • Capture et accès: You Tube,Twitter, etc. • Au delà de la préservation, l’usage des Archives Web • Transparence et visibilité • Allègement des sites • Statistiques d’usage • Recherche 48 vendredi 19 octobre 2012
  • 49. Exemples - Recherche Projet de recherche thématique : enpolitique.com • Etude de l'évolution des sites web politiques lors de campagnes nationales (France & Québec) • Pertinence du projet face à la disparition des sites Ex: http://toushollande.fr fermé et redirigé vers la page Facebook du candidat élu 49 vendredi 19 octobre 2012
  • 50. Archivage du Web : Quelle mise en œuvre ? • Etat des lieux • Vous avez dit Archivage du Web ? • Cas Pratiques • Pour aller plus loin... 50 vendredi 19 octobre 2012
  • 51. Pour aller plus loin... ... face aux nombreux challenges du Web et de son archivage • Web caché & profond • Spams & boucles • Sites dynamiques • Média sociaux • Multimedia • Web Mining 51 vendredi 19 octobre 2012
  • 52. Internet Memory relève le défi • Crawl sélectif : ✓ LiWA (2007-2010) ✓ ARCOMEM (2010-2013) • Préservation : ✓ SCAPE (2010-2013) • Big Data et traitement de l’information Web : ✓ LK (2009-2012) ✓ LAWA (2010-2013) ✓ TrendMiner (2011-2014) ✓ DOPA (2012-2014) ✓ AnnoMarket (2012-2014) ... et s’engage dans des projets de recherche 52 vendredi 19 octobre 2012
  • 53. Internet Memory Internet Memory Foundation Amsterdam - Paris • Fondation à but non lucratif • Préservation & Open Access http://internetmemory.org @InternetMemory Internet Memory Research Paris • Services d’Archivage http://archivethe.net @ArchivetheNet • Services de traitement de l’information à grande échelle http://mignify.com @mignify 53 vendredi 19 octobre 2012
  • 54. Merci de votre attention 54 vendredi 19 octobre 2012