Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich

Präsentation zur Nestor Veranstaltung "Webarchivierung im deutschsprachigen Raum"

Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich Mag. Michaela Mayr Österreichische Nationalbibliothek [email_address] www.onb.ac.at

Warum Webarchivierung? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Wer macht Webarchivierung? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Herausforderungen ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Domain Wachstum D-A-CH CH DE AT Quellen: http://www.denic.de , http://www.nic.at/ , https://www.nic.ch

Web@rchiv Österreich (1) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Web@rchiv Österreich (2) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Grafik: Kurier, http://kurier.at/techno/2004890.php

Sammlungsstrategien (1) ,[object Object],[object Object],[object Object],[object Object],[object Object]

Domain Crawl 2009/2010 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Sammlungsstrategien (2) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Sammlungsstrategien (3) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Statistik gesamt ,[object Object],[object Object],[object Object]

Zugang (1) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Zugang (2) ,[object Object],[object Object],[object Object],[object Object]

Weitere Infos: http://www.onb.ac.at/about/webarchivierung.htm Social Media: http://twitter.com/AT_Webarchive http://www.facebook.com/ATWebarchive http://www.slideshare.net/ATWebarchive http://screenr.com/user/AT_Webarchive Fragen?

Empfohlen

(2) Von der Hofbibliothek zum digitalen Medienzentrum

Österreich liest Vortrag zum Web@rchiv Österreich

Aufbau eines zentralen Indexes im GBV

Kooperativer Aufbau zentraler Lucene-Indices für lokale Portale

Wie verbreitet sich die digitale Publikation im Netz?ZBW - Leibniz-Informationszentrum Wirtschaft

G. Spuhler (Archiv für Zeitgeschichte) - Von Bau eines Archivportals: Möglich...

infoclio.ch

VuFind - Ein Open Source Projekt

Web@rchiv Österreich bei "Österreich liest"

Empfohlen

(2) Von der Hofbibliothek zum digitalen Medienzentrum

Österreich liest Vortrag zum Web@rchiv Österreich

Aufbau eines zentralen Indexes im GBV

Kooperativer Aufbau zentraler Lucene-Indices für lokale Portale

Wie verbreitet sich die digitale Publikation im Netz?ZBW - Leibniz-Informationszentrum Wirtschaft

G. Spuhler (Archiv für Zeitgeschichte) - Von Bau eines Archivportals: Möglich...

infoclio.ch

VuFind - Ein Open Source Projekt

Web@rchiv Österreich bei "Österreich liest"

EconStor - ein vernetztes Fach-RepositoriumZBW - Leibniz-Informationszentrum Wirtschaft

Bam Vortrag Fh Lb

ICARUS - International Centre for Archival Research

co:op-READ-Convention Marburg - Christian Groh

Christian Groh (International Tracing Service – ITS, DE): Unterlagen der NS-Gewaltherrschaft und der unmittelbaren Nachkriegszeit co:op-READ-Convention Marburg Technology meets Scholarship, or how Handwritten Text Recognition will Revolutionize Access to Archival Collections. With a special focus on biographical data in archives Hessian State Archives Marburg Friedrichsplatz 15, D - 35037 Marburg 19-21 January 2016

Berliner DH Rundgang

cneudecker

Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...

Im Juli 2015 wurde der neue Bibliothekskatalog der SLUB Dresden freigeschaltet. Nach nur drei Monaten Entwicklungszeit konnte auf Basis von einer an der SUB Göttingen entwickelten und von der SLUB Dresden angepassten TYPO3-Erweiterung „Find“ eine moderne, vollständig quelloffene Rechercheoberfläche unter http://katalogbeta.slub-dresden.de veröffentlicht werden. Das Hauptargument für die Eigenentwicklung war die Unzufriedenheit mit der Rückschrittlichkeit kommerzieller Discovery-Lösungen sowie die fehlende Modularität von bestehenden Open-Source-Alternativen wie VuFind. Mit der jetzt geschaffenen Lösung erhält die SLUB Dresden die Möglichkeit schnell auf Wünsche der NutzerInnen zu reagieren. Die ersten Rückmeldungen bestätigen diesen Ansatz. Bis September 2015 sind mehr als 100 konstruktive Entwicklungswünsche eingegangen, von denen bereits mehr als die Hälfte umgesetzt werden konnte. Die Entwicklung steht zur Nachnutzung an anderen Bibliotheken zur Verfügung und ist auch für andere Rechercheoberflächen (wie z.B. digitale Sammlungen) universell einsetzbar. Voraussetzung für die Nutzung der Rechercheoberfläche ist ein Werkzeug für die Datenintegration. Das an der SLUB eingesetzte Discovery-System besteht aus drei quelloffenen Komponenten: Die an der UB Leipzig im Rahmen eines EFRE-Projektes geschaffene Datenmanagement-Infrastruktur finc Die an der SLUB Dresden im Rahmen von EFRE-Projekten entwickelten Datenmanagement-Werkzeuge D:SWARM und Tiefenerschließung Die oben beschriebene Lösung auf Basis von TYPO3 Find Zusammen entsprechen diese drei Komponenten dem Funktionsumfang von gängigen Discovery-Systemen, wie beispielsweise PRIMO von Ex Libris oder Summon von ProQuest. Die Systemarchitektur ist modular aufgebaut, so dass die Komponenten auch unabhängig voneinander eingesetzt werden können. Im Vortrag wird die dritte Komponente, sowie die zugrunde liegende Discovery-Strategie ausführlicher vorgestellt.

Informationsbeschaffung in BibliothekenBibliothek der Hochschule Hannover

Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...

Vortrag auf dem Bibliothekskongress 2013 in Leipzig Abstract 303 Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler Augenhöhe unterstützen R. David Lankes hat dieses Jahr mit der These provoziert, dass schlechte Bibliotheken Sammlungen, gute Bibliotheken Dienstleistungen und großartige Bibliotheken Communities aufbauen. Für die aktive Gestaltung des Medienwandels gewinnt Community Building in vielfältigen Ausprägungen an Bedeutung: Eine aktive Nutzerschaft hilft bei der Erwerbung (Patron Driven Acquisition), bei der Erschließung (Crowdsourcing) und in der Benutzung (Selbstbedienung). Wissenschaftliche Bibliotheken haben im wörtlichen Sinne "von Haus aus“ eine Community: Täglich tausende Besucher sind die beste Basis, um auch virtuell eine Gemeinschaft zu begründen. An manchen Universitäten, vornehmlich an Eliteunis in den USA, sind campusinterne Facebooks entstanden. Gleichzeitig entwickeln sich die klassischen Forschungsinformationssysteme zaghaft in Richtung Social Web. Damit entstehen virtuelle Campus Communities, die Bibliotheken nutzen können, um den Kontakt zwischen Fachreferaten und der Universität neu zu beleben. Fachreferentinnen und Fachreferenten können sich in den lokalen Forschungsdiskurs einschalten und auf einem zeitgemäßen Kanal bibliothekarisches Wissen und moderne Konzepte wie Open Access und Open Data verbreiten. Gleichzeitig besitzen Bibliotheken mittlerweile das nötige IT-Know-How, um sich als Betreiber der technischen Plattform für die Campus Community zu positionieren. So können andere Dienste (Dokumentenserver, E-Learning, Katalog) verknüpft und direkt in die Arbeitsumgebung der Forschenden integriert werden. Die klassische Meldestelle für Hochschulpublikationen kann entfallen, wenn Forschende ihre Publikationen auf der Campus-Community-Plattform selbst einstellen. Stets aktuelle Verweise auf Forschungsschwerpunkte können genutzt werden, um die Erwerbung besser am tatsächlichen Bedarf auszurichten. Perspektivisch kann damit auch die Abhängigkeit von kommerziellen Anbietern bibliografischer Daten reduziert werden. Hinzugefügte Sprecher: Felix Lohmeier , SLUB Dresden , Dresden , Germany Verknüpft in Sitzungen: 13.03.2013, 16:00-18:00, Zielgruppenerwartungen und Dienstleistungen, Nutzungsorientierte Bestandsprofilierung, Seminarraum 6/7

Rechte an Daten und Metadaten. Erfahrungen aus dem Projekt Europeana regia

schassan

TextGrid 2.0 @ Bibliothekartag 2012

Karlsruhe Institute of Technology (KIT)

Digitale Editionsprojekte mit Werkzeugen unterstützen und en passant dieNachnutzbarkeit der Forschungsdaten fördern: Das Beispiel TextGrid TextGrid is designed for researchers who require tools and services for the description, annotation, indexing, analysis, and publication of cultural artifacts, particularly texts, images, manuscripts, musical score, and other objects, and who place value on long-term data curation and ensuring the reusability of research data. TextGrid is a research group consisting of ten project partners and has been funded since February 2006 by the German Federal Ministry for Education and Research. Since the release of TextGrid version 1.0 in July 2011, the Virtual Research Environment is primarily used by projects creating digital editions in philology, the history of science, and musicology. In this presentation in the session "Virtual Research Environments," TextGrid's specific organizational and technical approach, in contrast to other concepts for Virtual Research Environments, will be presented. TextGrid is developing a complete solution for the entire research process in digital edition projects. TextGrid provides two closely linked components: a desktop software with research tools and a repository for research data. In the integrated work environment, researchers will have direct access to help functions and tools for metadata encoding and for long-term preservation, with the aim of ensuring the long-term availability and accessibility of research data. Using the example of various publishing projects that already use TextGrid in their research, the advantages and disadvantages of the TextGrid approach will be discussed. The Lower Saxony State and University Library, Goettingen, is leading the project. As an academic library, it sees as its task to work together with scholarly disciplines to develop services to support the research process and to promote the use of digital methods.

Open Access auf Länderebene - das Beispiel Baden-Württemberg

Vortrag Paderborn Objektportale (Arbeitsstand: 14.1.2013)bildsymbol123

Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen

Georg Vogeler

Vortrag auf der DHd2019: https://dhd2019.org/programm/do/1100-1230/session-datenmodelle-und-schnittstellen/vortrag-269/ Der Beitrag stellt einen Vorschlag vor, mit dem der Datenaustausch über Personen jenseits allgemeiner Linked Open Data-Lösungen verbessert werden kann. Aufbauend auf dem von Bradley/Short entwickelten Factoid-Datenmodell, bezieht er sichauf technische Lösungen zur Definition von RESTful APIs (OpenAPI) und dem Einsatz einer Upper Level Ontologie des CIDOC-CRM, wie er in der dataforhistory-Initiative propagiert wird. Der Beitrag beschreibt die API-Definition, ordnet sie in die Geschichte der digitalen Prosopographie ein und skizziert Implementationen auf der Seite Datenanbieter wie der der Datenkonsumenten.

Bam Clio

Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...

Wozu brauchen wir noch wissenschaftliche Bibliotheken, wenn alle Forschungsergebnisse kostenfrei und öffentlich verfügbar sind (100% Open Access), zu allen Forschungsthemen kostenfreie Kurse der Ivy League abrufbar sind (100% MOOCs) und mir Peers in akademischen Communities zu allen Spezialfragen sofort weiterhelfen (100% Follower-Power)? In aktuellen Debatten zur Perspektive von (wissenschaftlichen) Bibliotheken verweisen die meisten Strategien auf die Bibliothek als Raum und Treffpunkt, neue Multimedia-Angebote und neue Aufgaben im Forschungsdatenmanagement. Das reicht als kurzfristige Überlebensstrategie, folgt aber keiner größeren Vision für die zukünftige Rolle von Bibliotheken. Dabei ist spätestens mit dem "Ende der Gratiskultur", welche die Medienkonzerne 2010 eingeläutet haben, und der Erkenntnis, dass ein Weltkonzern wie Google dem Motto "Don't be evil" nicht gerecht werden kann, das Spielfeld für Bibliotheken im Internet ganz neu eröffnet. Es zeigt die tiefe Resignation der Bibliotheksbranche, wenn Oligopole für Wissenschaftsevaluation (Impact Factor), Preisdiktate von großen Zeitschriftenverlagen, DRM-Einschränkungen bei eBooks und langfristige Abhängigkeiten von kommerziellen Bibliotheksdienstleistern hingenommen werden. Der freie Zugang zum Wissen unterliegt ständigen Gefährdungen und Bedrohungen, die von Marktinteressen und Nutzerdesinteresse ausgehen. Funktioniert der Markt nach den Prinzipien der Openness (wofür es durchaus wirtschaftliche Anreize gibt), sollten Bibliotheken nicht im Wege stehen. Ist jedoch die Openness der Angebote gefährdet, lohnt es einzugreifen und selbst Dienste aufzubauen, bis die Openness wiederhergestellt ist. Daher plädiere ich in diesem Vortrag für eine Positionierung der Bibliotheken als Wächter für den (dauerhaft) freien Zugang zum Wissen. Angewandt auf die heutige Zeit erfordert dies eine konsequente Ausrichtung des eigenen Handelns an den Prinzipien von Open Science und Open Data.

TUB HH - Universitaetsbibliothek der TUHH: Eine Bibliothek im Uebergang!Thomas Hapke

Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...

intranda GmbH

Einheitliche Normdatendienste der VZG

Jakob .

Colloque infoclio 2010infoclio.ch

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...

Semantic MediaWiki als OpenGLAM tool - historisches Lexikon der Stadt Wien

Bernhard Krabina

Semantic Web für Dummieskostaedt

Fit für Web 3.0 - Semantische Technologien

UrsulaDeriu

Weitere ähnliche Inhalte

Was ist angesagt?

EconStor - ein vernetztes Fach-RepositoriumZBW - Leibniz-Informationszentrum Wirtschaft

Bam Vortrag Fh Lb

ICARUS - International Centre for Archival Research

co:op-READ-Convention Marburg - Christian Groh

Berliner DH Rundgang

cneudecker

Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...

Informationsbeschaffung in BibliothekenBibliothek der Hochschule Hannover

Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...

Rechte an Daten und Metadaten. Erfahrungen aus dem Projekt Europeana regia

schassan

TextGrid 2.0 @ Bibliothekartag 2012

Karlsruhe Institute of Technology (KIT)

Open Access auf Länderebene - das Beispiel Baden-Württemberg

Vortrag Paderborn Objektportale (Arbeitsstand: 14.1.2013)bildsymbol123

Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen

Georg Vogeler

Bam Clio

Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...

TUB HH - Universitaetsbibliothek der TUHH: Eine Bibliothek im Uebergang!Thomas Hapke

Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...

intranda GmbH

Einheitliche Normdatendienste der VZG

Jakob .

Colloque infoclio 2010infoclio.ch

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...

ICARUS - International Centre for Archival Research

Semantic MediaWiki als OpenGLAM tool - historisches Lexikon der Stadt Wien

Bernhard Krabina

Was ist angesagt? (20)

EconStor - ein vernetztes Fach-Repositorium

Bam Vortrag Fh Lb

co:op-READ-Convention Marburg - Christian Groh

Berliner DH Rundgang

Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...

Informationsbeschaffung in Bibliotheken

Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...

Rechte an Daten und Metadaten. Erfahrungen aus dem Projekt Europeana regia

TextGrid 2.0 @ Bibliothekartag 2012

Open Access auf Länderebene - das Beispiel Baden-Württemberg

Vortrag Paderborn Objektportale (Arbeitsstand: 14.1.2013)

Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen

Bam Clio

Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...

TUB HH - Universitaetsbibliothek der TUHH: Eine Bibliothek im Uebergang!

Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...

Einheitliche Normdatendienste der VZG

Colloque infoclio 2010

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...

Semantic MediaWiki als OpenGLAM tool - historisches Lexikon der Stadt Wien

Andere mochten auch

Semantic Web für Dummieskostaedt

Fit für Web 3.0 - Semantische Technologien

UrsulaDeriu

Web crawler and applications

Partnered Health

A web crawler is a program that systematically browses websites to index them for search engines like Google and Bing. It starts with popular websites that have high traffic and reads pages to find links to other pages, following those links to crawl the web in an automated way and index all content for search engines. The process allows search engines to constantly discover and catalog new pages to provide up-to-date search results to users.

Web crawler

crazyprave12490

This document summarizes a research paper on implementing a web crawler on a client machine rather than a server. It describes the basic workings of web crawlers, including downloading pages, extracting links, and recursively visiting pages. It then presents the design of a crawler that uses multiple HTTP connections and asynchronous downloading via multiple threads to optimize performance on a client system. The software architecture includes modules for URL scheduling, multi-threaded downloading, parsing pages to extract URLs/content, and storing downloaded data in a database.

“Web crawler”

ranjit banshpal

This document discusses the architecture and approaches of web crawlers. It describes how web crawlers work by systematically browsing websites to gather pages. The key components of a web crawler include its crawling process, which prioritizes URLs using selection policies. Web crawlers are important utilities as they support search engines by gathering pages to improve searching efficiency and perform tasks like data mining and web site analysis. The document reviews several papers on focused crawling and ontology-based approaches. It also discusses challenges for crawlers in selecting important pages to download while avoiding overloading websites.

Webcrawler

Govind Raj

Web crawling involves automated programs known as web crawlers or spiders that systematically browse the World Wide Web and extract information from websites. Crawlers are used by search engines to build comprehensive indexes of websites and their contents. The basic operation of crawlers involves starting with seed URLs, fetching and parsing web pages to extract new URLs, placing those URLs on a queue to crawl, and repeating the process. There are various types of crawlers that differ in how frequently they recrawl sites and whether they focus on specific topics. Key challenges of web crawling include the large volume and dynamic nature of web content as well as high rates of change.

Search engine and web crawler

ishmecse13

The document discusses search engines and web crawlers. It provides information on how search engines work by using web crawlers to index web pages and then return relevant results when users search. It also compares major search engines like Google, Yahoo, MSN, Ask Jeeves, and Live Search based on factors like market share, database size and freshness, ranking algorithms, and treatment of spam. Google is highlighted as having the largest market share and best algorithms for determining natural vs artificial links.

Working of a Web Crawler

Sanchit Saini

A web crawler works by starting with a specified URL and recursively retrieving links within pages to build a crawl frontier of URLs to visit. It checks each URL to see if it exists and parses the page to extract new links, adding them to the frontier. This process continues recursively to a depth of around 5 levels typically to gather most on-site information before stopping to avoid getting trapped on pages with infinite loops of links.

Web crawler

anusha kurapati

Web crawlers, also known as robots or bots, are programs that systematically browse the internet and index websites for search engines. Crawlers follow links from seed URLs and download pages to extract new URLs to crawl. They use techniques like breadth-first crawling to efficiently discover as much of the web as possible. Crawlers must have policies to select pages, revisit sites, be polite to not overload websites, and coordinate distributed crawling. Their high-performance architecture is crucial for search engines to comprehensively index the large and constantly changing web.

Web Crawler

iamthevictory

Web crawling involves automated programs called crawlers or spiders that browse the web methodically to index web pages for search engines. Crawlers start from seed URLs and extract links from visited pages to discover new pages, repeating the process until a desired size or time limit is reached. Crawlers are used by search engines to build indexes of web content and ensure freshness through revisiting URLs. Challenges include the web's large size, fast changes, and dynamic content generation. APIs allow programmatic access to web services and information through REST, HTTP POST, and SOAP.

Getting Data with import.io | SEO CAMPIXX 2016

Kerstin Reichert

2013-10-10 Semantic Web und (Linked) Open Data

kostaedt

Andere mochten auch (12)

Semantic Web für Dummies

Fit für Web 3.0 - Semantische Technologien

Web crawler and applications

Web crawler

“Web crawler”

Webcrawler

Search engine and web crawler

Working of a Web Crawler

Web crawler

Web Crawler

Getting Data with import.io | SEO CAMPIXX 2016

2013-10-10 Semantic Web und (Linked) Open Data

Ähnlich wie Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich

TU Wien Gastvortrag 07.06.2010, Michaela MayrWeb@rchive Austria

Europeana - Status - Metadaten - Semantische InteroperabilitätMax Kaiser

Europeana: Status - Datenlieferungen - MetadatenMax Kaiser

EuropeanaConnect

Max Kaiser

EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTMax Kaiser

Europeana - Das europäische KulturportalMax Kaiser

INTERNET UND HISTORIOGRAFIESlobodan Mandic

Europeana und Deutsche Digitale Bibliothek

SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...Institute for Digital Humanities, University of Cologne

Einführung in FachrechercheBibliothek der Hochschule Hannover

20080507 gute ergebnisse