Problem erkannt, Problem gebannt? Mit  SFX Parsern die Verlinkungsqualität verbessern Inga Overkamp, MPDL 15.06.2010
Ausgangssituation SFX Server SFX KB R R R SFX Source SFX Target R muss korrekte  und vollständige Metadaten liefern muss fehlerfrei konfiguriert sein und Ausnahmen berücksichtigen muss Anfragen erwartungsgemäß verarbeiten Source  Parser Target Parser
Strategien für den MPG/SFX-Server Aufwändige Pflege der KnowledgeBase, z.B. durch  manuelle Kontrolle der SFX Updates automatisierte Prüfung von Target-URLs (im Verdachtsfall) Zeitnahe Reaktion auf Fehlermeldungen von Nutzern Prüfung: Einzelfall oder systematisches Problem? Meldung an den Informationsanbieter Bei systematischen Problemen außerhalb des direkten Einflussbereichs mit „hoher Relevanz“: Implementierung und Betreuung von lokalen Zwischenlösungen.
Beispiel 1: DOIs aus dem Web of Science, I Beobachtung: Nutzer melden immer wieder Probleme bei der Volltextverlinkung über SFX auf diversen Plattformen Analyse: Probleme werden durch fehlerhafte DOIs in Thomsons Web of Science (WoS) ausgelöst.  Status: Thomson behebt einzelne Probleme auf Anfrage; eine grundsätzliche Lösung wird von Thomson nicht angestrebt
Beispiel 1: DOIs aus dem Web of Science, II Zwischenlösung:  Überprüfung jeder WoS-OpenURL auf DOIs, die über CrossRef  und den globalen DOI Resolver nicht auflösbar sind, um diese aus dem “Context Object” zu löschen. Admin-Skript zur Ermittlung von „auflösbaren“ DOIs für die geloggten Metadaten und Meldung an Thomson Support. Ergebnisse:  Seit August 2009 wurden > 3.500 nicht auflösbare DOIs ermittelt Für 40% hat das Admin-Skript eine alternative DOI gefunden Die restlichen 60% werden manuell durch Hiwis geprüft, z.B. fehlende Registrierung durch Verlag (Meldung an CrossRef), unterschiedliche DOIs
Beispiel 2: inbound OpenURL-Schnittstelle von Wiley, I Beobachtung: Nach der Einführung der SFX-Verlinkung über die Wiley inbound openURL-Schnittstelle, melden Nutzer verstärkte Probleme. Analyse: Wileys inbound openURL stellt sich als unzuverlässig heraus. Von außen ist schwer einzuschätzen, welche Anfragen “funktionieren” und welche nicht. Status: Wiley gesteht Problem ein und versucht sie zu lösen. Dieser Prozess gestaltet sich aber als sehr langwierig, auch weil für den Sommer eine neue Plattform angekündigt ist.
Beispiel 2: inbound OpenURL-Schnittstelle von Wiley, II Zwischenlösung: Prüfung der Target URLs (HTTP Requests)  im SFX Target Parser. Falls eine Fehlermeldung zurückkommt, wird der Nutzer auf die Wiley Homepage umgeleitet. Ergebnisse:  Im letzten Monat wurden 360 Fehlermeldungen protokolliert (nicht dedupliziert) Häufig werden die Probleme durch fehlerhafte Metadaten ausgelöst.  Darüber hinaus gibt es Probleme mit großen Buchstaben in  DOIs (10.1111/J.1364-3703.2007.00384.X) und einer ganzen Reihe von ISSNs früherer Titel
Diskussion  Alle Zwischenablösung müssen auf Kosten und Nutzen abgewägt werden -> nicht alles was machbar ist, kann mit den verfügbaren Ressourcen gemacht werden! Darüber hinaus darf man die Informationsanbieter nicht aus der Pflicht nehmen -> Aufnahme technischer Anforderungen in Lizenzverträge, z.B. auch standardgerechte Verwendung HTTP Error Codes Aber trotzdem: Den Nutzer möglichst wenig “leiden lassen”

Problem erkannt, Problem gebannt?

  • 1.
    Problem erkannt, Problemgebannt? Mit SFX Parsern die Verlinkungsqualität verbessern Inga Overkamp, MPDL 15.06.2010
  • 2.
    Ausgangssituation SFX ServerSFX KB R R R SFX Source SFX Target R muss korrekte und vollständige Metadaten liefern muss fehlerfrei konfiguriert sein und Ausnahmen berücksichtigen muss Anfragen erwartungsgemäß verarbeiten Source Parser Target Parser
  • 3.
    Strategien für denMPG/SFX-Server Aufwändige Pflege der KnowledgeBase, z.B. durch manuelle Kontrolle der SFX Updates automatisierte Prüfung von Target-URLs (im Verdachtsfall) Zeitnahe Reaktion auf Fehlermeldungen von Nutzern Prüfung: Einzelfall oder systematisches Problem? Meldung an den Informationsanbieter Bei systematischen Problemen außerhalb des direkten Einflussbereichs mit „hoher Relevanz“: Implementierung und Betreuung von lokalen Zwischenlösungen.
  • 4.
    Beispiel 1: DOIsaus dem Web of Science, I Beobachtung: Nutzer melden immer wieder Probleme bei der Volltextverlinkung über SFX auf diversen Plattformen Analyse: Probleme werden durch fehlerhafte DOIs in Thomsons Web of Science (WoS) ausgelöst. Status: Thomson behebt einzelne Probleme auf Anfrage; eine grundsätzliche Lösung wird von Thomson nicht angestrebt
  • 5.
    Beispiel 1: DOIsaus dem Web of Science, II Zwischenlösung: Überprüfung jeder WoS-OpenURL auf DOIs, die über CrossRef und den globalen DOI Resolver nicht auflösbar sind, um diese aus dem “Context Object” zu löschen. Admin-Skript zur Ermittlung von „auflösbaren“ DOIs für die geloggten Metadaten und Meldung an Thomson Support. Ergebnisse: Seit August 2009 wurden > 3.500 nicht auflösbare DOIs ermittelt Für 40% hat das Admin-Skript eine alternative DOI gefunden Die restlichen 60% werden manuell durch Hiwis geprüft, z.B. fehlende Registrierung durch Verlag (Meldung an CrossRef), unterschiedliche DOIs
  • 6.
    Beispiel 2: inboundOpenURL-Schnittstelle von Wiley, I Beobachtung: Nach der Einführung der SFX-Verlinkung über die Wiley inbound openURL-Schnittstelle, melden Nutzer verstärkte Probleme. Analyse: Wileys inbound openURL stellt sich als unzuverlässig heraus. Von außen ist schwer einzuschätzen, welche Anfragen “funktionieren” und welche nicht. Status: Wiley gesteht Problem ein und versucht sie zu lösen. Dieser Prozess gestaltet sich aber als sehr langwierig, auch weil für den Sommer eine neue Plattform angekündigt ist.
  • 7.
    Beispiel 2: inboundOpenURL-Schnittstelle von Wiley, II Zwischenlösung: Prüfung der Target URLs (HTTP Requests) im SFX Target Parser. Falls eine Fehlermeldung zurückkommt, wird der Nutzer auf die Wiley Homepage umgeleitet. Ergebnisse: Im letzten Monat wurden 360 Fehlermeldungen protokolliert (nicht dedupliziert) Häufig werden die Probleme durch fehlerhafte Metadaten ausgelöst. Darüber hinaus gibt es Probleme mit großen Buchstaben in DOIs (10.1111/J.1364-3703.2007.00384.X) und einer ganzen Reihe von ISSNs früherer Titel
  • 8.
    Diskussion AlleZwischenablösung müssen auf Kosten und Nutzen abgewägt werden -> nicht alles was machbar ist, kann mit den verfügbaren Ressourcen gemacht werden! Darüber hinaus darf man die Informationsanbieter nicht aus der Pflicht nehmen -> Aufnahme technischer Anforderungen in Lizenzverträge, z.B. auch standardgerechte Verwendung HTTP Error Codes Aber trotzdem: Den Nutzer möglichst wenig “leiden lassen”

Hinweis der Redaktion

  • #3 Aus der Sicht des Nutzers ist jedes Versagens eines dieses Teile ein Versagen des SFX-Servers!