SlideShare a Scribd company logo
1 of 45
Download to read offline
Ut og vaske poster 
– FRBRisering i Podeprosjektet
     Anne­Lena Westrum, Deichmanske bibliotek, Digitalt bibliotek
     Trond Aalberg, NTNU
     Asgeir Rekkavik, Deichmanske bibliotek, Voksenavdelingen
     Anne Karine Sandberg, Deichmanske bibliotek, Katalogavdelingen


http://www.bibpode.no // Twitter: @podeprosjekt
Tilgang til egne katalogdata




                               Iguanasan ­ by­nc­nd
Bedre brukeropplevelse
Sette brukeren i sentrum og 
 alltid gi brukeren treff og 
         veier videre
Ingen metadata – Ingen tjenester!




                              Iguanasan ­ by­nc­nd
MARC; snart 50 år og godt 
 over middagshøyden?
Fokus!
Metadata is King!




                    Slices of Light ­ by­nc­nd
Trefflistene er et problem –
           uansett
FRBR og verkspresentasjon
     Knut Hamsun fra 587 til  38
FRBR og FRBRisering
 FRBR‐modellen
   Modell av entiteter, relasjoner og attributter som er av 
   interesse for sluttbrukere av bibl. informasjon
   Litt ny tankegang, litt opprydding i terminologi, men det 
   mest vesentlige er kanskje en ”formell” modell
 FRBRisering
   Populær term i prosjekter hvor vi prøver å tolke eller 
   konvertere eksisterende bibliografisk informasjon i 
   henhold til FRBR‐modellen
FRBRisering eksperiment 
Deichmanske og IDI, NTNU

 Institutt for datateknikk og inf. vitenskap
   Startet med eksperimentell konvertering av BIBSYS
   Og har jobbet med dette i andre prosjekter seinere
 Deichmanske
   Pode‐prosjektet generelt interessert i FRBR og muligheten 
   for FRBRisering av egne data
 Ble enige om å sammen prøve ut en FRBRisering
 av noen eksempler fra Deichmans katalog
Hva vi var interessert i (til slutt)
 Hvilke entiteter og relasjoner kan vi systematisk 
 trekke ut av MARC dataene?
 Hva er kvaliteten på resultatet?
 Hva er vesentlige årsaker til dårlig resultat?
 Hvilke begrensinger og/eller problemer gir 
 dagens bruk av MARC‐formatet og dagens 
 katalogiseringspraksisen?
Litt om verktøyet for frbrisering
 XSLT‐basert konvertering av MARC‐poster
   MARC‐poster i XML som input
   Produserer FRBR‐poster i XML som output
   En post for hver unike entitet (person, verk, uttrykk, ..)
   Med lenker for relasjonene


 Bruker en database med regler for hvilke entiteter og 
 relasjoner som skal opprettes under hvilke betingelser
 Automatisk generering av selv XSLT‐fila som konverterer
   Kan tilpasses et hvilket som helst MARC format – krever bare at du 
   lager reglene for å tolke formatet
FRBR­modellen
 i praksis

                         Verk om
                         Hamsun




Verk av Hamsun
Forskjellige uttrykk               Verk basert på
Oversettere, innlesere             verk av Hamsun
Litt mer 
avanserte
                            Samlede verker hvor enkeltbindene
                            inneholder 1 eller flere romaner
                            Bind 1: Sult
                            Bind 4: Pan, Victoria
                            Bind 6: Rosa, Benoni




Novellesamlinger
En eller flere forfattere                        Essay‐samlinger som hver 
                                                 har separate Hamsun‐verk 
                                                 som emne
Første runde med FRBRisering
 Vi tok for oss 4 forskjellige test‐samlinger
   Knut Hamsun, Per Petterson, 
   J.R.R. Tolkien, William Shakespeare
 Laget en HTML‐basert presentasjon av resultatet 
 og hadde manuell evaluering
 Resultatet var egentlig som forventet, og inneholdt 
 ”mye rart”
Resultat fra 
første runde
Verk av Petterson
  Ut og stjæle hester
  Til Sibir
  I kjølvannet
  Jeg forbanner tidens elv
  Det er greit for meg                Egentlig ikke så ille…..
                                      ‐ men det mangler mange noveller 
  Aske i munnen, sand i skoa
                                      ‐ og noen verk er feil
  Confesiunile unei femei visatoare
  Ekkoland
  Fuori a rubar cavalli
  Kielzog
  Månen over Porten
  Til Sibiru
  V Sibir!
Hamsun 
(et lite utvalg)                      Generelt et dårlig resultat

                                      Bedre utnyttelse av biinførsler
  Basaren                             siden vi kunne spesialbehandle 
  Benoni                              ”samlede verker)
  Benoni og Rosa
  Benoni. Rosa                        Men også mange feilkilder
  Bjørger
  Blant dyr
  Brev til Marie
  Børn av tiden
  Dagboksblad
  Damen fra tivoli
  Das Sausen und Waldes; [Gedichte]
  Den gaadefulde
  Den gåtefulle
  Den sidste glæde
  Den siste glede
  Den siste glæde
  Det vilde kor
  Det vilde kor og andre dikt
  Det vilde kor, og andre dikte
For mange verk
 Verk identifiseres med forfatter + tittel 
 Hvis 240 ikke finnes i posten brukes 245
 Generelle problemer
   Oversettelser som mangler 240
   Forskjellig skriveform (eller skrivefeil) 
   i 240 / 245 titler  
   Titler i 240 /245 som ikke er verk
For få verk
(fra biinnførslene)
 Vanskelig å vite hvordan biinnførslene skal tolkes
    Novellesamlinger med 700‐innf. for novelle‐titlene
    Filmer med 700‐innf. for romanen filmen er basert på
 Er en 740‐tittel en alternativ skriveform eller et 
 eget uttrykk/verk?
 Hvis innholdet er beskrevet med 700/740 
 hvordan skal vi da tolke 240/245 titler og hvilke 
 relasjoner finnes?
    Kollektiv tittel som ikke er verk (Samlede verker)
    Eller eget verk  (Norske perler i prosa)
Andre utfordringer
 Uttrykk
   Språk og formkode for å identifisere uttrykk
   Ingen egne titler for uttrykkene (vanskelig å velge)
 Relasjoner
   Mange varianter av samme funksjonskode
   ”M:N” – problematikk
 Emner
   Titler i emneinnførsler er på norsk selv om org. tittel er på
   annet språk
Runde 2
 Mulighet for bedre resultat med bedre data!
 Valgte å jobbe videre med Hamsun og Petterson
 Redigering av postene
   Retting av titler, legge til orginaltitler etc.
   Bruke indikatorer for titler som identifiserer verk
 Nye regler for konverteringen
 Ny kjøring og nytt resultat
Hva som ble rettet i postene
Tall fra Hamsun­fila (842 poster)
 Endring av språkkoder i noen få poster (5)
 La til 240$a (85) og rettet skriveform (24)
 Rette skrivefeil eller ISBD‐syntaks i 245$a (6)
 Endre første indikator i 245 slik at denne viser om 
 245‐tittel er verk eller ikke
   Etter redigeringen er det 113 færre 245‐felt som skal 
   tolkes som verk
Videre…
 Mer systematisk/konsekvent bruk av 700/740
   740 der alle titler har samme forfatter (i 100)
   Samme skriveform i 740 som man ville brukt i 240
 Systematisk bruk av andre indikator i 700/740 for 
 å synliggjøre om dette er et eget verk
 Stor antall endringer (vanskelig å tallfeste)
Litt statistikk for Hamsun
Litt statistikk for Petterson
Resultatet etter andre runde
 Færre ”feil” verk
   Fordi det var mulig å ekskludere ikke‐verks titler
   Fordi det fantes 240‐titler der det var nødvendig
 Flere ”riktige” verk
   Fordi det var mulig å bruke titler i 700 og 740 riktig
 I tillegg var det mye enklere å lage regler
   Men fortsatt er det mye informasjon i postene som er 
   vanskelig å tolke automatisk
Konklusjon
 FRBR‐modellen stiller nye krav
   Til MARC‐formatet, katalogiseringsreglene, data
 Paradokset er at informasjonen finnes i postene, 
 men er vanskelig å tolke automatisk
   Enkelt å forstå en og en post 
   Men vanskelig å lage regler for å tolke alle
 Forsøket viser at MARC‐data kan bli bedre
   Noen utfordringer krever mer drastiske endringer
RDF

 I et RDF‐datasett uttrykkes all informasjon i 
 form av tripler
 En trippel er et utsagn som består av tre deler:

 – En instans (subjekt)
 – En egenskap (predikat)
 – En verdi (objekt)

      Amund          liker      sjokolade
Alle instanser og egenskaper uttrykkes som 
  unike identifikatorer (URI)

<http://.../Amund> <http://.../liker> <http://.../sjokolade>


person:Amund mat:liker mat:sjokolade

work:sult dct:creator person:Hamsun_Knut
Vokabularer

 Core FRBR

 Dublin Core Metadata Terms

 Bibo ~ Bibliographic ontology

 FOAF ~ Friend of a friend

 SKOS ~ Simple Knowledge Organisation System
work:Hamsun_Knut_i_aeventyrland a       frbr:Work;
   dct:title            """I Æventyrland""" ;
   pode:subtitle        """oplevet og drømt i Kaukasien""" ;
   dct:creator          person:Hamsun_Knut ;
   pode:firstEdition    "1903"^^xsd:int ;
   pode:classification pode:ddk_914_75 ;
   frbr:realization     pode:26062446bee37b78d52bab7ae85c6526   ;
   frbr:realization     pode:9bc949c17cdb23d53c7fe0f4c89521e1   ;
   frbr:realization     pode:5933c37527c20cb56811c57e87027e95   ;
   frbr:realization     pode:754e9a14038da8a2bb131b698c0c5a7e   ;
   frbr:realization     pode:c06e5d491d9085af9ab812154551ffa2   ;
   owl:sameAs           dbpedia:In_Wonderland .
SPARQL

 Spørrespråk for RDF‐data

 SELECT ?document WHERE {
     ?document dct:creator person:Hamsun_Knut .
 }

 SELECT ?person WHERE {
     doc:tnr_0765432 dct:creator ?person .
 }

 SELECT ?property WHERE {
     doc:tnr_654321 ?property person:Bjerke_Andre .
 }
SELECT ?translator ?title WHERE {
      ?document dct:language lexvo:nld ;
             dct:title ?title ;
             bibo:translator ?translator
             dct:creator ?creator .
      ?creator dbprop:nationality dbpedia:Norway .
}
Hvilke oversettere har oversatt norske bøker til 
nederlandsk?

Hvilke språk er Knut Hamsuns romaner utgitt på?

Hvilke norske forlag har gitt ut bøker om hinduismen?

Hvilke emner omhandles i nynorske romaner på mindre 
enn 250 sider?

Hvilke romaner, skrevet av kvinnelige forfattere fra land 
med muslimsk majoritet, er utgitt på norsk?
http://bibpode.no/linkedauthors
Forarbeid og arbeid 
  – veien til FRBR
     Hamsun og Petterson
*100 0$aHamsun, Knut$d1859-1952$jn.
*24500$aLivsfragmenter$bni noveller$cKnut Hamsun ; samlet, redigert og kommentert
av Lars Frode Larsen
*260 $aOslo$bGyldendal$c1988
*300 $a147 s.
*500 $aNoveller publisert 1884-1906 i aviser og periodika
*505 $aInnhold: Et livsfragment ; På tourné ; Synd ; Mod jul ; Småbyliv ; Natteranglere ;
Mit reisefølge ; Onde dage ; På klinik.
*599 $axAgnar0312
*700 $aLarsen, Lars Frode$d1948-$jn.$eRed.$312753600
*740 0$aOnde dager
*740 0$aPå klinikk
*740 0$aPå turné
*740 2$aEt livsfragment
*740 2$aMit reisefølge
*740 2$aMod jul
*740 2$aNatteranglere
*740 2$aOnde dage
*740 2$aPaa klinik
*740 2$aPaa tourné
*740 2$aSmaabyliv
*740 2$aSynd
Verksautoritetsregister?
      – Nasjonalt!
Mer fokus på detaljer!
Flere må med!
Podes ønskeliste

 Åpen dokumentert tilgang til alle 
 katalogdata
 Et moderne metadataformat som er åpent 
 og fleksibelt
 Nasjonalt autoritetsregister og åpne, 
 nasjonale unike ID­er for verk og forfattere
www.bibpode.no/blogg

More Related Content

Featured

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Featured (20)

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 

Ut og vaske poster - FRBRisering i Podeprosjektet