SlideShare ist ein Scribd-Unternehmen logo
1 von 52
Downloaden Sie, um offline zu lesen
Søketjenester
 Kollokvium
    20. mars 2013
ole.husby@gmail.com
OBS!
Denne presentasjonen er laget for et internt kollokvium ved NTNU 20. mars 2013.
Tatt ut av denne sammenhengen kan den være ufullstendig. Fordi dette var et
kollokvium, er noen av punktene en smule retoriske.

Del 1 er noe preget av den verktøysituasjonen UB er i for øyeblikket.

Del 2 er noe mer teknisk og ikke særlig UB-spesifikk.




Denne presentasjonen er underlagt en Creative Commons lisens CC BY-SA 3.0
Eksistensialistisk
Hva er

Søking
Gjenfinning
Oppdaging

Hva er forskjellen på søking og oppdaging
Hva er serendipity
Hva er vi på jakt etter
Tekstdokumenter
Andre dokumenter
Informasjon
Kunnskap
Ekspertråd
Fakta

Vet vi hva vi vil ha? Hva med sjanger, nivå,
autoritet, språk, ventetid, format, pris,
Vet vi om vi fant det?
Er vi på jakt etter et kjent dokument er saken
klar

Men ellers da?
Går det an å måle det?
Hva er relevans?
Hva er gjenfinning og presisjon?
Hva er relevansrangering?
Hva er the long tail?
Innhold
1. Søkeverktøy som er dagsaktuelle ved UB

2. Tilbakeblikk og gjennomgang av mer
grunnleggende begreper og teknologier




OBS: Dette er et kollokvium!
1. I dag
Google - Google Scholar - Bing - Yandex -
DuckGoGo - Wikipedia - Mendeley - Primo -
Discovery - EDS - Summon - VuFind -
Facebook - Twitter - YouTube - WorldCat Local
- BIBSYS Ask - BIBSØK -
GENSØK- bokhylla.no
Discovery
handler om å oppdage eller finne ting

  ikke bare vha tradisjonell søking

  men via anbefalinger, sosial søking, snubling
  (serendipity) etc
Discovery og delivery
Kunnskapsbaser
ERM
Lenketjenere
Discoveryverktøy

Dette er verktøy eller tjenester som henger mer
eller mindre sammen
Kunnskapsbase
fordi ikke alle eksemplarer er tilgjengelige

Spinal en plaque meningiomas: A contemporary experience
E Caroli, M Acqui, R Roperto, L Ferrante… - Neurosurgery, 2004 - journals.lww.com
OBJECTIVE: Spinal en plaque meningiomas are rare and challenging lesions because of Google Scholar
their tendency to induce spinal arachnoiditis. The surgical treatment of this type of
meningioma is more complex than that of classic meningioma. METHODS: We report ..


Eks 1     http://journals.lww.com/neurosurgery/Abstract/2004/12000/Spinal_en_Plaque_Meningiomas__A_Contemporary.5.
          aspx


Eks 2     http://ovidsp.uk.ovid.com/sp-3.8.1a/ovidweb.cgi?
          QS2=434f4e1a73d37e8c740ce3cde7a33785b1e50109abeb977063eb5f5aed1249bf31d4353e62006f32ad18b7946547
          23bb2e83912c60a4886baa4711a6ef570f9c27f69b81dbc8ccc21cc23088ac2d322773d73ec2d2541de9cef44a8fc098c80
          377362e88a28a1011e42a5e3415b9d29ec653b867ffa2210590e05070aa5618f2677d60027b80964b79d47b3fd4baaa34
          4adc7b2e7c7e106f50397a112fb43625f878b9fac2fcd1c854d586ff1481a54fbae99747a473c9e7cddf3db61a877861d1a1
          4f2960227bbd2805334bd32951ddec40ce7e361efe31e3b5d7c9bc7c450ad30947ee0b5620a4338d63a04aa7cd8c4d54a
          db621c146e31985d34f3d2c6d98bad152eb277ee482024854f78d7206478beec64b9581c5c7d53c636b8aab22f11e9bfe
          b5de941976309d9db84c5881f4059d6e4951ac6d19c49e2f959794dfe060785bb13ea315d9d69b818aeee924dcca2cdce
          5dc847b51638ac61d75ea82ce9b7d9e0592f879cf55d46ed3988af91a5e03f469048294d20743065f9e37b952c8e2ce916
          617082fea1d4578dec03cf3a15509aeab72acf08c186c6b5ad947d14b90048d923e3c9153e0dc9d15dba2b4e662677593
          a721cdbe8d27866bc05290
Kunnskapsbase
(= Knowledge base )

Inneholder info om hvor det finnes et
tilgjengelig eksemplar av et dokument

NTNU bruker kunnskapsbasen SFX Global
Knowledgebase
Kunnskapsbasen SFX
inneholder informasjon om
tilgjengelige eksemplarer av

● lisensierte etidsskrifter
● gratis etidskrifter
● ebøker (kjøpte eller via PDA)

inneholder ikke info om trykte ressurser
Kunnskapsbaser

Ex Libris              SFX Global Knowledgebase

OCLC                   WorldCat knowledge base

EBSCO                  LinkSource

Serial Solutions       360 Link / KnowledgeWorks



Bibliotekbasen i BIBSYS er også en
kunnskapsbase

Internasjonalt initiativ for å standardisere
virkemåten til kunnskapsbasene: KBART
Mer om kunnskapsbaser
Det har siden 2000 (da kom SFX på markedet) vært en
tendens til at KB har vært levert sammen med (som en del
av) lenketjener.

I dagens marked er det sannsynligvis en ny retning å
spore, nemlig at KB knyttes sterkere til
discoveryverktøyene, slik at brukeren ser "direkte lenker" i
stedet for "SFX-meny" o.l.

Det er ikke unaturlig at f.eks. OCLC er en pådriver her, ved
å si at WorldCat fungerer også som KB.
ERM
( = Electronic Resources Management )

Verktøy for å administrere bibliotekets avtaler
om tilgang til e-ressurser

NTNU har anskaffet ERM fra EBSCO
Lenketjener
(= Link resolver )

Nettbasert tjeneste som presenterer en klikkbar
lenke til et tilgjengelig eksemplar av en ressurs

UB bruker lenketjeneren SFX i samarbeidet
innen Uniport-konsortiet

SFX er valgt som lenketjener av BIBSYS
Lenketjenere

Ex Libris          SFX

OCLC               OCLC Link Manager

EBSCO              LinkSource

Serial Solutions   360 Link




Lenketjeneren trenger en kunnskapsbase
for å finne tilgjengelige eksemplarer!
Lenketjeneren SFX
SFX genererer lenker i form av en NTNU-
knapp i forskjellige søkesystemer
Lenketjenere og OpenURL
OpenURL er en metadataURLstandard som
tillater dynamisk lenking mellom kilde og mål

Kilde (source) = Web of Science   Mål (target) = Elsevier
Slik ser en OpenURL ut
http://x-port-sfx.uio.no/sfx_ubit
?sid=google
&auinit=E
&aulast=Caroli
&atitle=Spinal+en+plaque+meningiomas:
+A+contemporary+experience
&title=Neurosurgery
&volume=55
&issue=6
&date=2004
&spage=1275
&issn=0148-396X
Lenketjener vs direkte lenking
Brukerne oppfatter ikke det geniale ved
lenketjeneren på samme måte som oss!

De synes sfx bare er et ekstra unødvendig klikk

Tendens: discoveryverktøyene har en innbygd
kunnskapsbase slik at direktelenking er mulig

Lenketjenerne viktigst for "tredjepartsystemer"
LinkSource
NTNU UB har anskaffet lenketjeneren
LinkSource fra EBSCO
Søkeverktøy
( = Discovery tool )

En nettbasert tjeneste for å finne alle mulige
ressurstyper bl.a. ved å søke i forskjellige
søkekilder

NTNU har Metalib og Primo Central
Vi "har" også Google Scholar
Søkeverktøy av forskjellige typer
Terminologi og navnebruk er nokså grumset

Discovery tool brukes gjerne om systemer
hvor man samler søkedata til en felles indeks
(f.eks. Primo)

Federated search brukes om systemer hvor
det søkes distribuert, dvs i forskjellige kilder
samtidig (f.eks. Metalib)
Søkeverktøy

Ex Libris             Primo / Primo Central

OCLC                  Worldcat Local

EBSCO                 EBSCO Discovery Service (EDS)

Serial Solutions      Summon




Dette er de "store" verktøyene for tida
Det finnes også flere (kommersielle og frie)
Og så har vi Google Scholar
Tida har gått fra federated search (Metalib)
Søkeverktøyet Primo
NTNU har avtale om Primo ut 2013

Primo er valgt som discoveryverktøy av
BIBSYS
EDS (EBSCO Discovery System)
NTNU UB har anskaffet discoveryverktøyet
EDS fra EBSCO
Her passer det å ta pause
Google Scholar
Det som gjør Google Scholar til et så bra
verktøy for NTNU-brukere er ikke at det har så
god gjenfinningsfunksjonalitet eller at det har så
stor dekning

men

at vi har god orden på våre beholdninger via
en kunnskapsbase og lenkeserver
Skifte av discoverysystem
Det som gjør at det er mulig å skifte
discoverysystem på forholdsvis kort tid

eller evt anskaffe et nytt hvis Google legger inn
årene

at vi har god orden på våre beholdninger via
en kunnskapsbase og lenkeserver
Må vi ha discoverysystem?
Tja.

● Det perfekte søkeverktøy finnes ikke
● Ingen er så omfattende at de overflødiggjør
  spesialdatabaser (aka fagdatabaser)
● Det er usikkert om noe er så mye bedre enn
  Google Scholar at det er pengene verdt
● Av hensyn til Google Scholar og fagdatabaser
  må vi fortsatt ha lenketjener
Må vi ha discoverysystem?
Dette er et fiktivt strategidokument. Se mer om det på neste side.

1. UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I
stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å
levere materiale som er produsert av vitenskapelige ansatte ved NTNU.

2. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne
nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og
internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil
vi har bedre løsninger.

3. Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen
gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg
denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for
hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon.

4. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer.

5. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt
trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
Dette var altså ren fiction
Men teksten er direkte oversatt fra et virkelig
dokument fra Universitetet i Utrecht:

http://www.libereurope.eu/blog/thinking-the-unthinkable-a-
library-without-a-catalogue-reconsidering-the-future-of-
discovery-to

Utrecht er erstattet med NTNU
Omega er erstattet med Primo Central
WebOPAC er erstattet med BIBSYS-katalogen
2. Tilbakeblikk
Gjennomgang av teknikker og begreper.
Ikke nødvendigvis kronologisk



ccl: find (dylan and bob) or set=1
Ressurs
Informasjonsressurs

Bok
Tekstdokument
Bilde
Webside
Lyd
Video osv osv osv

                      http://ohhaythurr.files.wordpress.com/2011/04/illum_manuscript_l1.jpg?
                      w=570
What is a resource?
That is rather a deep question and the
precise definition is still the subject of
debate. For our purposes we can think of
it as anything we can identify. You are a
resource, as is your home page, this
tutorial, the number one and the great
white whale in Moby Dick.

(RDF)
Metadata
Strukturerte data som beskriver en ressurs

Typisk eksempel: bibliografiske data

100 $a Aalberg, Trond
245 $a A Tool for Converting from MARC to FRBR
700 $a Husby, Ole
856 $u http://dx.doi.org/10.1007/11863878_41
Digresjon: Setninger
Utsagn om ting




http://orcid.org/0000-0002-9113-2142    hasName


    isCreatorOf                                   Ole Husby

http://dx.doi.org/10.1007/11863878_41
                          hasTitle


                          A Tool for Converting from MARC to FRBR
The Library should not invest in a new library discovery tool.
                      UB skal ikke investere i et nytt discoveryverktøy. For våre              The benefit for our users will be marginal. Instead, we should
                      brukere ville dette ha bare en marginal verdi. I stedet skal vi          concentrate on improving delivery of the materials purchased
                      konsentrere innsatsen om å levere materiale som er lisensiert for        and licensed for NTNU users or produced by NTNU scholars.
                      NTNU-brukere, samt å levere materiale som er produsert av                Discovery in the public cloud of special collections and certain
                      vitenskapelige ansatte ved NTNU. Enkelte av våre                         other special materials is still inadequate. We need to
                      spesialsamlinger har fremdeles ikke gode nok muligheter for å bli        improve findability by adding metadata to national and
                      funnet på det åpne nettet. Det er nødvendig å forbedre                   international initiatives. If necessary we may need to hold on



Indeksering           gjenfinningen ved å dele metadata gjennom nasjonale og                   to parts of the BIBSYS OPAC to ensure materials can be
                      internasjonale tjenester. Om nødvendig må vi fortsette å bruke           found until better solutions will become available. We should
                      BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger.      rethink the role of the library in giving access to scientific
                      Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av              information. Our role in discovery of scientific information has


                                                                         Dokumenter
                      vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester
                      for slik informasjon har vært en del av vår identitet i årevis. Vi
                      innser at å gi fra seg denne rollen til andre aktører vil få oss til å
                      føle oss nakne og usikre. Derfor må vi legge nye planer for
                                                                                               been part of our library identity for years. We realise that
                                                                                               relinquishing this role to other players can make us feel naked
                                                                                               and uncertain. We have to rethink and redesign the way we
                                                                                               offer our services for access to scientific information. We
                      hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig       should phase out Primo. For discovery of electronic articles
                      informasjon. Vi vil fase ut Primo Central. For oppdaging av e-           there are sufficient alternatives available. We should
                      ressurseer finnes det tilstrekkelig gode alternativer. Vi må             investigate if and how the BIBSYS OPAC can serve as a
                      undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes           delivery tool for our printed materials. It might be useful as a
                      som et tilgangsverktøy for vårt trykte materiale. Den kan være           “known item search”– tool.
                      nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"

        Indeksering




                      Søking
 Database
Databaser
Referansedatabaser (A&I)
  laget for å gi god søking
Fulltekstdatabaser
  laget for å gi tilgang til fulltekst
Bibliotekdatabaser
  laget for å vise hva biblioteket har
Kunnskapsbaser
  laget for å viser hva biblioteket har
Samkataloger og samsøking
Formål: søke i flere søkekilder på et sted

I gamle dager: Samkataloger = fysisk
sammenslåing av flere kataloger til en

På 1990-tallet: Samsøking = metasøking =
søking i forskjellige søkekilder fra ett grenssnitt

I dag: Discovery = fysisk sammenslåing av
flere søkeindekser til en
Samsøking




    Fungerte vha standardisering av
    søkeprotokoller (f.eks. Z39.50 som i
    MetaLib)
    og / eller via flerprotokollsystemer (IANI,
    MetaLib)
Samsøking var dømt til å mislykkes
fordi

● protokollene og standardene var for
  komplekse
● de lokale tolkingene av dem forskjellige
● serverne var for dårlige og ustabile
● sammenfletting og deduplisering av treff fra
  forskjellige systemer var i praksis umulig i
  det virkelige liv
Søketeknologi før (IR)
Hvordan matche søketermer og indekstermer

Boolsk søking vs
Vektorsøking

Trunkering vs
Lingvistisk analyse
Søkespråk
CCL: Common Command Language (GENSØK)
CQL: Contextual Query Language (Ask)

boolske operatorer
feltkoder
trunkering
nærhetsoperatorer
sortering
visningsformater osv osv osv
Standardiseringsbehov
From: Even Hartmann Flood <even.flood@ub.ntnu.no>
To: Ole Husby <ole.husby@ub.ntnu.no>


Jeg kan godt ha sagt noe slikt - jeg brukte mange systemer og det var jo ikke to som var
like. Fortvilelsen var stor. Men noen tall husker jeg ikke. Jeg husker a du engang ga
meg i oppdrag å skaffe eksempler på forskjellige søkespråk og jeg i et anfall av glad
sadisme ga deg en rekke av de forskjellige utskriftkommandoene jeg hadde funnet i
forskjellige tjenester.


Even


> >From: Ole Husby [mailto:ole.husby@ub.ntnu.no]
> >To: Even Hartmann Flood
> >Subject: Søkespråk


> >du sa en gang, kanskje for 20 år siden, at du hadde sjekket 50 søkesystemer
> >og funnet 49 forskjellige søkespråk. Eller kanskje var det helt andre tall.
> >Husker du?
> >
> >Ole
Søketeknologi nå (Google)
Hvordan matche søkeuttrykk og dokumenter

Kvasi-goolsk søking
Strengmatching
Lenkeanalyse
Kontekstuelle, lokalitets-, personlige og sosiale
aspekter

Ingen får vite nøyaktig hvordan dette virker
Men hvor mye har det å si?
Pathetic users
Users are incredibly bad at finding and researching things on the web. A few
years ago, I characterized users' research skills as "incompetent," and they’ve
only gotten worse over time. "Pathetic" and "useless" are words that come to
mind after this year's user testing.

In a recent study, for example, a user wanted to buy a highly protective yet
girlish phone case as a gift for her daughter. While on Amazon.com, she
engaged in random fishing expeditions into the product database, using search
queries such as "pink impact resistant iphone 5 cover."

Jakob Nielsen                                http://www.nngroup.com/articles/search-navigation/




 OK. Men er dette så patetisk da?
Hva er en søkemotor?
En tjeneste som søker fram nettsider etter en
forutgående indeksering utført av en "robot"

Robotene er ikke flink til å finne deler av
nettsider eller aggregat av nettsider, og klarer
stort sett ikke å finne det som ikke er statiske
sider med en fast adresse, f.eks. innholdet i
databaser etc
Søkemotorer gjennom tidene
Hvordan jobber søkemotorene?
Hvem trenger å vite noe om det?

Hva er SEO?
Hvordan virker PageRank?
Hva er robots.txt?
Hva er SiteMaps?
Hva er schema.org og microdata?
Hvordan jobber BIBSYS Ask?
Hvem trenger å vite noe om det?

- søkeindekser
- innhold i søkeindeksene (marc-felt)
- søke ord, antall ord
- søke fraser - lengde
- spesialtegn, tegnkonvertering
- basisindex

Weitere ähnliche Inhalte

Ähnlich wie Kollokvium om søketjenester

Bibliotek og teknologi - goddag, ja!
Bibliotek og teknologi - goddag, ja!Bibliotek og teknologi - goddag, ja!
Bibliotek og teknologi - goddag, ja!Alexander Johannesen
 
Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Heidi Kristin Olsen
 
Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Heidi Kristin Olsen
 
Tilgang til faglitteratur
Tilgang til faglitteraturTilgang til faglitteratur
Tilgang til faglitteraturKarianne Aam
 
Presentasjon av 23 Ting Sunndalsøra
Presentasjon av 23 Ting SunndalsøraPresentasjon av 23 Ting Sunndalsøra
Presentasjon av 23 Ting SunndalsøraJannicke Røgler
 
Biblioteksentralen
BiblioteksentralenBiblioteksentralen
Biblioteksentralenjaoverla
 
Kjernemodellen: Eit praktisk rammeverk for prioritering og findability
Kjernemodellen: Eit praktisk rammeverk for prioritering og findabilityKjernemodellen: Eit praktisk rammeverk for prioritering og findability
Kjernemodellen: Eit praktisk rammeverk for prioritering og findabilityAre Halland
 
Arbeidsseminar samisk Høgskole
Arbeidsseminar samisk HøgskoleArbeidsseminar samisk Høgskole
Arbeidsseminar samisk Høgskolejaoverla
 
22.11.07 Tromsø
22.11.07 Tromsø22.11.07 Tromsø
22.11.07 Tromsøjaoverla
 
Snik-semantifisering av bibliotekkatalogen
Snik-semantifisering av bibliotekkatalogenSnik-semantifisering av bibliotekkatalogen
Snik-semantifisering av bibliotekkatalogenLibriotech
 
Bibliotek 2.0?
Bibliotek 2.0?Bibliotek 2.0?
Bibliotek 2.0?Libriotech
 
Hvem jobber i fremtidas medisinske bibliotek?
Hvem jobber i fremtidas medisinske bibliotek?Hvem jobber i fremtidas medisinske bibliotek?
Hvem jobber i fremtidas medisinske bibliotek?Karen Johanne Buset
 
PLN-basert tilnærming til undervisning
PLN-basert tilnærming til undervisning PLN-basert tilnærming til undervisning
PLN-basert tilnærming til undervisning Svend Andreas Horgen
 
Informasjonskompetanse
InformasjonskompetanseInformasjonskompetanse
Informasjonskompetansejaoverla
 
Digital skole hver dag - NDLA
Digital skole hver dag - NDLADigital skole hver dag - NDLA
Digital skole hver dag - NDLAFrank Emil Moen
 
Bergen 13.02.08
Bergen 13.02.08Bergen 13.02.08
Bergen 13.02.08jaoverla
 
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...Rolf K. Baltzersen
 

Ähnlich wie Kollokvium om søketjenester (20)

Hovedbibl sept2010
Hovedbibl sept2010Hovedbibl sept2010
Hovedbibl sept2010
 
Bibliotek og teknologi - goddag, ja!
Bibliotek og teknologi - goddag, ja!Bibliotek og teknologi - goddag, ja!
Bibliotek og teknologi - goddag, ja!
 
Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010
 
Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010Presentasjon bibliotekmøtet 2010
Presentasjon bibliotekmøtet 2010
 
Tilgang til faglitteratur
Tilgang til faglitteraturTilgang til faglitteratur
Tilgang til faglitteratur
 
Presentasjon av 23 Ting Sunndalsøra
Presentasjon av 23 Ting SunndalsøraPresentasjon av 23 Ting Sunndalsøra
Presentasjon av 23 Ting Sunndalsøra
 
Biblioteksentralen
BiblioteksentralenBiblioteksentralen
Biblioteksentralen
 
Kjernemodellen: Eit praktisk rammeverk for prioritering og findability
Kjernemodellen: Eit praktisk rammeverk for prioritering og findabilityKjernemodellen: Eit praktisk rammeverk for prioritering og findability
Kjernemodellen: Eit praktisk rammeverk for prioritering og findability
 
Arbeidsseminar samisk Høgskole
Arbeidsseminar samisk HøgskoleArbeidsseminar samisk Høgskole
Arbeidsseminar samisk Høgskole
 
22.11.07 Tromsø
22.11.07 Tromsø22.11.07 Tromsø
22.11.07 Tromsø
 
Snik-semantifisering av bibliotekkatalogen
Snik-semantifisering av bibliotekkatalogenSnik-semantifisering av bibliotekkatalogen
Snik-semantifisering av bibliotekkatalogen
 
Bibliotek 2.0?
Bibliotek 2.0?Bibliotek 2.0?
Bibliotek 2.0?
 
Hvem jobber i fremtidas medisinske bibliotek?
Hvem jobber i fremtidas medisinske bibliotek?Hvem jobber i fremtidas medisinske bibliotek?
Hvem jobber i fremtidas medisinske bibliotek?
 
PLN-basert tilnærming til undervisning
PLN-basert tilnærming til undervisning PLN-basert tilnærming til undervisning
PLN-basert tilnærming til undervisning
 
Informasjonskompetanse
InformasjonskompetanseInformasjonskompetanse
Informasjonskompetanse
 
Digital skole hver dag - NDLA
Digital skole hver dag - NDLADigital skole hver dag - NDLA
Digital skole hver dag - NDLA
 
NDLA Stord
NDLA StordNDLA Stord
NDLA Stord
 
23ting Fylkesbibl Tromso
23ting Fylkesbibl Tromso23ting Fylkesbibl Tromso
23ting Fylkesbibl Tromso
 
Bergen 13.02.08
Bergen 13.02.08Bergen 13.02.08
Bergen 13.02.08
 
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...
Det wikipedianske klasserommet. Kjennetegn ved digitale læringsomgivelser pre...
 

Mehr von Ole Husby

Sosiale medier
Sosiale medierSosiale medier
Sosiale medierOle Husby
 
Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Alt du trenger å vite om MARC - men ikke har tenkt å spørre omAlt du trenger å vite om MARC - men ikke har tenkt å spørre om
Alt du trenger å vite om MARC - men ikke har tenkt å spørre omOle Husby
 
Google i skyene
Google i skyeneGoogle i skyene
Google i skyeneOle Husby
 
Om delingsverktøy og andre tjenester i skyene
Om delingsverktøy og andre tjenester i skyeneOm delingsverktøy og andre tjenester i skyene
Om delingsverktøy og andre tjenester i skyeneOle Husby
 
Metadatamodeller før og nå
Metadatamodeller før og nåMetadatamodeller før og nå
Metadatamodeller før og nåOle Husby
 
Google i skyene (gammel)
Google i skyene (gammel)Google i skyene (gammel)
Google i skyene (gammel)Ole Husby
 
E-Bøker. Hva Finnes? Utfordringer og muligheter
E-Bøker. Hva Finnes? Utfordringer og muligheterE-Bøker. Hva Finnes? Utfordringer og muligheter
E-Bøker. Hva Finnes? Utfordringer og muligheterOle Husby
 
Biblioteket Og Sosiale Medier
Biblioteket Og Sosiale MedierBiblioteket Og Sosiale Medier
Biblioteket Og Sosiale MedierOle Husby
 
13 ways to search BIBSYS
13 ways to search BIBSYS13 ways to search BIBSYS
13 ways to search BIBSYSOle Husby
 

Mehr von Ole Husby (10)

Sosiale medier
Sosiale medierSosiale medier
Sosiale medier
 
Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
Alt du trenger å vite om MARC - men ikke har tenkt å spørre omAlt du trenger å vite om MARC - men ikke har tenkt å spørre om
Alt du trenger å vite om MARC - men ikke har tenkt å spørre om
 
Google i skyene
Google i skyeneGoogle i skyene
Google i skyene
 
Om delingsverktøy og andre tjenester i skyene
Om delingsverktøy og andre tjenester i skyeneOm delingsverktøy og andre tjenester i skyene
Om delingsverktøy og andre tjenester i skyene
 
Metadatamodeller før og nå
Metadatamodeller før og nåMetadatamodeller før og nå
Metadatamodeller før og nå
 
Google i skyene (gammel)
Google i skyene (gammel)Google i skyene (gammel)
Google i skyene (gammel)
 
E-Bøker. Hva Finnes? Utfordringer og muligheter
E-Bøker. Hva Finnes? Utfordringer og muligheterE-Bøker. Hva Finnes? Utfordringer og muligheter
E-Bøker. Hva Finnes? Utfordringer og muligheter
 
Biblioteket Og Sosiale Medier
Biblioteket Og Sosiale MedierBiblioteket Og Sosiale Medier
Biblioteket Og Sosiale Medier
 
Om e-bøker
Om e-bøkerOm e-bøker
Om e-bøker
 
13 ways to search BIBSYS
13 ways to search BIBSYS13 ways to search BIBSYS
13 ways to search BIBSYS
 

Kollokvium om søketjenester

  • 1. Søketjenester Kollokvium 20. mars 2013 ole.husby@gmail.com
  • 2. OBS! Denne presentasjonen er laget for et internt kollokvium ved NTNU 20. mars 2013. Tatt ut av denne sammenhengen kan den være ufullstendig. Fordi dette var et kollokvium, er noen av punktene en smule retoriske. Del 1 er noe preget av den verktøysituasjonen UB er i for øyeblikket. Del 2 er noe mer teknisk og ikke særlig UB-spesifikk. Denne presentasjonen er underlagt en Creative Commons lisens CC BY-SA 3.0
  • 3. Eksistensialistisk Hva er Søking Gjenfinning Oppdaging Hva er forskjellen på søking og oppdaging Hva er serendipity
  • 4. Hva er vi på jakt etter Tekstdokumenter Andre dokumenter Informasjon Kunnskap Ekspertråd Fakta Vet vi hva vi vil ha? Hva med sjanger, nivå, autoritet, språk, ventetid, format, pris,
  • 5. Vet vi om vi fant det? Er vi på jakt etter et kjent dokument er saken klar Men ellers da? Går det an å måle det? Hva er relevans? Hva er gjenfinning og presisjon? Hva er relevansrangering? Hva er the long tail?
  • 6. Innhold 1. Søkeverktøy som er dagsaktuelle ved UB 2. Tilbakeblikk og gjennomgang av mer grunnleggende begreper og teknologier OBS: Dette er et kollokvium!
  • 7. 1. I dag Google - Google Scholar - Bing - Yandex - DuckGoGo - Wikipedia - Mendeley - Primo - Discovery - EDS - Summon - VuFind - Facebook - Twitter - YouTube - WorldCat Local - BIBSYS Ask - BIBSØK - GENSØK- bokhylla.no
  • 8. Discovery handler om å oppdage eller finne ting ikke bare vha tradisjonell søking men via anbefalinger, sosial søking, snubling (serendipity) etc
  • 9. Discovery og delivery Kunnskapsbaser ERM Lenketjenere Discoveryverktøy Dette er verktøy eller tjenester som henger mer eller mindre sammen
  • 10. Kunnskapsbase fordi ikke alle eksemplarer er tilgjengelige Spinal en plaque meningiomas: A contemporary experience E Caroli, M Acqui, R Roperto, L Ferrante… - Neurosurgery, 2004 - journals.lww.com OBJECTIVE: Spinal en plaque meningiomas are rare and challenging lesions because of Google Scholar their tendency to induce spinal arachnoiditis. The surgical treatment of this type of meningioma is more complex than that of classic meningioma. METHODS: We report .. Eks 1 http://journals.lww.com/neurosurgery/Abstract/2004/12000/Spinal_en_Plaque_Meningiomas__A_Contemporary.5. aspx Eks 2 http://ovidsp.uk.ovid.com/sp-3.8.1a/ovidweb.cgi? QS2=434f4e1a73d37e8c740ce3cde7a33785b1e50109abeb977063eb5f5aed1249bf31d4353e62006f32ad18b7946547 23bb2e83912c60a4886baa4711a6ef570f9c27f69b81dbc8ccc21cc23088ac2d322773d73ec2d2541de9cef44a8fc098c80 377362e88a28a1011e42a5e3415b9d29ec653b867ffa2210590e05070aa5618f2677d60027b80964b79d47b3fd4baaa34 4adc7b2e7c7e106f50397a112fb43625f878b9fac2fcd1c854d586ff1481a54fbae99747a473c9e7cddf3db61a877861d1a1 4f2960227bbd2805334bd32951ddec40ce7e361efe31e3b5d7c9bc7c450ad30947ee0b5620a4338d63a04aa7cd8c4d54a db621c146e31985d34f3d2c6d98bad152eb277ee482024854f78d7206478beec64b9581c5c7d53c636b8aab22f11e9bfe b5de941976309d9db84c5881f4059d6e4951ac6d19c49e2f959794dfe060785bb13ea315d9d69b818aeee924dcca2cdce 5dc847b51638ac61d75ea82ce9b7d9e0592f879cf55d46ed3988af91a5e03f469048294d20743065f9e37b952c8e2ce916 617082fea1d4578dec03cf3a15509aeab72acf08c186c6b5ad947d14b90048d923e3c9153e0dc9d15dba2b4e662677593 a721cdbe8d27866bc05290
  • 11. Kunnskapsbase (= Knowledge base ) Inneholder info om hvor det finnes et tilgjengelig eksemplar av et dokument NTNU bruker kunnskapsbasen SFX Global Knowledgebase
  • 12. Kunnskapsbasen SFX inneholder informasjon om tilgjengelige eksemplarer av ● lisensierte etidsskrifter ● gratis etidskrifter ● ebøker (kjøpte eller via PDA) inneholder ikke info om trykte ressurser
  • 13. Kunnskapsbaser Ex Libris SFX Global Knowledgebase OCLC WorldCat knowledge base EBSCO LinkSource Serial Solutions 360 Link / KnowledgeWorks Bibliotekbasen i BIBSYS er også en kunnskapsbase Internasjonalt initiativ for å standardisere virkemåten til kunnskapsbasene: KBART
  • 14. Mer om kunnskapsbaser Det har siden 2000 (da kom SFX på markedet) vært en tendens til at KB har vært levert sammen med (som en del av) lenketjener. I dagens marked er det sannsynligvis en ny retning å spore, nemlig at KB knyttes sterkere til discoveryverktøyene, slik at brukeren ser "direkte lenker" i stedet for "SFX-meny" o.l. Det er ikke unaturlig at f.eks. OCLC er en pådriver her, ved å si at WorldCat fungerer også som KB.
  • 15. ERM ( = Electronic Resources Management ) Verktøy for å administrere bibliotekets avtaler om tilgang til e-ressurser NTNU har anskaffet ERM fra EBSCO
  • 16. Lenketjener (= Link resolver ) Nettbasert tjeneste som presenterer en klikkbar lenke til et tilgjengelig eksemplar av en ressurs UB bruker lenketjeneren SFX i samarbeidet innen Uniport-konsortiet SFX er valgt som lenketjener av BIBSYS
  • 17. Lenketjenere Ex Libris SFX OCLC OCLC Link Manager EBSCO LinkSource Serial Solutions 360 Link Lenketjeneren trenger en kunnskapsbase for å finne tilgjengelige eksemplarer!
  • 18. Lenketjeneren SFX SFX genererer lenker i form av en NTNU- knapp i forskjellige søkesystemer
  • 19. Lenketjenere og OpenURL OpenURL er en metadataURLstandard som tillater dynamisk lenking mellom kilde og mål Kilde (source) = Web of Science Mål (target) = Elsevier
  • 20. Slik ser en OpenURL ut http://x-port-sfx.uio.no/sfx_ubit ?sid=google &auinit=E &aulast=Caroli &atitle=Spinal+en+plaque+meningiomas: +A+contemporary+experience &title=Neurosurgery &volume=55 &issue=6 &date=2004 &spage=1275 &issn=0148-396X
  • 21. Lenketjener vs direkte lenking Brukerne oppfatter ikke det geniale ved lenketjeneren på samme måte som oss! De synes sfx bare er et ekstra unødvendig klikk Tendens: discoveryverktøyene har en innbygd kunnskapsbase slik at direktelenking er mulig Lenketjenerne viktigst for "tredjepartsystemer"
  • 22. LinkSource NTNU UB har anskaffet lenketjeneren LinkSource fra EBSCO
  • 23. Søkeverktøy ( = Discovery tool ) En nettbasert tjeneste for å finne alle mulige ressurstyper bl.a. ved å søke i forskjellige søkekilder NTNU har Metalib og Primo Central Vi "har" også Google Scholar
  • 24. Søkeverktøy av forskjellige typer Terminologi og navnebruk er nokså grumset Discovery tool brukes gjerne om systemer hvor man samler søkedata til en felles indeks (f.eks. Primo) Federated search brukes om systemer hvor det søkes distribuert, dvs i forskjellige kilder samtidig (f.eks. Metalib)
  • 25. Søkeverktøy Ex Libris Primo / Primo Central OCLC Worldcat Local EBSCO EBSCO Discovery Service (EDS) Serial Solutions Summon Dette er de "store" verktøyene for tida Det finnes også flere (kommersielle og frie) Og så har vi Google Scholar Tida har gått fra federated search (Metalib)
  • 26. Søkeverktøyet Primo NTNU har avtale om Primo ut 2013 Primo er valgt som discoveryverktøy av BIBSYS
  • 27. EDS (EBSCO Discovery System) NTNU UB har anskaffet discoveryverktøyet EDS fra EBSCO
  • 28. Her passer det å ta pause
  • 29. Google Scholar Det som gjør Google Scholar til et så bra verktøy for NTNU-brukere er ikke at det har så god gjenfinningsfunksjonalitet eller at det har så stor dekning men at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver
  • 30. Skifte av discoverysystem Det som gjør at det er mulig å skifte discoverysystem på forholdsvis kort tid eller evt anskaffe et nytt hvis Google legger inn årene at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver
  • 31. Må vi ha discoverysystem? Tja. ● Det perfekte søkeverktøy finnes ikke ● Ingen er så omfattende at de overflødiggjør spesialdatabaser (aka fagdatabaser) ● Det er usikkert om noe er så mye bedre enn Google Scholar at det er pengene verdt ● Av hensyn til Google Scholar og fagdatabaser må vi fortsatt ha lenketjener
  • 32. Må vi ha discoverysystem? Dette er et fiktivt strategidokument. Se mer om det på neste side. 1. UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å levere materiale som er produsert av vitenskapelige ansatte ved NTNU. 2. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger. 3. Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon. 4. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer. 5. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
  • 33. Dette var altså ren fiction Men teksten er direkte oversatt fra et virkelig dokument fra Universitetet i Utrecht: http://www.libereurope.eu/blog/thinking-the-unthinkable-a- library-without-a-catalogue-reconsidering-the-future-of- discovery-to Utrecht er erstattet med NTNU Omega er erstattet med Primo Central WebOPAC er erstattet med BIBSYS-katalogen
  • 34. 2. Tilbakeblikk Gjennomgang av teknikker og begreper. Ikke nødvendigvis kronologisk ccl: find (dylan and bob) or set=1
  • 35. Ressurs Informasjonsressurs Bok Tekstdokument Bilde Webside Lyd Video osv osv osv http://ohhaythurr.files.wordpress.com/2011/04/illum_manuscript_l1.jpg? w=570
  • 36. What is a resource? That is rather a deep question and the precise definition is still the subject of debate. For our purposes we can think of it as anything we can identify. You are a resource, as is your home page, this tutorial, the number one and the great white whale in Moby Dick. (RDF)
  • 37. Metadata Strukturerte data som beskriver en ressurs Typisk eksempel: bibliografiske data 100 $a Aalberg, Trond 245 $a A Tool for Converting from MARC to FRBR 700 $a Husby, Ole 856 $u http://dx.doi.org/10.1007/11863878_41
  • 38. Digresjon: Setninger Utsagn om ting http://orcid.org/0000-0002-9113-2142 hasName isCreatorOf Ole Husby http://dx.doi.org/10.1007/11863878_41 hasTitle A Tool for Converting from MARC to FRBR
  • 39. The Library should not invest in a new library discovery tool. UB skal ikke investere i et nytt discoveryverktøy. For våre The benefit for our users will be marginal. Instead, we should brukere ville dette ha bare en marginal verdi. I stedet skal vi concentrate on improving delivery of the materials purchased konsentrere innsatsen om å levere materiale som er lisensiert for and licensed for NTNU users or produced by NTNU scholars. NTNU-brukere, samt å levere materiale som er produsert av Discovery in the public cloud of special collections and certain vitenskapelige ansatte ved NTNU. Enkelte av våre other special materials is still inadequate. We need to spesialsamlinger har fremdeles ikke gode nok muligheter for å bli improve findability by adding metadata to national and funnet på det åpne nettet. Det er nødvendig å forbedre international initiatives. If necessary we may need to hold on Indeksering gjenfinningen ved å dele metadata gjennom nasjonale og to parts of the BIBSYS OPAC to ensure materials can be internasjonale tjenester. Om nødvendig må vi fortsette å bruke found until better solutions will become available. We should BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger. rethink the role of the library in giving access to scientific Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av information. Our role in discovery of scientific information has Dokumenter vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for been part of our library identity for years. We realise that relinquishing this role to other players can make us feel naked and uncertain. We have to rethink and redesign the way we offer our services for access to scientific information. We hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig should phase out Primo. For discovery of electronic articles informasjon. Vi vil fase ut Primo Central. For oppdaging av e- there are sufficient alternatives available. We should ressurseer finnes det tilstrekkelig gode alternativer. Vi må investigate if and how the BIBSYS OPAC can serve as a undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes delivery tool for our printed materials. It might be useful as a som et tilgangsverktøy for vårt trykte materiale. Den kan være “known item search”– tool. nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter" Indeksering Søking Database
  • 40. Databaser Referansedatabaser (A&I) laget for å gi god søking Fulltekstdatabaser laget for å gi tilgang til fulltekst Bibliotekdatabaser laget for å vise hva biblioteket har Kunnskapsbaser laget for å viser hva biblioteket har
  • 41. Samkataloger og samsøking Formål: søke i flere søkekilder på et sted I gamle dager: Samkataloger = fysisk sammenslåing av flere kataloger til en På 1990-tallet: Samsøking = metasøking = søking i forskjellige søkekilder fra ett grenssnitt I dag: Discovery = fysisk sammenslåing av flere søkeindekser til en
  • 42. Samsøking Fungerte vha standardisering av søkeprotokoller (f.eks. Z39.50 som i MetaLib) og / eller via flerprotokollsystemer (IANI, MetaLib)
  • 43. Samsøking var dømt til å mislykkes fordi ● protokollene og standardene var for komplekse ● de lokale tolkingene av dem forskjellige ● serverne var for dårlige og ustabile ● sammenfletting og deduplisering av treff fra forskjellige systemer var i praksis umulig i det virkelige liv
  • 44. Søketeknologi før (IR) Hvordan matche søketermer og indekstermer Boolsk søking vs Vektorsøking Trunkering vs Lingvistisk analyse
  • 45. Søkespråk CCL: Common Command Language (GENSØK) CQL: Contextual Query Language (Ask) boolske operatorer feltkoder trunkering nærhetsoperatorer sortering visningsformater osv osv osv
  • 46. Standardiseringsbehov From: Even Hartmann Flood <even.flood@ub.ntnu.no> To: Ole Husby <ole.husby@ub.ntnu.no> Jeg kan godt ha sagt noe slikt - jeg brukte mange systemer og det var jo ikke to som var like. Fortvilelsen var stor. Men noen tall husker jeg ikke. Jeg husker a du engang ga meg i oppdrag å skaffe eksempler på forskjellige søkespråk og jeg i et anfall av glad sadisme ga deg en rekke av de forskjellige utskriftkommandoene jeg hadde funnet i forskjellige tjenester. Even > >From: Ole Husby [mailto:ole.husby@ub.ntnu.no] > >To: Even Hartmann Flood > >Subject: Søkespråk > >du sa en gang, kanskje for 20 år siden, at du hadde sjekket 50 søkesystemer > >og funnet 49 forskjellige søkespråk. Eller kanskje var det helt andre tall. > >Husker du? > > > >Ole
  • 47. Søketeknologi nå (Google) Hvordan matche søkeuttrykk og dokumenter Kvasi-goolsk søking Strengmatching Lenkeanalyse Kontekstuelle, lokalitets-, personlige og sosiale aspekter Ingen får vite nøyaktig hvordan dette virker Men hvor mye har det å si?
  • 48. Pathetic users Users are incredibly bad at finding and researching things on the web. A few years ago, I characterized users' research skills as "incompetent," and they’ve only gotten worse over time. "Pathetic" and "useless" are words that come to mind after this year's user testing. In a recent study, for example, a user wanted to buy a highly protective yet girlish phone case as a gift for her daughter. While on Amazon.com, she engaged in random fishing expeditions into the product database, using search queries such as "pink impact resistant iphone 5 cover." Jakob Nielsen http://www.nngroup.com/articles/search-navigation/ OK. Men er dette så patetisk da?
  • 49. Hva er en søkemotor? En tjeneste som søker fram nettsider etter en forutgående indeksering utført av en "robot" Robotene er ikke flink til å finne deler av nettsider eller aggregat av nettsider, og klarer stort sett ikke å finne det som ikke er statiske sider med en fast adresse, f.eks. innholdet i databaser etc
  • 51. Hvordan jobber søkemotorene? Hvem trenger å vite noe om det? Hva er SEO? Hvordan virker PageRank? Hva er robots.txt? Hva er SiteMaps? Hva er schema.org og microdata?
  • 52. Hvordan jobber BIBSYS Ask? Hvem trenger å vite noe om det? - søkeindekser - innhold i søkeindeksene (marc-felt) - søke ord, antall ord - søke fraser - lengde - spesialtegn, tegnkonvertering - basisindex