2. OBS!
Denne presentasjonen er laget for et internt kollokvium ved NTNU 20. mars 2013.
Tatt ut av denne sammenhengen kan den være ufullstendig. Fordi dette var et
kollokvium, er noen av punktene en smule retoriske.
Del 1 er noe preget av den verktøysituasjonen UB er i for øyeblikket.
Del 2 er noe mer teknisk og ikke særlig UB-spesifikk.
Denne presentasjonen er underlagt en Creative Commons lisens CC BY-SA 3.0
4. Hva er vi på jakt etter
Tekstdokumenter
Andre dokumenter
Informasjon
Kunnskap
Ekspertråd
Fakta
Vet vi hva vi vil ha? Hva med sjanger, nivå,
autoritet, språk, ventetid, format, pris,
5. Vet vi om vi fant det?
Er vi på jakt etter et kjent dokument er saken
klar
Men ellers da?
Går det an å måle det?
Hva er relevans?
Hva er gjenfinning og presisjon?
Hva er relevansrangering?
Hva er the long tail?
6. Innhold
1. Søkeverktøy som er dagsaktuelle ved UB
2. Tilbakeblikk og gjennomgang av mer
grunnleggende begreper og teknologier
OBS: Dette er et kollokvium!
7. 1. I dag
Google - Google Scholar - Bing - Yandex -
DuckGoGo - Wikipedia - Mendeley - Primo -
Discovery - EDS - Summon - VuFind -
Facebook - Twitter - YouTube - WorldCat Local
- BIBSYS Ask - BIBSØK -
GENSØK- bokhylla.no
8. Discovery
handler om å oppdage eller finne ting
ikke bare vha tradisjonell søking
men via anbefalinger, sosial søking, snubling
(serendipity) etc
10. Kunnskapsbase
fordi ikke alle eksemplarer er tilgjengelige
Spinal en plaque meningiomas: A contemporary experience
E Caroli, M Acqui, R Roperto, L Ferrante… - Neurosurgery, 2004 - journals.lww.com
OBJECTIVE: Spinal en plaque meningiomas are rare and challenging lesions because of Google Scholar
their tendency to induce spinal arachnoiditis. The surgical treatment of this type of
meningioma is more complex than that of classic meningioma. METHODS: We report ..
Eks 1 http://journals.lww.com/neurosurgery/Abstract/2004/12000/Spinal_en_Plaque_Meningiomas__A_Contemporary.5.
aspx
Eks 2 http://ovidsp.uk.ovid.com/sp-3.8.1a/ovidweb.cgi?
QS2=434f4e1a73d37e8c740ce3cde7a33785b1e50109abeb977063eb5f5aed1249bf31d4353e62006f32ad18b7946547
23bb2e83912c60a4886baa4711a6ef570f9c27f69b81dbc8ccc21cc23088ac2d322773d73ec2d2541de9cef44a8fc098c80
377362e88a28a1011e42a5e3415b9d29ec653b867ffa2210590e05070aa5618f2677d60027b80964b79d47b3fd4baaa34
4adc7b2e7c7e106f50397a112fb43625f878b9fac2fcd1c854d586ff1481a54fbae99747a473c9e7cddf3db61a877861d1a1
4f2960227bbd2805334bd32951ddec40ce7e361efe31e3b5d7c9bc7c450ad30947ee0b5620a4338d63a04aa7cd8c4d54a
db621c146e31985d34f3d2c6d98bad152eb277ee482024854f78d7206478beec64b9581c5c7d53c636b8aab22f11e9bfe
b5de941976309d9db84c5881f4059d6e4951ac6d19c49e2f959794dfe060785bb13ea315d9d69b818aeee924dcca2cdce
5dc847b51638ac61d75ea82ce9b7d9e0592f879cf55d46ed3988af91a5e03f469048294d20743065f9e37b952c8e2ce916
617082fea1d4578dec03cf3a15509aeab72acf08c186c6b5ad947d14b90048d923e3c9153e0dc9d15dba2b4e662677593
a721cdbe8d27866bc05290
11. Kunnskapsbase
(= Knowledge base )
Inneholder info om hvor det finnes et
tilgjengelig eksemplar av et dokument
NTNU bruker kunnskapsbasen SFX Global
Knowledgebase
12. Kunnskapsbasen SFX
inneholder informasjon om
tilgjengelige eksemplarer av
● lisensierte etidsskrifter
● gratis etidskrifter
● ebøker (kjøpte eller via PDA)
inneholder ikke info om trykte ressurser
13. Kunnskapsbaser
Ex Libris SFX Global Knowledgebase
OCLC WorldCat knowledge base
EBSCO LinkSource
Serial Solutions 360 Link / KnowledgeWorks
Bibliotekbasen i BIBSYS er også en
kunnskapsbase
Internasjonalt initiativ for å standardisere
virkemåten til kunnskapsbasene: KBART
14. Mer om kunnskapsbaser
Det har siden 2000 (da kom SFX på markedet) vært en
tendens til at KB har vært levert sammen med (som en del
av) lenketjener.
I dagens marked er det sannsynligvis en ny retning å
spore, nemlig at KB knyttes sterkere til
discoveryverktøyene, slik at brukeren ser "direkte lenker" i
stedet for "SFX-meny" o.l.
Det er ikke unaturlig at f.eks. OCLC er en pådriver her, ved
å si at WorldCat fungerer også som KB.
15. ERM
( = Electronic Resources Management )
Verktøy for å administrere bibliotekets avtaler
om tilgang til e-ressurser
NTNU har anskaffet ERM fra EBSCO
16. Lenketjener
(= Link resolver )
Nettbasert tjeneste som presenterer en klikkbar
lenke til et tilgjengelig eksemplar av en ressurs
UB bruker lenketjeneren SFX i samarbeidet
innen Uniport-konsortiet
SFX er valgt som lenketjener av BIBSYS
17. Lenketjenere
Ex Libris SFX
OCLC OCLC Link Manager
EBSCO LinkSource
Serial Solutions 360 Link
Lenketjeneren trenger en kunnskapsbase
for å finne tilgjengelige eksemplarer!
19. Lenketjenere og OpenURL
OpenURL er en metadataURLstandard som
tillater dynamisk lenking mellom kilde og mål
Kilde (source) = Web of Science Mål (target) = Elsevier
20. Slik ser en OpenURL ut
http://x-port-sfx.uio.no/sfx_ubit
?sid=google
&auinit=E
&aulast=Caroli
&atitle=Spinal+en+plaque+meningiomas:
+A+contemporary+experience
&title=Neurosurgery
&volume=55
&issue=6
&date=2004
&spage=1275
&issn=0148-396X
21. Lenketjener vs direkte lenking
Brukerne oppfatter ikke det geniale ved
lenketjeneren på samme måte som oss!
De synes sfx bare er et ekstra unødvendig klikk
Tendens: discoveryverktøyene har en innbygd
kunnskapsbase slik at direktelenking er mulig
Lenketjenerne viktigst for "tredjepartsystemer"
23. Søkeverktøy
( = Discovery tool )
En nettbasert tjeneste for å finne alle mulige
ressurstyper bl.a. ved å søke i forskjellige
søkekilder
NTNU har Metalib og Primo Central
Vi "har" også Google Scholar
24. Søkeverktøy av forskjellige typer
Terminologi og navnebruk er nokså grumset
Discovery tool brukes gjerne om systemer
hvor man samler søkedata til en felles indeks
(f.eks. Primo)
Federated search brukes om systemer hvor
det søkes distribuert, dvs i forskjellige kilder
samtidig (f.eks. Metalib)
25. Søkeverktøy
Ex Libris Primo / Primo Central
OCLC Worldcat Local
EBSCO EBSCO Discovery Service (EDS)
Serial Solutions Summon
Dette er de "store" verktøyene for tida
Det finnes også flere (kommersielle og frie)
Og så har vi Google Scholar
Tida har gått fra federated search (Metalib)
29. Google Scholar
Det som gjør Google Scholar til et så bra
verktøy for NTNU-brukere er ikke at det har så
god gjenfinningsfunksjonalitet eller at det har så
stor dekning
men
at vi har god orden på våre beholdninger via
en kunnskapsbase og lenkeserver
30. Skifte av discoverysystem
Det som gjør at det er mulig å skifte
discoverysystem på forholdsvis kort tid
eller evt anskaffe et nytt hvis Google legger inn
årene
at vi har god orden på våre beholdninger via
en kunnskapsbase og lenkeserver
31. Må vi ha discoverysystem?
Tja.
● Det perfekte søkeverktøy finnes ikke
● Ingen er så omfattende at de overflødiggjør
spesialdatabaser (aka fagdatabaser)
● Det er usikkert om noe er så mye bedre enn
Google Scholar at det er pengene verdt
● Av hensyn til Google Scholar og fagdatabaser
må vi fortsatt ha lenketjener
32. Må vi ha discoverysystem?
Dette er et fiktivt strategidokument. Se mer om det på neste side.
1. UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I
stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å
levere materiale som er produsert av vitenskapelige ansatte ved NTNU.
2. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne
nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og
internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil
vi har bedre løsninger.
3. Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen
gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg
denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for
hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon.
4. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer.
5. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt
trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
33. Dette var altså ren fiction
Men teksten er direkte oversatt fra et virkelig
dokument fra Universitetet i Utrecht:
http://www.libereurope.eu/blog/thinking-the-unthinkable-a-
library-without-a-catalogue-reconsidering-the-future-of-
discovery-to
Utrecht er erstattet med NTNU
Omega er erstattet med Primo Central
WebOPAC er erstattet med BIBSYS-katalogen
36. What is a resource?
That is rather a deep question and the
precise definition is still the subject of
debate. For our purposes we can think of
it as anything we can identify. You are a
resource, as is your home page, this
tutorial, the number one and the great
white whale in Moby Dick.
(RDF)
37. Metadata
Strukturerte data som beskriver en ressurs
Typisk eksempel: bibliografiske data
100 $a Aalberg, Trond
245 $a A Tool for Converting from MARC to FRBR
700 $a Husby, Ole
856 $u http://dx.doi.org/10.1007/11863878_41
38. Digresjon: Setninger
Utsagn om ting
http://orcid.org/0000-0002-9113-2142 hasName
isCreatorOf Ole Husby
http://dx.doi.org/10.1007/11863878_41
hasTitle
A Tool for Converting from MARC to FRBR
39. The Library should not invest in a new library discovery tool.
UB skal ikke investere i et nytt discoveryverktøy. For våre The benefit for our users will be marginal. Instead, we should
brukere ville dette ha bare en marginal verdi. I stedet skal vi concentrate on improving delivery of the materials purchased
konsentrere innsatsen om å levere materiale som er lisensiert for and licensed for NTNU users or produced by NTNU scholars.
NTNU-brukere, samt å levere materiale som er produsert av Discovery in the public cloud of special collections and certain
vitenskapelige ansatte ved NTNU. Enkelte av våre other special materials is still inadequate. We need to
spesialsamlinger har fremdeles ikke gode nok muligheter for å bli improve findability by adding metadata to national and
funnet på det åpne nettet. Det er nødvendig å forbedre international initiatives. If necessary we may need to hold on
Indeksering gjenfinningen ved å dele metadata gjennom nasjonale og to parts of the BIBSYS OPAC to ensure materials can be
internasjonale tjenester. Om nødvendig må vi fortsette å bruke found until better solutions will become available. We should
BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger. rethink the role of the library in giving access to scientific
Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av information. Our role in discovery of scientific information has
Dokumenter
vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester
for slik informasjon har vært en del av vår identitet i årevis. Vi
innser at å gi fra seg denne rollen til andre aktører vil få oss til å
føle oss nakne og usikre. Derfor må vi legge nye planer for
been part of our library identity for years. We realise that
relinquishing this role to other players can make us feel naked
and uncertain. We have to rethink and redesign the way we
offer our services for access to scientific information. We
hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig should phase out Primo. For discovery of electronic articles
informasjon. Vi vil fase ut Primo Central. For oppdaging av e- there are sufficient alternatives available. We should
ressurseer finnes det tilstrekkelig gode alternativer. Vi må investigate if and how the BIBSYS OPAC can serve as a
undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes delivery tool for our printed materials. It might be useful as a
som et tilgangsverktøy for vårt trykte materiale. Den kan være “known item search”– tool.
nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
Indeksering
Søking
Database
40. Databaser
Referansedatabaser (A&I)
laget for å gi god søking
Fulltekstdatabaser
laget for å gi tilgang til fulltekst
Bibliotekdatabaser
laget for å vise hva biblioteket har
Kunnskapsbaser
laget for å viser hva biblioteket har
41. Samkataloger og samsøking
Formål: søke i flere søkekilder på et sted
I gamle dager: Samkataloger = fysisk
sammenslåing av flere kataloger til en
På 1990-tallet: Samsøking = metasøking =
søking i forskjellige søkekilder fra ett grenssnitt
I dag: Discovery = fysisk sammenslåing av
flere søkeindekser til en
42. Samsøking
Fungerte vha standardisering av
søkeprotokoller (f.eks. Z39.50 som i
MetaLib)
og / eller via flerprotokollsystemer (IANI,
MetaLib)
43. Samsøking var dømt til å mislykkes
fordi
● protokollene og standardene var for
komplekse
● de lokale tolkingene av dem forskjellige
● serverne var for dårlige og ustabile
● sammenfletting og deduplisering av treff fra
forskjellige systemer var i praksis umulig i
det virkelige liv
44. Søketeknologi før (IR)
Hvordan matche søketermer og indekstermer
Boolsk søking vs
Vektorsøking
Trunkering vs
Lingvistisk analyse
45. Søkespråk
CCL: Common Command Language (GENSØK)
CQL: Contextual Query Language (Ask)
boolske operatorer
feltkoder
trunkering
nærhetsoperatorer
sortering
visningsformater osv osv osv
46. Standardiseringsbehov
From: Even Hartmann Flood <even.flood@ub.ntnu.no>
To: Ole Husby <ole.husby@ub.ntnu.no>
Jeg kan godt ha sagt noe slikt - jeg brukte mange systemer og det var jo ikke to som var
like. Fortvilelsen var stor. Men noen tall husker jeg ikke. Jeg husker a du engang ga
meg i oppdrag å skaffe eksempler på forskjellige søkespråk og jeg i et anfall av glad
sadisme ga deg en rekke av de forskjellige utskriftkommandoene jeg hadde funnet i
forskjellige tjenester.
Even
> >From: Ole Husby [mailto:ole.husby@ub.ntnu.no]
> >To: Even Hartmann Flood
> >Subject: Søkespråk
> >du sa en gang, kanskje for 20 år siden, at du hadde sjekket 50 søkesystemer
> >og funnet 49 forskjellige søkespråk. Eller kanskje var det helt andre tall.
> >Husker du?
> >
> >Ole
47. Søketeknologi nå (Google)
Hvordan matche søkeuttrykk og dokumenter
Kvasi-goolsk søking
Strengmatching
Lenkeanalyse
Kontekstuelle, lokalitets-, personlige og sosiale
aspekter
Ingen får vite nøyaktig hvordan dette virker
Men hvor mye har det å si?
48. Pathetic users
Users are incredibly bad at finding and researching things on the web. A few
years ago, I characterized users' research skills as "incompetent," and they’ve
only gotten worse over time. "Pathetic" and "useless" are words that come to
mind after this year's user testing.
In a recent study, for example, a user wanted to buy a highly protective yet
girlish phone case as a gift for her daughter. While on Amazon.com, she
engaged in random fishing expeditions into the product database, using search
queries such as "pink impact resistant iphone 5 cover."
Jakob Nielsen http://www.nngroup.com/articles/search-navigation/
OK. Men er dette så patetisk da?
49. Hva er en søkemotor?
En tjeneste som søker fram nettsider etter en
forutgående indeksering utført av en "robot"
Robotene er ikke flink til å finne deler av
nettsider eller aggregat av nettsider, og klarer
stort sett ikke å finne det som ikke er statiske
sider med en fast adresse, f.eks. innholdet i
databaser etc
51. Hvordan jobber søkemotorene?
Hvem trenger å vite noe om det?
Hva er SEO?
Hvordan virker PageRank?
Hva er robots.txt?
Hva er SiteMaps?
Hva er schema.org og microdata?
52. Hvordan jobber BIBSYS Ask?
Hvem trenger å vite noe om det?
- søkeindekser
- innhold i søkeindeksene (marc-felt)
- søke ord, antall ord
- søke fraser - lengde
- spesialtegn, tegnkonvertering
- basisindex