SlideShare a Scribd company logo
1 of 12
OSLO STOCKHOLM LONDON BOSTON
Fileserver Search
Assessment - FSA
Projektbeskrivning
2013-04-17 Bo Engren
bo.engren@comperiosearch.com
Sammanfattning SFA
• Indexerar och analyserar gemensamma filservar
(H: G: etc. tjänster) med FAST/SharePoint
• Levererar en rapport på innehåll, datavolymer
och tänkbara lagringsbesparingar
• Kan utökas med innehåll på CMS plattformar
(Episerver mfl)
• Genomförande på cirka 2 veckors arbetstid och
4-5 v kalendertid
SFA – exempel på tidsplan
• Förberedelser vecka 1
– Checklista,
• Miljöer
• Källor (filservar etc.) volymer mm
• Prestanda på nätverk, servar mm
• Organisation, in house / remote access?
• Installation vecka 1
• Initial indexering vecka 1
• Ytterligare indexeringar vecka 2-4
• Analys inklusive rapportering vecka 4
• Summa arbetstid 2 veckor
• Kalendertid cirka 4-5 veckor (efter att HW finns
tillgänglig)
FSA rapporten
• Kvantitativ analys av innehåll på filservar
– Exempel på analysområden
• Filtyper (dokument, programfiler, bilder, etc)
• Åldersanalyser – gammal info, tillväxt(?)
• Metadata
• Författare, ägare till informationen
• Enkelt Business Case – 1+3 års perspektiv
• Strategi för hantering av växande datavolymer
– Migrering till SharePoint
Exempel på grafer från rapporten –
åldersfördelningar skapade/modifierade filer
0
100 000
200 000
300 000
400 000
500 000
600 000
700 000
800 000
900 000
1 000 000
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Antal
Skapat år
Antal filer efter skapat datum
Analys av filstorlekar
– antal filer och volym de tar på disk
719
238 181
916 727
271 785
608 240
233 915
70 034
8 681 509 40
0
100 000
200 000
300 000
400 000
500 000
600 000
700 000
800 000
900 000
1 000 000
1-10 B 10-100 B 100 B-1 KB 1-10 KB 10-100 KB 100 KB-1
MB
1-10 MB 10-100 MB 100 MB-1
GB
1-10 GB
Antal
Storleksgrupp
Antal filer efter storlek
Analys av filtyper
3 879
4 196
6 888
8 790
9 685
10 942
13 715
21 390
22 258
32 286
37 392
39 235
69 758
91 979
294 752
525 765
581 369
602 455
862 508
898 875
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000 900 000 1 000 000
Microsoft Access
CGM Graphic Metafile
DBase
Java Class File
Adobe Photoshop
EXE / DLL File
ZIP Archive
Enhanced Windows Metafile
Email Message
Microsoft Cabinet File
TIFF Image
Rich Text
XML Document
Microsoft PowerPoint
Adobe PDF
Web Page
Microsoft Excel
Text
Okända Filformat
Microsoft Word
Antal
Filtyp
De 20 vanligaste filtyperna
Analys av filtyper forts.
0
50 000
100 000
150 000
200 000
250 000
300 000
350 000
400 000
450 000
500 000
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Antal
Skapandedatum
De 10 vanligaste filtyperna
Adobe PDF Microsoft Excel Microsoft PowerPoint Microsoft Word
Rich Text Text TIFF Image Okända Filformat
Web Page XML Document
Exempel på fördjupade analyser:
• Olika typer av mediafiler – privata/företagets
• Analys av författare
• Analys av nyckelord/metadata
14
2
17
24
151
1
0
20
40
60
80
100
120
140
160
ISO Base
Media File
MPEG1 video MPEG2 video MPEG4 file QuickTime
Video
WAV Audio
10-100 MB
Antal
Filtyp
Antal mediafiler i storleksgruppen 10-100MB efter filtyp
Analys av duplikat – exakta filer
0
2 000
4 000
6 000
8 000
10 000
12 000
14 000
16 000
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Antal
År
Antal duplikat efter senast modifierat datum
Effekter av SFA på datalagring –
kostnadsbesparingar säkerhet och kvalitet
• Dubletthantering
• Säkerhetsaspekter (backuper, virus etc)
• Privat repektive företagets information
• Kontroll på lagringsbehov, tillväxt
• Retentionpolicy
• Underlätta migrering till SP (vet vad som finns)
• Legala aspekter – arkiverings och dokumentationskrav
• Etablering av företagets/organisationens taxonomi
• Metadata & termstore
Fileserver Search Assessment - Comperio

More Related Content

Similar to Fileserver Search Assessment - Comperio

Introduktion till länkade data
Introduktion till länkade dataIntroduktion till länkade data
Introduktion till länkade dataMetaSolutions AB
 
Om semantisk webb och länkade data
Om semantisk webb och länkade dataOm semantisk webb och länkade data
Om semantisk webb och länkade dataMatthias Palmer
 
VT17 - DA355A - Introduktion HTML
VT17 - DA355A - Introduktion HTMLVT17 - DA355A - Introduktion HTML
VT17 - DA355A - Introduktion HTMLAnton Tibblin
 
VT18 - DA355A/DA344A - Introduktion till HTML
VT18 - DA355A/DA344A - Introduktion till HTMLVT18 - DA355A/DA344A - Introduktion till HTML
VT18 - DA355A/DA344A - Introduktion till HTMLAnton Tibblin
 
Lemoon cms utbildning
Lemoon cms utbildningLemoon cms utbildning
Lemoon cms utbildningDearFriends
 
VT2019 - DA355A - Intro HTML & CSS
VT2019 - DA355A - Intro HTML & CSSVT2019 - DA355A - Intro HTML & CSS
VT2019 - DA355A - Intro HTML & CSSAnton Tibblin
 
HT16 - DA156A - Kursintroduktion
HT16 - DA156A - KursintroduktionHT16 - DA156A - Kursintroduktion
HT16 - DA156A - KursintroduktionAnton Tibblin
 
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)Anton Tibblin
 
Introduktion till HTML
Introduktion till HTMLIntroduktion till HTML
Introduktion till HTMLAnton Tibblin
 
HT19 - DA156A - Introduktion till HTML
HT19 - DA156A - Introduktion till HTMLHT19 - DA156A - Introduktion till HTML
HT19 - DA156A - Introduktion till HTMLAnton Tibblin
 
HT17 - DA156A - Introduktion till HTML
HT17 - DA156A - Introduktion till HTMLHT17 - DA156A - Introduktion till HTML
HT17 - DA156A - Introduktion till HTMLAnton Tibblin
 
Länkad Data
Länkad DataLänkad Data
Länkad Dataniklal
 
HT18 - DA156A - Introduktion till HTML
HT18 - DA156A - Introduktion till HTMLHT18 - DA156A - Introduktion till HTML
HT18 - DA156A - Introduktion till HTMLAnton Tibblin
 
HT16 - DA156A - Introduktion till HTML
HT16 - DA156A - Introduktion till HTMLHT16 - DA156A - Introduktion till HTML
HT16 - DA156A - Introduktion till HTMLAnton Tibblin
 
LODify - länkade data i molnet
LODify - länkade data i molnetLODify - länkade data i molnet
LODify - länkade data i molnetMetaSolutions AB
 
Nyheter Visual Studio 2010
Nyheter Visual Studio 2010Nyheter Visual Studio 2010
Nyheter Visual Studio 2010aljapaco
 

Similar to Fileserver Search Assessment - Comperio (20)

Introduktion till länkade data
Introduktion till länkade dataIntroduktion till länkade data
Introduktion till länkade data
 
Om semantisk webb och länkade data
Om semantisk webb och länkade dataOm semantisk webb och länkade data
Om semantisk webb och länkade data
 
VT17 - DA355A - Introduktion HTML
VT17 - DA355A - Introduktion HTMLVT17 - DA355A - Introduktion HTML
VT17 - DA355A - Introduktion HTML
 
VT18 - DA355A/DA344A - Introduktion till HTML
VT18 - DA355A/DA344A - Introduktion till HTMLVT18 - DA355A/DA344A - Introduktion till HTML
VT18 - DA355A/DA344A - Introduktion till HTML
 
Lemoon cms utbildning
Lemoon cms utbildningLemoon cms utbildning
Lemoon cms utbildning
 
VT2019 - DA355A - Intro HTML & CSS
VT2019 - DA355A - Intro HTML & CSSVT2019 - DA355A - Intro HTML & CSS
VT2019 - DA355A - Intro HTML & CSS
 
HT16 - DA156A - Kursintroduktion
HT16 - DA156A - KursintroduktionHT16 - DA156A - Kursintroduktion
HT16 - DA156A - Kursintroduktion
 
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
Webbapplikationer - Kursintroduktion (anton.tibblin@mah.se)
 
Introduktion till HTML
Introduktion till HTMLIntroduktion till HTML
Introduktion till HTML
 
HT19 - DA156A - Introduktion till HTML
HT19 - DA156A - Introduktion till HTMLHT19 - DA156A - Introduktion till HTML
HT19 - DA156A - Introduktion till HTML
 
HT17 - DA156A - Introduktion till HTML
HT17 - DA156A - Introduktion till HTMLHT17 - DA156A - Introduktion till HTML
HT17 - DA156A - Introduktion till HTML
 
Alfresco 3.3 - swedish
Alfresco 3.3 - swedishAlfresco 3.3 - swedish
Alfresco 3.3 - swedish
 
Länkad Data
Länkad DataLänkad Data
Länkad Data
 
HT18 - DA156A - Introduktion till HTML
HT18 - DA156A - Introduktion till HTMLHT18 - DA156A - Introduktion till HTML
HT18 - DA156A - Introduktion till HTML
 
HT16 - DA156A - Introduktion till HTML
HT16 - DA156A - Introduktion till HTMLHT16 - DA156A - Introduktion till HTML
HT16 - DA156A - Introduktion till HTML
 
Introduktion till LODify
Introduktion till LODifyIntroduktion till LODify
Introduktion till LODify
 
LODify - länkade data i molnet
LODify - länkade data i molnetLODify - länkade data i molnet
LODify - länkade data i molnet
 
Sympathy for data
Sympathy for dataSympathy for data
Sympathy for data
 
Synd presentation
Synd presentationSynd presentation
Synd presentation
 
Nyheter Visual Studio 2010
Nyheter Visual Studio 2010Nyheter Visual Studio 2010
Nyheter Visual Studio 2010
 

More from Comperio - Search Matters.

Samhandlingsløsninger med søk på tvers av kilder
Samhandlingsløsninger med søk på tvers av kilderSamhandlingsløsninger med søk på tvers av kilder
Samhandlingsløsninger med søk på tvers av kilderComperio - Search Matters.
 
NDC lightning SharePoint 2013 and Enterprise Search
NDC lightning SharePoint 2013 and Enterprise SearchNDC lightning SharePoint 2013 and Enterprise Search
NDC lightning SharePoint 2013 and Enterprise SearchComperio - Search Matters.
 
Improve Performance in Fast Search for SharePoint - Comperio
Improve Performance in Fast Search for SharePoint - ComperioImprove Performance in Fast Search for SharePoint - Comperio
Improve Performance in Fast Search for SharePoint - ComperioComperio - Search Matters.
 
Welcome virksomhetssøk og sosial samhandling - Comperio
Welcome virksomhetssøk og sosial samhandling - ComperioWelcome virksomhetssøk og sosial samhandling - Comperio
Welcome virksomhetssøk og sosial samhandling - ComperioComperio - Search Matters.
 
SharePoint 2013 Enterprise Search Prjoect Learnings - Comperio
SharePoint 2013 Enterprise Search Prjoect Learnings - ComperioSharePoint 2013 Enterprise Search Prjoect Learnings - Comperio
SharePoint 2013 Enterprise Search Prjoect Learnings - ComperioComperio - Search Matters.
 
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013Comperio - Search Matters.
 
Information wants to be free - Comperio seminar oslo14may2013
Information wants to be free - Comperio seminar oslo14may2013Information wants to be free - Comperio seminar oslo14may2013
Information wants to be free - Comperio seminar oslo14may2013Comperio - Search Matters.
 
Produktivitet 1.0 - Comperio Seminar oktober 2012
Produktivitet 1.0 - Comperio Seminar oktober 2012Produktivitet 1.0 - Comperio Seminar oktober 2012
Produktivitet 1.0 - Comperio Seminar oktober 2012Comperio - Search Matters.
 
Search solutions for big data and collaboration - Comperio seminar October 2012
Search solutions for big data and collaboration - Comperio seminar October 2012Search solutions for big data and collaboration - Comperio seminar October 2012
Search solutions for big data and collaboration - Comperio seminar October 2012Comperio - Search Matters.
 

More from Comperio - Search Matters. (17)

Samhandlingsløsninger med søk på tvers av kilder
Samhandlingsløsninger med søk på tvers av kilderSamhandlingsløsninger med søk på tvers av kilder
Samhandlingsløsninger med søk på tvers av kilder
 
Søkeløsningen dine kolleger drømmer om
Søkeløsningen dine kolleger drømmer omSøkeløsningen dine kolleger drømmer om
Søkeløsningen dine kolleger drømmer om
 
SharePoint Search mot 360 og ProArc
SharePoint Search mot 360 og ProArcSharePoint Search mot 360 og ProArc
SharePoint Search mot 360 og ProArc
 
NDC lightning SharePoint 2013 and Enterprise Search
NDC lightning SharePoint 2013 and Enterprise SearchNDC lightning SharePoint 2013 and Enterprise Search
NDC lightning SharePoint 2013 and Enterprise Search
 
Improve Performance in Fast Search for SharePoint - Comperio
Improve Performance in Fast Search for SharePoint - ComperioImprove Performance in Fast Search for SharePoint - Comperio
Improve Performance in Fast Search for SharePoint - Comperio
 
Search Driven Websites - Comperio
Search Driven Websites - ComperioSearch Driven Websites - Comperio
Search Driven Websites - Comperio
 
Search Analytics - Comperio
Search Analytics - ComperioSearch Analytics - Comperio
Search Analytics - Comperio
 
Welcome virksomhetssøk og sosial samhandling - Comperio
Welcome virksomhetssøk og sosial samhandling - ComperioWelcome virksomhetssøk og sosial samhandling - Comperio
Welcome virksomhetssøk og sosial samhandling - Comperio
 
Virksomhetssøk for prosjekt - Comperio
Virksomhetssøk for prosjekt  - ComperioVirksomhetssøk for prosjekt  - Comperio
Virksomhetssøk for prosjekt - Comperio
 
SharePoint 2013 Enterprise Search Prjoect Learnings - Comperio
SharePoint 2013 Enterprise Search Prjoect Learnings - ComperioSharePoint 2013 Enterprise Search Prjoect Learnings - Comperio
SharePoint 2013 Enterprise Search Prjoect Learnings - Comperio
 
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013
Yammer and office 365 roadmap update - Comperio seminar oslo14 May2013
 
Information wants to be free - Comperio seminar oslo14may2013
Information wants to be free - Comperio seminar oslo14may2013Information wants to be free - Comperio seminar oslo14may2013
Information wants to be free - Comperio seminar oslo14may2013
 
Sökmotorn i SharePoint 2013 - Comperio
Sökmotorn i SharePoint 2013 - ComperioSökmotorn i SharePoint 2013 - Comperio
Sökmotorn i SharePoint 2013 - Comperio
 
Big Data – good news for Enterprise Search
Big Data – good news for Enterprise SearchBig Data – good news for Enterprise Search
Big Data – good news for Enterprise Search
 
Produktivitet 1.0 - Comperio Seminar oktober 2012
Produktivitet 1.0 - Comperio Seminar oktober 2012Produktivitet 1.0 - Comperio Seminar oktober 2012
Produktivitet 1.0 - Comperio Seminar oktober 2012
 
Search solutions for big data and collaboration - Comperio seminar October 2012
Search solutions for big data and collaboration - Comperio seminar October 2012Search solutions for big data and collaboration - Comperio seminar October 2012
Search solutions for big data and collaboration - Comperio seminar October 2012
 
Hvordan lykkes med intern Facebook og Google
Hvordan lykkes med intern Facebook og GoogleHvordan lykkes med intern Facebook og Google
Hvordan lykkes med intern Facebook og Google
 

Fileserver Search Assessment - Comperio

  • 1. OSLO STOCKHOLM LONDON BOSTON Fileserver Search Assessment - FSA Projektbeskrivning 2013-04-17 Bo Engren bo.engren@comperiosearch.com
  • 2. Sammanfattning SFA • Indexerar och analyserar gemensamma filservar (H: G: etc. tjänster) med FAST/SharePoint • Levererar en rapport på innehåll, datavolymer och tänkbara lagringsbesparingar • Kan utökas med innehåll på CMS plattformar (Episerver mfl) • Genomförande på cirka 2 veckors arbetstid och 4-5 v kalendertid
  • 3. SFA – exempel på tidsplan • Förberedelser vecka 1 – Checklista, • Miljöer • Källor (filservar etc.) volymer mm • Prestanda på nätverk, servar mm • Organisation, in house / remote access? • Installation vecka 1 • Initial indexering vecka 1 • Ytterligare indexeringar vecka 2-4 • Analys inklusive rapportering vecka 4 • Summa arbetstid 2 veckor • Kalendertid cirka 4-5 veckor (efter att HW finns tillgänglig)
  • 4. FSA rapporten • Kvantitativ analys av innehåll på filservar – Exempel på analysområden • Filtyper (dokument, programfiler, bilder, etc) • Åldersanalyser – gammal info, tillväxt(?) • Metadata • Författare, ägare till informationen • Enkelt Business Case – 1+3 års perspektiv • Strategi för hantering av växande datavolymer – Migrering till SharePoint
  • 5. Exempel på grafer från rapporten – åldersfördelningar skapade/modifierade filer 0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000 900 000 1 000 000 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Antal Skapat år Antal filer efter skapat datum
  • 6. Analys av filstorlekar – antal filer och volym de tar på disk 719 238 181 916 727 271 785 608 240 233 915 70 034 8 681 509 40 0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000 900 000 1 000 000 1-10 B 10-100 B 100 B-1 KB 1-10 KB 10-100 KB 100 KB-1 MB 1-10 MB 10-100 MB 100 MB-1 GB 1-10 GB Antal Storleksgrupp Antal filer efter storlek
  • 7. Analys av filtyper 3 879 4 196 6 888 8 790 9 685 10 942 13 715 21 390 22 258 32 286 37 392 39 235 69 758 91 979 294 752 525 765 581 369 602 455 862 508 898 875 0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000 900 000 1 000 000 Microsoft Access CGM Graphic Metafile DBase Java Class File Adobe Photoshop EXE / DLL File ZIP Archive Enhanced Windows Metafile Email Message Microsoft Cabinet File TIFF Image Rich Text XML Document Microsoft PowerPoint Adobe PDF Web Page Microsoft Excel Text Okända Filformat Microsoft Word Antal Filtyp De 20 vanligaste filtyperna
  • 8. Analys av filtyper forts. 0 50 000 100 000 150 000 200 000 250 000 300 000 350 000 400 000 450 000 500 000 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Antal Skapandedatum De 10 vanligaste filtyperna Adobe PDF Microsoft Excel Microsoft PowerPoint Microsoft Word Rich Text Text TIFF Image Okända Filformat Web Page XML Document
  • 9. Exempel på fördjupade analyser: • Olika typer av mediafiler – privata/företagets • Analys av författare • Analys av nyckelord/metadata 14 2 17 24 151 1 0 20 40 60 80 100 120 140 160 ISO Base Media File MPEG1 video MPEG2 video MPEG4 file QuickTime Video WAV Audio 10-100 MB Antal Filtyp Antal mediafiler i storleksgruppen 10-100MB efter filtyp
  • 10. Analys av duplikat – exakta filer 0 2 000 4 000 6 000 8 000 10 000 12 000 14 000 16 000 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Antal År Antal duplikat efter senast modifierat datum
  • 11. Effekter av SFA på datalagring – kostnadsbesparingar säkerhet och kvalitet • Dubletthantering • Säkerhetsaspekter (backuper, virus etc) • Privat repektive företagets information • Kontroll på lagringsbehov, tillväxt • Retentionpolicy • Underlätta migrering till SP (vet vad som finns) • Legala aspekter – arkiverings och dokumentationskrav • Etablering av företagets/organisationens taxonomi • Metadata & termstore