SharePoint Community
Mittelland
Enterprise Search
21. November 2013
Über mich
Patrick Mäschli
pm@garaio.com
Senior Consultant / Solution Architect
GARAIO AG
www.garaio.com
SharePoint Community
Mittelland

• Plattform für SharePoint Developer, IT Professionals und
Power User im Espace Mittelland
• Offen für alle interessierten Personen (Kunden und Microsoft
Partner)
• Gratis
• Geplant 9 Events / Jahr
• Website: http://ww.sharepointmittelland.ch
• Yammer: http://bit.ly/134JEcq
• XING: http://bit.ly/Xxgjm1
• Kontakt: Roger Haueter, David Schneider und Patrick Mäschli
Suchen, Finden, Suchen,
Finden..

ENDLESS POSSIBILITIES
Enterprise Search
Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein
Teilgebiet von Information Retrieval und bezeichnet den
Vorgang der computergestützten inhaltsorientierten Suche mit
Hilfe einer unternehmensinternen Suchmaschine, welche Content
mittels so genannter Crawler indexiert.

http://de.wikipedia.org/wiki/Enterprise_Search
Verwandte Themen
• Semantische Suche
• Taxonomie
• Big Data
Enterprise Search
•
•
•
•
•
•
•
•
•
•
•
•

Relevanz
Security!
Entity Extraction
Federated Search
Word Stemming / Breaking
Linguistic Support
Alerting
Query Suggestions
Saved Searches
Classification
Enterprise Content Aggregation
Skalierbarkeit
Los geht’s

ENDLESS POSSIBILITIES
Definitionen
• Strukturierte Inhalte
Klar definierte Metainformationen, z.Bsp Datenbanken
• Unstrukturierte Inhalte
Eine Sammlung von Informationen wie z.Bsp
Dokumenteninhalte
• Unstrukturierte Suche
Volltextsuche in einem Index
• Strukturierte Suche
Suche nach Metadatum(Author:Arno Meister)
Theorie
• Metadatenkonzept

• Alles gem. Konzept
Praxis
• Metadatenkonzept?

• Keine Grüne Wiese
• Inhalte ausserhalb «kontrolliertem»
Repository / Legacy Systeme
Herausforderungen
• Schlechte Metadaten, schlechte Resultate

• Unzufriedene Benutzer..
Logische Architektur

ENDLESS POSSIBILITIES
Logische
Content Processing
• Verarbeitet die gecrawlten Inhalte

• Parsing der Inhalte
• Mapping der Properties

• Lingustische Operationen (Entity Extraction)
Entity Extraction

ENDLESS POSSIBILITIES
Entity Extraction
Parsing der Inhalte und Mapping auf Termstore

Es stehen 2 Varianten zur Verfügung
• Company Name Extraction
Auslesen der Inhalte und Mapping auf ein Termset
• Custom Extraction
Erstellung eines eigenen Termsets und Mapping auf Refiner
Hands-On I

ENDLESS POSSIBILITIES
Company Name Extraction
• Definieren eines Managed Property als «Company Name
Extraction»
z.Bsp Body
• Befüllen eines Termsets mit den zu extrahierenden Namen

• Konfiguration Refiner
Hands-On II

ENDLESS POSSIBILITIES
Custom Extraction
• Erstellen eines CSV für das Termset
• Import des Termsets
$searchApp = Get-SPEnterpriseSearchServiceApplication
Import-SPEnterpriseSearchCustomExtractionDictionary –SearchApplication $searchApp –Filename
serverc$folderWordPartExtraction.csv –DictionaryName
Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.3

• Konfiguration Refiner
Wordpart & Co
• Word Extraction
Case-Insensitive, das gesamte Wort muss passen
• Word Part Extraction
Case-Insensitive, der Wortteil muss passen

• Word Exact Extraction
Case-Sensitive, das gesamte Wort muss passen
• Word Part Exact Extraction
Case-Sensitive, der Wortteil muss passen
Fazit
• Strukturiertere Suche mittels Refinements

• Auch auf Fremdinhalten nutzbar (Fileserver, Externes DMS)
• Nicht der Schlüssel zum Glück – Entity Extraction erlaubt
Extraktion auf bestehenden Inhalten, kein «Mehrwert»
Kontext ist King

ENDLESS POSSIBILITIES
Kontext ist King
Durch Anreicherung der eigentlichen Inhalte mit Informationen aus
dem Kontext kann der Inhalt *verbessert* werden
• Informationen von übergeordneten Ebenen
• Informationen des Bearbeitenden Benutzers
• Informationen aus einem LOB / Umsystem Z.Bsp SAP / DB /
etc..

Echtes Information Retrieval
Content Enrichment

ENDLESS POSSIBILITIES
Content Enrichment
Zur Anreicherung der Index Daten kann der Content Enrichtment
Web Service genutzt werden
Jedes Element welches im Content Processing Schritt durchlaufen
wird, kann ergänzt werden

Einerseits um Kontextinformationen hinzuzufügen, oder um eigene
prozessierungen durchzuführen (Spracherkennung, Erstellung
Vorschaubilder usw)
Content Enrichment
Content Processing

Processed
Item

To
Index

Webservice
Callout

Magic
Code
Content Enrichment

Magic
Code
Content Enrichment: How To
• Webservice erstellen der IContentProcessingEnrichmentService
implementiert.
• In public ProcessedItem ProcessItem(Item item) die
Businesslogik implementieren

• Managed Property erstellen
• Powershell zur Konfiguration des Services aufrufen (Service Endpoint,
Input & Output Property
set-SPEnterpriseSearchContentEnrichmentConfiguration
• Full Crawl
Hands-On III

ENDLESS POSSIBILITIES
Content Enrichment
Anreicherungen von Daten in bestehendem Index
Vorteile:
• Suchabfragen sind performant
• Businesslogik kann im Suchprozess abgedeckt werden
• Dadurch *einfache* Integration
• Anreicherung auch Asynchron möglich
• Mit dem Content Search WebPart kann direkt der Index
abgefragt werden
• Ergänzung von Daten durch Umsysteme oder hierarchische
Informationen
Szenarien
• Anreicherung aus Kontext
• Integration von LOB Daten direkt auf dem Element
• Erweitertes processing (Spracherkennung usw)
Fazit
Content Enrichment ermöglicht die Ergänzung und
Anreicherungen des SharePoint Such-Indexes
Im Gegensatz zu Entity Extraction auch mit eigener Logik
Dies erlaubt es, der Suche Zusatzinformationen mitzugeben, um
die Resultate «Intelligenter» zu gestalten!

Bessere Resultate –
Zufriedene Nutzer
Mehr..
REST API
http://msdn.microsoft.com/en-us/library/office/jj163876.aspx
Company Name Extraction
http://technet.microsoft.com/en-us/library/jj591605.aspx

Erstellen eines Custom Entity Extractors
http://technet.microsoft.com/en-us/library/jj219480.aspx
Content Enrichment Webservice Callout
http://msdn.microsoft.com/en-us/library/jj163982.aspx
Conten
WETTBEWERB!
Gutschein für ein gratis eBook von O’Reilly
http://www.sharepointmittelland.ch/
Save the Date
SharePoint Apps Hack Day
SA 30. November 2013, 12.00 Uhr – 18.00 Uhr
isolutions AG, Bern
Danke…

ENDLESS POSSIBILITIES
Kontaktperson
Patrick Mäschli
+41 58 310 70 58
pm@garaio.com

GARAIO AG – Laupenstrasse 45 – Postfach 6249 – 3001 Bern – www.garaio.com

SharePoint Community Mittelland - GARAIO : Enterprise Search