SlideShare ist ein Scribd-Unternehmen logo
1 von 39
Capitalisez vos contenus 
Content Server 
Paris le 18 Novembre 2014 
Philippe Deltenre – Temis 
Pierre Nocera – Red Tree Software 
Jean-Marc Touzard – Camoai
Agenda 
• 15’ : Présentation des acteurs et genèse de la solution 
• 30’ : Notions d'enrichissement sémantique 
• 30’ : Présentation de la solution Luxid® for OpenText 
• 30’ : Témoignage de l’OCDE 
• 30’ : Questions ⁄ Réponses
• Éditeur spécialisé dans les modules 
complémentaires à la suite Content Server : 
• Expertise documentaire 
• Forte valeur ajoutée 
• Centré sur les besoins de l’utilisateur. 
• Red Tree Software est distribué en France et 
à l’étranger par un réseau de partenaires.
• Accélérateur de Transformation Numérique Camoai propose à ses 
clients conseil opérationnel et accompagnement : 
• Projets Xnet, collaboratif, socialisation 
• Projets ECM 
• Projets BPM 
• Projets de mobilité et entreprise étendue. 
• Les solutions Content Server et SharePoint sont au coeur de ces 
offres, et Temis un partenaire naturel pour accompagner nos clients 
dans leurs projets ECM et Big Data.
Pionnier de l’Enrichissement de Contenu depuis 2000 
70 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 5
Références clé 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 6
Structurer 
les contenus non structurés 
pour mieux les gérer 
et mieux les valoriser 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 7
Notions d’enrichissement sémantique 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 8
- Flux de traitement sémantique 
WSeu rje. portV ar b5.2 year-old mPaanti epnretsenting an acVuteer bheair loss induScyemd bpytô cmarebamazepineV (eCrBbZe) in concentraMtioédn iocaf m8.e6n mt icrog/ml. Dosage 
Identification des relations 
WSuej. repoVrtr ba. 52 year-oldP mataienn ptresenting an aVceurtbee hair loss indSuycmedp tbôym cearbamazepinVee r(bCeBZ) in concentMraétidoinca omf e8n.6t microg/ml. Dosage 
2 Identification des entités 
1 Analyse morpho-syntaxique 
We report a 52 year-old man presenting an acute hair loss induced by carbamazepine (CBZ) in concentration of 8.6 microg/ml. 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 9 
EFFET SECONDAIRE 
Symptôme Alopécie 
Cause Carbamazepine 
Dosage 8.6 mg/ml 
Patient 52 year-old male 
3
Quelles informations métier ? 
A vous de le décider…quelques exemples 
 Personnes 
• Clients, Collaborateurs, Rattachement à votre annuaire 
 Organisations 
• Filiales, Services, Fournisseurs, Compétiteurs, Partenaires 
 Références internes 
• Projet, contrat, client, zone géographique, marché, etc… 
 Noms de vos produits ou services 
• Taxonomie produit, accessoires, options, etc… 
 Terminologie et Catégories métier 
• Vocabulaires techniques 
• Catégories documentaires 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 10
La plate-forme logicielle Luxid 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 11
Content Enrichment Platform 
Annotation 
Factory 
Skill Cartridge® 
Library 
Content 
Enrichment 
Studio 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 12 
• Robustesse, Scalabilité, APIs, Web Services 
• 20 langues 
• Entités / Relations / Catégories / Thèmes … 
• Thésaurii, taxonomies, règles sémantique, statistiques, apprentissage 
(machine learning)
 Moteurs d’extraction spécialisés 
• Focalisés sur vos “objets d’intérêt” 
• Entités, Relations, Thèmes, Opinions, etc 
 Modulaires & Puissants 
• Combinables dans un même plan de traitement 
• Large gamme de techniques d’extraction 
• 20 langues 
• Faciles à personnaliser avec Content Enrichment Studio 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 13 
Skill Cartridges® 
• Anglais 
• Français 
• Allemand 
• Flamand 
• Italien 
• Espagnol 
• Portugais 
• Tchèque 
• Russe 
• Hongrois 
• Polonais 
• Grec 
• Suédois 
• Danois 
• Norvégien 
• Finlandais 
• Chinois 
• Japonais 
• Coréen 
• Arabe 
Skill 
Cartridge 
1 
Morpho 
Syntaxique 
Skill 
Cartridge 
2 
Thesaurus 
Skill 
Cartridge 
3 
Statistique 
Skill 
Cartridge 
n 
Machine 
Learning
XelDA Admin 
Annotation Plan 
Document 
200+ formats 
XML, HTML, 
txt, doc, pdf, … 
Web Services SOAP-REST / Modèle de données unique Ressources d’annotation 
unifiées (Skill Cartridge®) 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 14 
REST API 
SC1 SC2 SCn 
Document 
Annoté 
XML / JSON / RDF 
Enterprise 
Search 
Extraction d’information robuste
AS AS AS AS AS AS AS AS 
• Utilisation CPU élevée dans toutes configurations 
• Déploiement en un clic dans le Cloud 
• Conçu pour les Big Data (Hadoop) 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 15 
Montée en charge / Cloud 
Annotation 
Server 
Multi-core 
Luxid ® 
Annotation Server 
(1 node multi-core) 
AS AS AS AS AS AS AS AS 
AS AS AS AS AS AS AS AS 
AS AS AS AS AS AS AS AS 
Luxid® 
Big Data 
(10-100 Machines) 
Traitement 
Big Data 
Haute 
Disponibilité 
Flux 
Temps Réel 
Luxid® 
Annotation Farm 
(2-10 Machines) 
Annotation 
Server 
Multi-core 
Annotation 
Server 
Multi-core 
Annotation 
Server 
Multi-core 
Load 
Balancer
Démonstration 
Luxid Web Service 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 16
Luxid for OpenText CS10 (et 
Livelink 9.7…) 
Pourquoi imaginer une telle solution ?
Le contexte 
• Les sites ECM OpenText présentent souvent : 
• Une utilisation avancée des fonctionnalités documentaires et gestion de contenus (différents 
types d’espaces, métadonnées, formulaires, workflows, sécurité, types de contenus) 
• Une forte volumétrie 
• Un contexte international et donc des exigences en multilinguisme. 
• Malgré une fonction de recherche plutôt performante, on constate que les 
utilisateurs sont en fait souvent mécontents de la recherche proposée, et 
critiquent : 
• La pertinence des résultats 
• La présentation des résultats. 
• Comme il arrive souvent dans les projets ECM, des fonctionnalités intéressantes 
sont peu ou pas utilisées : 
• Par méconnaissance des utilisateurs et/ou du staff projet en charge de les déployer. 
• Par insuffisance dans la gestion du changement.
Le contexte 
• À cette situation déjà complexe viennent s’ajouter de nouvelles 
contraintes : 
• On ne demande plus au moteur de recherche de trouver des documents où 
l’utilisateur ira puiser de l’information 
• On demande au système d’extraire du sens dans un volume d’information croissant 
tellement vite que l’utilisateur ne peut plus passer son temps à analyser des documents 
sortis d’une liste de résultats 
• On attend du système qu’il soit capable de gérer plusieurs cibles en même 
temps pour nous aider dans la réflexion et la prise de décision 
• Et tout cela en quelques secondes sur des volumes en très forte croissance.
La réponse 
• La spécialisation sémantique du moteur Luxid de Temis va apporter 
des réponses à ces exigences. 
• Souvent perçue comme complexe et réservée à des spécialistes, 
l’approche sémantique reste encore rare dans les entreprises du 
monde industrie-commerce et services. 
• Grâce aux connecteurs qui relient le moteur d’enrichissement 
sémantique, il sera possible de venir compléter les solutions ECM en 
place, en capitalisant les efforts déjà réalisés.
Le connecteur Luxid pour 
OpenText 
Fonctionnalités et démonstration
Diagramme de Flux 
Luxid® pour OpenText 
Cartouches sémantiques 
(Skill Cartridge® ) 
Copyright © 2013 TEMIS - All Rights Reserved - Slide 22 
API du Moteur 
De 
recherche 
Index 
De 
de 
Recherche 
recherche 
Search-based Applications 
Recherche 
Analyse 
Visualisation 
Facettes 
Recommendations 
Insertion 
Indexation 
des métadonnées 
Extraction automatique 
des métadonnées 
Enrichissement des méta-données 
Enrichissement 
des interfaces 
Luxid® 
Annotation 
Factory
Le Connecteur - Les fonctionnalités 
• Le connecteur Luxid pour OpenText constitue la passerelle entre 
Content Server et Luxid, et permet d’enrichir le contenu sémantique 
des documents de manière automatique ou manuelle. 
• Les documents classés dans OpenText Content Server voient leur 
contenu enrichi par des métadonnées sous forme de catégories / 
attributs ou de classifications. 
• Le connecteur peut prendre en charge l’extraction du texte des 
documents avec ou sans OCR avant leur soumission au serveur Luxid.
Le Connecteur - L’architecture 
• Le connecteur Luxid pour OpenText est un middleware entre Content 
Server et le serveur Luxid et se présente sous la forme d’un service 
Windows. 
• Le gestionnaire de messages MSMQ est utilisé pour prendre en 
charge la gestion des demandes de jobs, ce qui permet d’offrir une 
bonne qualité de service : les demandes d’enrichissement ne sont pas 
perdues si l’un des 2 serveurs est arrêté. 
• Plusieurs connecteurs peuvent être répartis sur plusieurs serveurs, 
afin de répartir la charge dans le contexte de traitements importants.
Le Connecteur - Flux de données 
1 : Les documents sont stockés dans Content Server 
2 : Un message est envoyé au gestionnaire MSMQ pour mise en file d’attente de traitement 
3 : Le connecteur prend en charge le traitement, extrait éventuellement le texte des documents 
4 : Le document est envoyé au serveur Luxid pour enrichissement 
5 : Le serveur Luxid renvoie les métadonnées enrichies 
6 : Le connecteur met à jour les métadonnées dans Content Server sous forme de catégories / attributs ou de classifications 
7 : L’enrichissement sémantique est mis à disposition auprès utilisateurs grâce à l’interface standard de Content Server ( facettes, filtres de recherche, classifications, 
etc..)
Le Connecteur - Paramétrages 
Le paramétrage s’effectue dans le module pour Content Server, dans une page d’administration dédiée. 
On paramètre ainsi un ou plusieurs serveurs Luxid, en indiquant notamment l’URL du webservice Luxid. 
Ensuite on crée un ou plusieurs processeurs d’analyse, qui permettent de définir le mapping entre les entités Luxid et les catégories / classifications OpenText. 
Enfin on crée des Jobs pour l’execution automatique, ou des menus fonctions pour appeler un processeur d’analyse via l’interface utilisateur.
Le Connecteur – Interface utilisateur 
L’appel à l’enrichissement sémantique peut s’effectuer manuellement via l’interface utilisateur grâce à un menu fonction disponible sur les 
documents, et via un bouton « Enrich » pour le traitement des sélections multiples.
Le Connecteur – Interface utilisateur 
L’appel à l’enrichissement sémantique peut s’effectuer automatiquement. Dans l’exemple ci-dessus chaque fois qu’un document sera ajouté 
dans ce dossier ou un sous-dossier, il sera traité et enrichi automatiquement en utilisant le processeur d’analyse « Entities ».
Le témoignage de l’OCDE
PROJET 
D’ENRICHISSEMENT 
SÉMANTIQUE À 
L’OCDE 
Intégration Open Text Content Server - Luxid
Utilisation de Content Server à l’OCDE 
• Système de Records Management de notre unité 
Bibliothèque et Archives depuis 2009 
• Catalogue de publications OCDE et de 
ressources externes 
• 2 500 000 documents électroniques 
• Sur la période 2000-2014: 
+ de 150 000 documents officiels 
+ de 15 000 publications 
+ de 3 000 000 de pages
Retrouver l’information dans Content Server avec 
Luxid 
Amélioration de la recherche standard de Content 
Server par: 
• Des métadonnées homogènes 
• Un identifiant unique pour chaque concept 
permettant: 
de chercher dans toutes les langues 
simultanément 
de retrouver un concept malgré l’utilisation 
de synonymes et l’évolution du langage
Le connecteur développé par Red Tree Software 
• Définition de lots de documents à enrichir grâce 
à des LiveReport (requêtes sql) avec un certain 
plan d’annotation 
• Processus automatique et transparent 
• Résultats stockés en XML pour une recherche 
par URI 
• Amélioration de la recherche, résultats plus 
pertinents, plus complets
Mise en oeuvre – Phase I 
Phase I Phase II Phase III 
Fin 2013 Fin 2014
Mise en oeuvre – Phase II 
Phase I Phase II Phase III 
Fin 2013 Fin 2014
Mise en oeuvre – Phase III 
Phase I Phase II Phase III 
Fin 2013 Fin 2014
Développement 
des cartouches 
(AWB) 
Gestion des 
vocabulaires 
LUXID 
Content Server 
Architecture 
Enrichissement des vocabulaires Enrichissement de Content Server
Questions - Contacts 
 Par mail : 
 jm.touzard@camoai.com 
 philippe.deltenre@temis.com 
 pnocera@redtreesoftware.com 
 Par téléphone : +33 686 841 233 
 Linkedin : fr.linkedin.com/in/jmtouzard/ 
 Viadeo : http://www.viadeo.com/fr/profile/jean-marc.touzard
MERCI

Weitere ähnliche Inhalte

Andere mochten auch

My vmobile
My vmobileMy vmobile
My vmobileArc Ism
 
Crise durable et enjeux cruciaux
Crise durable et enjeux cruciauxCrise durable et enjeux cruciaux
Crise durable et enjeux cruciauxGroupe Apex Isast
 
Innovation sante-gerard-de-pouvourville-etude
Innovation sante-gerard-de-pouvourville-etudeInnovation sante-gerard-de-pouvourville-etude
Innovation sante-gerard-de-pouvourville-etudeAssociation LIR
 
Calendrier des Colloques, Formations, Conférences et séminaires au Maroc
Calendrier des Colloques, Formations, Conférences et séminaires au MarocCalendrier des Colloques, Formations, Conférences et séminaires au Maroc
Calendrier des Colloques, Formations, Conférences et séminaires au MarocAmine Chakir
 
Financer votre projet de startup - Le financement de l'innovation par BPI France
Financer votre projet de startup - Le financement de l'innovation par BPI FranceFinancer votre projet de startup - Le financement de l'innovation par BPI France
Financer votre projet de startup - Le financement de l'innovation par BPI FranceLa French Tech Rennes St Malo
 
Laurine Et Anais 1 Stand[1]
Laurine Et Anais 1   Stand[1]Laurine Et Anais 1   Stand[1]
Laurine Et Anais 1 Stand[1]guest359015
 
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinentMarina Aubert
 
Questionnaire
QuestionnaireQuestionnaire
Questionnairerlg 32
 
Liber chronicarum (La chronique de Nuremberg) - Inc55
Liber chronicarum (La chronique de Nuremberg) - Inc55Liber chronicarum (La chronique de Nuremberg) - Inc55
Liber chronicarum (La chronique de Nuremberg) - Inc55Carré d'Art bibliothèques
 
Camoai_accompagnement_management_projet
Camoai_accompagnement_management_projetCamoai_accompagnement_management_projet
Camoai_accompagnement_management_projetJean-Marc Touzard
 
Cross-Media @Tedx Rabat
Cross-Media @Tedx Rabat Cross-Media @Tedx Rabat
Cross-Media @Tedx Rabat Yasser Monkachi
 
Le Personal branding, outil essentiel pour promouvoir vos talents
Le Personal branding, outil essentiel pour promouvoir vos talents Le Personal branding, outil essentiel pour promouvoir vos talents
Le Personal branding, outil essentiel pour promouvoir vos talents Marina Aubert
 
Belles Decorations
Belles DecorationsBelles Decorations
Belles Decorationsguestf7a986f
 

Andere mochten auch (17)

My vmobile
My vmobileMy vmobile
My vmobile
 
Crise durable et enjeux cruciaux
Crise durable et enjeux cruciauxCrise durable et enjeux cruciaux
Crise durable et enjeux cruciaux
 
Résultas du sondage
Résultas du sondageRésultas du sondage
Résultas du sondage
 
Rafael martinez
Rafael martinezRafael martinez
Rafael martinez
 
Innovation sante-gerard-de-pouvourville-etude
Innovation sante-gerard-de-pouvourville-etudeInnovation sante-gerard-de-pouvourville-etude
Innovation sante-gerard-de-pouvourville-etude
 
Calendrier des Colloques, Formations, Conférences et séminaires au Maroc
Calendrier des Colloques, Formations, Conférences et séminaires au MarocCalendrier des Colloques, Formations, Conférences et séminaires au Maroc
Calendrier des Colloques, Formations, Conférences et séminaires au Maroc
 
Financer votre projet de startup - Le financement de l'innovation par BPI France
Financer votre projet de startup - Le financement de l'innovation par BPI FranceFinancer votre projet de startup - Le financement de l'innovation par BPI France
Financer votre projet de startup - Le financement de l'innovation par BPI France
 
Laurine Et Anais 1 Stand[1]
Laurine Et Anais 1   Stand[1]Laurine Et Anais 1   Stand[1]
Laurine Et Anais 1 Stand[1]
 
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent
201106 JW ACCORTise Barcamp Eghezée Contenu web pertinent
 
Questionnaire
QuestionnaireQuestionnaire
Questionnaire
 
Liber chronicarum (La chronique de Nuremberg) - Inc55
Liber chronicarum (La chronique de Nuremberg) - Inc55Liber chronicarum (La chronique de Nuremberg) - Inc55
Liber chronicarum (La chronique de Nuremberg) - Inc55
 
Camoai_accompagnement_management_projet
Camoai_accompagnement_management_projetCamoai_accompagnement_management_projet
Camoai_accompagnement_management_projet
 
POL4840 - H15 - Séance 1
POL4840 - H15 - Séance 1POL4840 - H15 - Séance 1
POL4840 - H15 - Séance 1
 
tcs et c2i2mi
tcs et c2i2mitcs et c2i2mi
tcs et c2i2mi
 
Cross-Media @Tedx Rabat
Cross-Media @Tedx Rabat Cross-Media @Tedx Rabat
Cross-Media @Tedx Rabat
 
Le Personal branding, outil essentiel pour promouvoir vos talents
Le Personal branding, outil essentiel pour promouvoir vos talents Le Personal branding, outil essentiel pour promouvoir vos talents
Le Personal branding, outil essentiel pour promouvoir vos talents
 
Belles Decorations
Belles DecorationsBelles Decorations
Belles Decorations
 

Ähnlich wie 2014 11-18-luxid-for-open text-pn

280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
280219 Webinar Reprenez le Contrôle de Vos Disques RéseauxEverteam
 
Architectures et application hybrides selon vos termes et à votre propre rythme
Architectures et application hybrides selon vos termes et à votre propre rythmeArchitectures et application hybrides selon vos termes et à votre propre rythme
Architectures et application hybrides selon vos termes et à votre propre rythmeMicrosoft
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Microsoft
 
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...Microsoft Décideurs IT
 
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureTartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureconfluent
 
Keynote change 2013
Keynote change 2013Keynote change 2013
Keynote change 2013rbschange
 
4_Architectures_de_SI.pdf
4_Architectures_de_SI.pdf4_Architectures_de_SI.pdf
4_Architectures_de_SI.pdfharizi riadh
 
Déploiement d’applications
Déploiement d’applicationsDéploiement d’applications
Déploiement d’applicationsMohammed Jaafar
 
Openday Enovance
Openday EnovanceOpenday Enovance
Openday EnovanceCore-Techs
 
Offre Enovance
Offre EnovanceOffre Enovance
Offre EnovanceCore-Techs
 
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18Vincent Biret
 
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...Modern Workplace Conference Paris
 
11 visual basic .net - acces aux donnees avec ado .net
11 visual basic .net - acces aux donnees avec ado .net11 visual basic .net - acces aux donnees avec ado .net
11 visual basic .net - acces aux donnees avec ado .netHamza SAID
 
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhv
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhvSOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhv
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhvamine17157
 
Cyxlm formation-xml-synthese (1)
Cyxlm formation-xml-synthese (1)Cyxlm formation-xml-synthese (1)
Cyxlm formation-xml-synthese (1)CERTyou Formation
 
Cyxlm formation-xml-synthese
Cyxlm formation-xml-syntheseCyxlm formation-xml-synthese
Cyxlm formation-xml-syntheseCERTyou Formation
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFBoubker ABERWAG
 
Exchange 2013 Dimensionnement et Performance
Exchange 2013 Dimensionnement et Performance Exchange 2013 Dimensionnement et Performance
Exchange 2013 Dimensionnement et Performance Microsoft Technet France
 

Ähnlich wie 2014 11-18-luxid-for-open text-pn (20)

280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
 
Architectures et application hybrides selon vos termes et à votre propre rythme
Architectures et application hybrides selon vos termes et à votre propre rythmeArchitectures et application hybrides selon vos termes et à votre propre rythme
Architectures et application hybrides selon vos termes et à votre propre rythme
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1
 
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...
Découvrez comment l’ECM peut concrètement « BOOSTER » votre entreprise à trav...
 
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architectureTartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
Tartine - Pixelle, Refonte de l’ingestion et présentation de l’architecture
 
Keynote change 2013
Keynote change 2013Keynote change 2013
Keynote change 2013
 
4_Architectures_de_SI.pdf
4_Architectures_de_SI.pdf4_Architectures_de_SI.pdf
4_Architectures_de_SI.pdf
 
Déploiement d’applications
Déploiement d’applicationsDéploiement d’applications
Déploiement d’applications
 
Openday Enovance
Openday EnovanceOpenday Enovance
Openday Enovance
 
Offre Enovance
Offre EnovanceOffre Enovance
Offre Enovance
 
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18
Introduction au #MicrosoftGraph demarrez vite et livrez rapidemment #MWCP18
 
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...
2018-10-17 J1 7D - Introduction au Microsoft Graph démarrez vite et livrez ra...
 
Base donnes my_sql
Base donnes my_sqlBase donnes my_sql
Base donnes my_sql
 
11 visual basic .net - acces aux donnees avec ado .net
11 visual basic .net - acces aux donnees avec ado .net11 visual basic .net - acces aux donnees avec ado .net
11 visual basic .net - acces aux donnees avec ado .net
 
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhv
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhvSOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhv
SOA-Partie 2.pdf hvjhvhjvkhvhjvhvhvjhvkhv
 
Cyxlm formation-xml-synthese (1)
Cyxlm formation-xml-synthese (1)Cyxlm formation-xml-synthese (1)
Cyxlm formation-xml-synthese (1)
 
Cyxlm formation-xml-synthese
Cyxlm formation-xml-syntheseCyxlm formation-xml-synthese
Cyxlm formation-xml-synthese
 
my_resume(fre)
my_resume(fre)my_resume(fre)
my_resume(fre)
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPF
 
Exchange 2013 Dimensionnement et Performance
Exchange 2013 Dimensionnement et Performance Exchange 2013 Dimensionnement et Performance
Exchange 2013 Dimensionnement et Performance
 

Mehr von Jean-Marc Touzard

2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign
2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign
2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusignJean-Marc Touzard
 
2016 12-02-digital-workplace-camoai-aos-lille
2016 12-02-digital-workplace-camoai-aos-lille2016 12-02-digital-workplace-camoai-aos-lille
2016 12-02-digital-workplace-camoai-aos-lilleJean-Marc Touzard
 
2015 06-objets connectes-bouygues_tel_salto_retail_innovation
2015 06-objets connectes-bouygues_tel_salto_retail_innovation2015 06-objets connectes-bouygues_tel_salto_retail_innovation
2015 06-objets connectes-bouygues_tel_salto_retail_innovationJean-Marc Touzard
 
2015 04-09-camoai-temis-big-data-textuelles
2015 04-09-camoai-temis-big-data-textuelles2015 04-09-camoai-temis-big-data-textuelles
2015 04-09-camoai-temis-big-data-textuellesJean-Marc Touzard
 
2015 01-camoai transformation-numerique_groupe_offre
2015 01-camoai transformation-numerique_groupe_offre2015 01-camoai transformation-numerique_groupe_offre
2015 01-camoai transformation-numerique_groupe_offreJean-Marc Touzard
 
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshareJean-Marc Touzard
 
2014 03-transformation-numérique-approche
2014 03-transformation-numérique-approche2014 03-transformation-numérique-approche
2014 03-transformation-numérique-approcheJean-Marc Touzard
 

Mehr von Jean-Marc Touzard (7)

2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign
2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign
2017 06-15-camoai-webinaire-demat-processus-rh-avec-nintex-et-docusign
 
2016 12-02-digital-workplace-camoai-aos-lille
2016 12-02-digital-workplace-camoai-aos-lille2016 12-02-digital-workplace-camoai-aos-lille
2016 12-02-digital-workplace-camoai-aos-lille
 
2015 06-objets connectes-bouygues_tel_salto_retail_innovation
2015 06-objets connectes-bouygues_tel_salto_retail_innovation2015 06-objets connectes-bouygues_tel_salto_retail_innovation
2015 06-objets connectes-bouygues_tel_salto_retail_innovation
 
2015 04-09-camoai-temis-big-data-textuelles
2015 04-09-camoai-temis-big-data-textuelles2015 04-09-camoai-temis-big-data-textuelles
2015 04-09-camoai-temis-big-data-textuelles
 
2015 01-camoai transformation-numerique_groupe_offre
2015 01-camoai transformation-numerique_groupe_offre2015 01-camoai transformation-numerique_groupe_offre
2015 01-camoai transformation-numerique_groupe_offre
 
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
 
2014 03-transformation-numérique-approche
2014 03-transformation-numérique-approche2014 03-transformation-numérique-approche
2014 03-transformation-numérique-approche
 

2014 11-18-luxid-for-open text-pn

  • 1. Capitalisez vos contenus Content Server Paris le 18 Novembre 2014 Philippe Deltenre – Temis Pierre Nocera – Red Tree Software Jean-Marc Touzard – Camoai
  • 2. Agenda • 15’ : Présentation des acteurs et genèse de la solution • 30’ : Notions d'enrichissement sémantique • 30’ : Présentation de la solution Luxid® for OpenText • 30’ : Témoignage de l’OCDE • 30’ : Questions ⁄ Réponses
  • 3. • Éditeur spécialisé dans les modules complémentaires à la suite Content Server : • Expertise documentaire • Forte valeur ajoutée • Centré sur les besoins de l’utilisateur. • Red Tree Software est distribué en France et à l’étranger par un réseau de partenaires.
  • 4. • Accélérateur de Transformation Numérique Camoai propose à ses clients conseil opérationnel et accompagnement : • Projets Xnet, collaboratif, socialisation • Projets ECM • Projets BPM • Projets de mobilité et entreprise étendue. • Les solutions Content Server et SharePoint sont au coeur de ces offres, et Temis un partenaire naturel pour accompagner nos clients dans leurs projets ECM et Big Data.
  • 5. Pionnier de l’Enrichissement de Contenu depuis 2000 70 Copyright © 2013 TEMIS - All Rights Reserved - Slide 5
  • 6. Références clé Copyright © 2013 TEMIS - All Rights Reserved - Slide 6
  • 7. Structurer les contenus non structurés pour mieux les gérer et mieux les valoriser Copyright © 2013 TEMIS - All Rights Reserved - Slide 7
  • 8. Notions d’enrichissement sémantique Copyright © 2013 TEMIS - All Rights Reserved - Slide 8
  • 9. - Flux de traitement sémantique WSeu rje. portV ar b5.2 year-old mPaanti epnretsenting an acVuteer bheair loss induScyemd bpytô cmarebamazepineV (eCrBbZe) in concentraMtioédn iocaf m8.e6n mt icrog/ml. Dosage Identification des relations WSuej. repoVrtr ba. 52 year-oldP mataienn ptresenting an aVceurtbee hair loss indSuycmedp tbôym cearbamazepinVee r(bCeBZ) in concentMraétidoinca omf e8n.6t microg/ml. Dosage 2 Identification des entités 1 Analyse morpho-syntaxique We report a 52 year-old man presenting an acute hair loss induced by carbamazepine (CBZ) in concentration of 8.6 microg/ml. Copyright © 2013 TEMIS - All Rights Reserved - Slide 9 EFFET SECONDAIRE Symptôme Alopécie Cause Carbamazepine Dosage 8.6 mg/ml Patient 52 year-old male 3
  • 10. Quelles informations métier ? A vous de le décider…quelques exemples  Personnes • Clients, Collaborateurs, Rattachement à votre annuaire  Organisations • Filiales, Services, Fournisseurs, Compétiteurs, Partenaires  Références internes • Projet, contrat, client, zone géographique, marché, etc…  Noms de vos produits ou services • Taxonomie produit, accessoires, options, etc…  Terminologie et Catégories métier • Vocabulaires techniques • Catégories documentaires Copyright © 2013 TEMIS - All Rights Reserved - Slide 10
  • 11. La plate-forme logicielle Luxid Copyright © 2013 TEMIS - All Rights Reserved - Slide 11
  • 12. Content Enrichment Platform Annotation Factory Skill Cartridge® Library Content Enrichment Studio Copyright © 2013 TEMIS - All Rights Reserved - Slide 12 • Robustesse, Scalabilité, APIs, Web Services • 20 langues • Entités / Relations / Catégories / Thèmes … • Thésaurii, taxonomies, règles sémantique, statistiques, apprentissage (machine learning)
  • 13.  Moteurs d’extraction spécialisés • Focalisés sur vos “objets d’intérêt” • Entités, Relations, Thèmes, Opinions, etc  Modulaires & Puissants • Combinables dans un même plan de traitement • Large gamme de techniques d’extraction • 20 langues • Faciles à personnaliser avec Content Enrichment Studio Copyright © 2013 TEMIS - All Rights Reserved - Slide 13 Skill Cartridges® • Anglais • Français • Allemand • Flamand • Italien • Espagnol • Portugais • Tchèque • Russe • Hongrois • Polonais • Grec • Suédois • Danois • Norvégien • Finlandais • Chinois • Japonais • Coréen • Arabe Skill Cartridge 1 Morpho Syntaxique Skill Cartridge 2 Thesaurus Skill Cartridge 3 Statistique Skill Cartridge n Machine Learning
  • 14. XelDA Admin Annotation Plan Document 200+ formats XML, HTML, txt, doc, pdf, … Web Services SOAP-REST / Modèle de données unique Ressources d’annotation unifiées (Skill Cartridge®) Copyright © 2013 TEMIS - All Rights Reserved - Slide 14 REST API SC1 SC2 SCn Document Annoté XML / JSON / RDF Enterprise Search Extraction d’information robuste
  • 15. AS AS AS AS AS AS AS AS • Utilisation CPU élevée dans toutes configurations • Déploiement en un clic dans le Cloud • Conçu pour les Big Data (Hadoop) Copyright © 2013 TEMIS - All Rights Reserved - Slide 15 Montée en charge / Cloud Annotation Server Multi-core Luxid ® Annotation Server (1 node multi-core) AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS AS Luxid® Big Data (10-100 Machines) Traitement Big Data Haute Disponibilité Flux Temps Réel Luxid® Annotation Farm (2-10 Machines) Annotation Server Multi-core Annotation Server Multi-core Annotation Server Multi-core Load Balancer
  • 16. Démonstration Luxid Web Service Copyright © 2013 TEMIS - All Rights Reserved - Slide 16
  • 17. Luxid for OpenText CS10 (et Livelink 9.7…) Pourquoi imaginer une telle solution ?
  • 18. Le contexte • Les sites ECM OpenText présentent souvent : • Une utilisation avancée des fonctionnalités documentaires et gestion de contenus (différents types d’espaces, métadonnées, formulaires, workflows, sécurité, types de contenus) • Une forte volumétrie • Un contexte international et donc des exigences en multilinguisme. • Malgré une fonction de recherche plutôt performante, on constate que les utilisateurs sont en fait souvent mécontents de la recherche proposée, et critiquent : • La pertinence des résultats • La présentation des résultats. • Comme il arrive souvent dans les projets ECM, des fonctionnalités intéressantes sont peu ou pas utilisées : • Par méconnaissance des utilisateurs et/ou du staff projet en charge de les déployer. • Par insuffisance dans la gestion du changement.
  • 19. Le contexte • À cette situation déjà complexe viennent s’ajouter de nouvelles contraintes : • On ne demande plus au moteur de recherche de trouver des documents où l’utilisateur ira puiser de l’information • On demande au système d’extraire du sens dans un volume d’information croissant tellement vite que l’utilisateur ne peut plus passer son temps à analyser des documents sortis d’une liste de résultats • On attend du système qu’il soit capable de gérer plusieurs cibles en même temps pour nous aider dans la réflexion et la prise de décision • Et tout cela en quelques secondes sur des volumes en très forte croissance.
  • 20. La réponse • La spécialisation sémantique du moteur Luxid de Temis va apporter des réponses à ces exigences. • Souvent perçue comme complexe et réservée à des spécialistes, l’approche sémantique reste encore rare dans les entreprises du monde industrie-commerce et services. • Grâce aux connecteurs qui relient le moteur d’enrichissement sémantique, il sera possible de venir compléter les solutions ECM en place, en capitalisant les efforts déjà réalisés.
  • 21. Le connecteur Luxid pour OpenText Fonctionnalités et démonstration
  • 22. Diagramme de Flux Luxid® pour OpenText Cartouches sémantiques (Skill Cartridge® ) Copyright © 2013 TEMIS - All Rights Reserved - Slide 22 API du Moteur De recherche Index De de Recherche recherche Search-based Applications Recherche Analyse Visualisation Facettes Recommendations Insertion Indexation des métadonnées Extraction automatique des métadonnées Enrichissement des méta-données Enrichissement des interfaces Luxid® Annotation Factory
  • 23. Le Connecteur - Les fonctionnalités • Le connecteur Luxid pour OpenText constitue la passerelle entre Content Server et Luxid, et permet d’enrichir le contenu sémantique des documents de manière automatique ou manuelle. • Les documents classés dans OpenText Content Server voient leur contenu enrichi par des métadonnées sous forme de catégories / attributs ou de classifications. • Le connecteur peut prendre en charge l’extraction du texte des documents avec ou sans OCR avant leur soumission au serveur Luxid.
  • 24. Le Connecteur - L’architecture • Le connecteur Luxid pour OpenText est un middleware entre Content Server et le serveur Luxid et se présente sous la forme d’un service Windows. • Le gestionnaire de messages MSMQ est utilisé pour prendre en charge la gestion des demandes de jobs, ce qui permet d’offrir une bonne qualité de service : les demandes d’enrichissement ne sont pas perdues si l’un des 2 serveurs est arrêté. • Plusieurs connecteurs peuvent être répartis sur plusieurs serveurs, afin de répartir la charge dans le contexte de traitements importants.
  • 25. Le Connecteur - Flux de données 1 : Les documents sont stockés dans Content Server 2 : Un message est envoyé au gestionnaire MSMQ pour mise en file d’attente de traitement 3 : Le connecteur prend en charge le traitement, extrait éventuellement le texte des documents 4 : Le document est envoyé au serveur Luxid pour enrichissement 5 : Le serveur Luxid renvoie les métadonnées enrichies 6 : Le connecteur met à jour les métadonnées dans Content Server sous forme de catégories / attributs ou de classifications 7 : L’enrichissement sémantique est mis à disposition auprès utilisateurs grâce à l’interface standard de Content Server ( facettes, filtres de recherche, classifications, etc..)
  • 26. Le Connecteur - Paramétrages Le paramétrage s’effectue dans le module pour Content Server, dans une page d’administration dédiée. On paramètre ainsi un ou plusieurs serveurs Luxid, en indiquant notamment l’URL du webservice Luxid. Ensuite on crée un ou plusieurs processeurs d’analyse, qui permettent de définir le mapping entre les entités Luxid et les catégories / classifications OpenText. Enfin on crée des Jobs pour l’execution automatique, ou des menus fonctions pour appeler un processeur d’analyse via l’interface utilisateur.
  • 27. Le Connecteur – Interface utilisateur L’appel à l’enrichissement sémantique peut s’effectuer manuellement via l’interface utilisateur grâce à un menu fonction disponible sur les documents, et via un bouton « Enrich » pour le traitement des sélections multiples.
  • 28. Le Connecteur – Interface utilisateur L’appel à l’enrichissement sémantique peut s’effectuer automatiquement. Dans l’exemple ci-dessus chaque fois qu’un document sera ajouté dans ce dossier ou un sous-dossier, il sera traité et enrichi automatiquement en utilisant le processeur d’analyse « Entities ».
  • 29. Le témoignage de l’OCDE
  • 30. PROJET D’ENRICHISSEMENT SÉMANTIQUE À L’OCDE Intégration Open Text Content Server - Luxid
  • 31. Utilisation de Content Server à l’OCDE • Système de Records Management de notre unité Bibliothèque et Archives depuis 2009 • Catalogue de publications OCDE et de ressources externes • 2 500 000 documents électroniques • Sur la période 2000-2014: + de 150 000 documents officiels + de 15 000 publications + de 3 000 000 de pages
  • 32. Retrouver l’information dans Content Server avec Luxid Amélioration de la recherche standard de Content Server par: • Des métadonnées homogènes • Un identifiant unique pour chaque concept permettant: de chercher dans toutes les langues simultanément de retrouver un concept malgré l’utilisation de synonymes et l’évolution du langage
  • 33. Le connecteur développé par Red Tree Software • Définition de lots de documents à enrichir grâce à des LiveReport (requêtes sql) avec un certain plan d’annotation • Processus automatique et transparent • Résultats stockés en XML pour une recherche par URI • Amélioration de la recherche, résultats plus pertinents, plus complets
  • 34. Mise en oeuvre – Phase I Phase I Phase II Phase III Fin 2013 Fin 2014
  • 35. Mise en oeuvre – Phase II Phase I Phase II Phase III Fin 2013 Fin 2014
  • 36. Mise en oeuvre – Phase III Phase I Phase II Phase III Fin 2013 Fin 2014
  • 37. Développement des cartouches (AWB) Gestion des vocabulaires LUXID Content Server Architecture Enrichissement des vocabulaires Enrichissement de Content Server
  • 38. Questions - Contacts  Par mail :  jm.touzard@camoai.com  philippe.deltenre@temis.com  pnocera@redtreesoftware.com  Par téléphone : +33 686 841 233  Linkedin : fr.linkedin.com/in/jmtouzard/  Viadeo : http://www.viadeo.com/fr/profile/jean-marc.touzard
  • 39. MERCI

Hinweis der Redaktion

  1. Quelques chiffres sur l’utilisation de Content Server Période 2000-2014, premier lot concerné par l’enrichissement
  2. L’indexation standard dans Content Server = plein-texte + métadonnées (catégories/attributs, RM, etc) La meilleure recherche ne peut que combiner ces 2 types d’information, d’autre part: Les métadonnées saisies par des humains sont possiblement partiales, inconsistantes privilégier un terme plutôt qu’un autre peut varier selon la personne, l’humeur, etc. Les termes évoluent, pas les métadonnées stockées Une métadonnée si elle n’est qu’une chaine de caractère n’évolue plus (nécessité de stocker un concept avec un identifiant unique) Le terme recherché n’est pas forcément présent dans le document (synonymes, langues différentes)
  3. Processus parallèles et nécessitant des allers-retours Mise à jour des vocabulaires et développement des 2 principales cartouches Classification (Extraction de Sujets et d’Aires Géographiques (issus de notre taxonomie centrale) Document Type (Catégorisation par type de documents) Corpus de 165 000 documents et publications (3 000 000 de pages) identifiés pour le passage en production Temps de traitement évalué: moins de 9 jours (24/24)
  4. Enrichissement en production des 165 000 documents et publications Mise en place des processus d’enrichissement automatique pour les nouveaux documents Extension du périmètre des contenus à enrichir dans Content Server
  5. Mise à disposition des webservices Temis pour d’autres systèmes Exploitation des liens sémantiques
  6. Architecture très schématisée L’enrichissement des vocabulaires n’est pas automatique: processus de veille, les cartouches nous aident à identifier les termes candidats