Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

Webinar : Les enjeux du moteur de recherche

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Nächste SlideShare
Solution de recherche Drupal
Solution de recherche Drupal
Wird geladen in …3
×

Hier ansehen

1 von 32 Anzeige

Webinar : Les enjeux du moteur de recherche

Herunterladen, um offline zu lesen

"Un moteur de recherche, ça trouve !!"

Oui, certes, mais combien sont les internautes qui se plaignent de passer un temps infini à chercher le bon contenu, ou abandonnent, faute d'avoir trouvé chaussure à leur pied !

Les moteurs de recherche sont aujourd'hui l'une des pierres angulaires d'une UX (expérience utilisateur) réussie. Il est vital d'identifier ce qu'un moteur de recherche peut faire, doit faire et sait faire :
- Quelles données indexer et comment ?
- Comment rendre mes données intelligentes ?
- Quelles aides à la recherche proposer ?
- Comment garantir des résultats fiables et pertinents ?
- Comment faire rentrer mon site dans l'ère du Web sémantique ?

Lors de ce webinar, découvrez comment faire de votre moteur de recherche la "killer app" de votre site Web !

Conférence animée par : Marine SOROKO (Directrice associée, Core-Techs)

"Un moteur de recherche, ça trouve !!"

Oui, certes, mais combien sont les internautes qui se plaignent de passer un temps infini à chercher le bon contenu, ou abandonnent, faute d'avoir trouvé chaussure à leur pied !

Les moteurs de recherche sont aujourd'hui l'une des pierres angulaires d'une UX (expérience utilisateur) réussie. Il est vital d'identifier ce qu'un moteur de recherche peut faire, doit faire et sait faire :
- Quelles données indexer et comment ?
- Comment rendre mes données intelligentes ?
- Quelles aides à la recherche proposer ?
- Comment garantir des résultats fiables et pertinents ?
- Comment faire rentrer mon site dans l'ère du Web sémantique ?

Lors de ce webinar, découvrez comment faire de votre moteur de recherche la "killer app" de votre site Web !

Conférence animée par : Marine SOROKO (Directrice associée, Core-Techs)

Anzeige
Anzeige

Weitere Verwandte Inhalte

Diashows für Sie (20)

Ähnlich wie Webinar : Les enjeux du moteur de recherche (20)

Anzeige

Weitere von Core-Techs (20)

Aktuellste (20)

Anzeige

Webinar : Les enjeux du moteur de recherche

  1. 1. 1 Les enjeux du moteur de recherche de votre site Web
  2. 2. 2 Core-Techs – Nos métiers Formation & coaching ConseilIntégration, développement, expertise technique Web et UX design
  3. 3. 3 Les solutions de search intégrées
  4. 4. 4 Aujourd’hui les internautes veulent :
  5. 5. 5 Et souvent, pour trouver quelque chose sur votre site, ils utilisent ça : Google a ses limites dans bien des cas. Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le contexte du site Internet ou selon les besoins des utilisateurs. Il a une présentation générique pour tous les utilisateurs, sans prendre en compte les spécificités du site Web.
  6. 6. 6 OBESITE DE L’INFORMATION Nous faisons face à une croissance exponentielle des contenus sur le Web. Face cette obésité de l’information, nous sommes tous différents dans notre recherche d’information. Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les mêmes démarches, pas les mêmes habitudes. La pertinence n’est pas la même pour tout le monde. Un même résultat peut satisfaire une personne, mais pas l’autre.
  7. 7. 7 Visuel Big Data BIG DATA (données massives) Nous produisons un nombre incommensurable de données (personnelles, publiées sur le web ou non, …) . Toutes ces données sont stockées quelque part et tant qu’elles ne sont pas exploitées, elles ne servent à rien. Ici l’enjeu des moteurs de recherche est d’être capable d’analyser notre comportement sur le Web et ainsi d’identifier nos habitudes, nos besoins.
  8. 8. 8 HETEROGENEÏTE DES SOLUTIONS • Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv, document, …. • Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie, documents multi-médoa… Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la labéliser, la rechercher…
  9. 9. 9 BESOIN DE SENS Le travail principal du moteur est de donner du sens au contenu, au produit, aux dépendances entre les contenus; il va réduire le bruit, donner de la pertinence à une recherche, …
  10. 10. 10 UN MOTEUR CA FAIT QUOI ?
  11. 11. 11 Indexe Transforme Restitue Expose
  12. 12. 12 Bases de données, sites web, référentiels documentaires, fichiers, données structurées, non structurées, … Transforme Restitue Expose Un moteur indexe, c’est-à-dire qu’il est capable de récupérer des contenus quel que soit leur format de stockage.
  13. 13. 13 Indexe Alignement, structuration, pondération, dédoublonnage, scoring, matching, enrichissement, … Restitue Expose En indexant les données, le moteur va les transformer.
  14. 14. 14 Indexe Transforme Facettes, suggestions, auto- complétion, aides à la recherche, … Expose Il restitue le contenu. Il peut proposer des alternatives, suggestions ou encore analyser une requête.
  15. 15. 15 Indexe Transforme Restitue RDF, moissonnage, Sparql, open data, … Toutes les données doivent être capables de « parler » les unes aux autres. Le moteur doit donc enrichir ce qu’on appelle le web des données.
  16. 16. 16 16/12 Un bon moteur indexe tout type de contenu
  17. 17. 17 17/12 Un bon moteur propose différentes logiques d’autocomplétion
  18. 18. 18 18/12 • Facettes de valeurs • Facettes de date • Facette par arbre / pivot • Facette par intervalle • Facette par catégorie / type Un bon moteur gère des facettes variables
  19. 19. 19 19/12 Multilinguisme
  20. 20. 20 Un bon moteur optimise la pertinence Optimisations linguistiques • Racinisation • Synonymie • Stop words • Orthographe Optimisations statistiques • Scoring et pondération • Text mining • Proximité
  21. 21. 21 Un bon moteur suggère d’après le corpus
  22. 22. 22 Contextualisation des résultats
  23. 23. 23 Moteur de recommandations & cross-content
  24. 24. 24 Un outil de gestion de campagnes promotionnelles
  25. 25. 25 Recherche géospatiale
  26. 26. 26 Recherche multi- site, multi-source Le moteur de recherche est capable de parcourir toutes ces sources et de restituer les données via une seule interface.
  27. 27. 27 Optimisation des performances La capacité technique du moteur à monter en charge et à répondre au volume de consultation, de réponse.
  28. 28. 28 Un back-office de suivi statistique Utile afin de s’améliorer. On a accès au: • Nombre de requêtes, • Requêtes les plus fréquentes, • Requêtes n’ayant abouti à aucun résultat, • Temps moyen de réponse, • …
  29. 29. 29 Un outil d’alignement des données CAPTER TRANSFORMER ENRICHIR ANALYSER
  30. 30. 30 Un outil dédié au Web sémantique • Structuration RDF & URI • Mise à disposition de Sparql End Point • Intégration de thésaurus et d’ontologies • …
  31. 31. 31 Nos recommandations pour réussir un projet de search RECHERCHER LA SIMPLICITE ! Quels sont les besoins métiers ? Quels sont les contenus et leur structuration ? Quelles sont les attentes utilisateur ? Travailler sur une logique itérative avec des utilisateurs métier Suivre les statistiques de fonctionnement
  32. 32. 32

Hinweis der Redaktion

  • 1
  • 2
  • 3
  • Google est LE moteur de recherche de référence.
    Il est réputé pour son efficacité, sa rapidité, l’exhaustivité des résultats…

    C’est pourquoi lorsque l’on pose la question: « Que souhaitez-vous comme moteur de recherche ? »,
    la réponse est souvent « Google ».
  • On remarque très souvent que les utilisateurs préfèrent utiliser Google plutôt que le moteur de recherche interne du site Internet, celui-ci étant trop lent ou inefficace.

    Cette méthode de recherche fonctionne, mais Google a ses limites dans bien des cas.
    Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le contexte du site Internet ou selon les besoins des utilisateurs. En effet, il a une présentation générique pour tous les utilisateurs, sans prendre en compte les spécificités du site Web.
  • Aujourd’hui, nous sommes confrontés à une grande problématique: l’obésité de l’information.
    Nous faisons face à une croissance exponentielle des contenus sur le Web.

    Face cette obésité de l’information, nous sommes tous différents dans notre recherche d’information.

    Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les mêmes démarches, pas les mêmes habitudes.
    La pertinence n’est pas la même pour tout le monde. Un même résultat peut satisfaire une personne, mais pas l’autre.
  • A l’obésité de l’information s’ajoute ce qu’on appelle le Big Data (données massives).
    Tous les jours, nous produisons un nombre incommensurable de données (personnelles, publiées sur le web ou non, …).
    Toutes ces données sont stockées quelque part et tant qu’elles ne sont pas exploitées, elles ne servent à rien.

    Ici l’enjeu des moteurs de recherche est d’être capable d’analyser notre comportement sur le Web et ainsi d’identifier nos habitudes, nos besoins.
  • Hétérogénéité croissante des solutions:

    Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv, document, ….
    Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie, documents multi-médoa…

    Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la labéliser, la rechercher…
  • Toutes ces problématiques, nous montrent qu’aujourd’hui dans notre univers Web, on a besoin de sens.

    C’est le travail principal du moteur, il est censé donner du sens au contenu, au produit, aux dépendances entre les contenus; il va réduire le bruit, donner de la pertinence à une recherche, …
  • Un moteur a 4 principales fonctions:
    Il indexe,
    Il transforme,
    Il restitue,
    Il expose.
  • Un moteur indexe, c’est-à-dire qu’il est capable de récupérer des contenus quel que soit leur format de stockage (contenu sur des bases de données, des GED, des serveurs de fichiers, des données structurées, non structurées).
  • En indexant les données, le moteur va les transformer. Les données vont alors être :
    Structurées,
    Pondérées,
    Dédoublonnées,
    Matchées,
    Enrichies,
  • Un moteur de recherche est capable également de restituer le contenu. Il va proposer des résultats d’après des correspondances sémantiques, linguistiques, statistiques, mathématiques… Il peut proposer des alternatives, suggestions ou encore analyser une requête.
  • Dernières fonctions du moteur, l’exposition.
    Aujourd’hui dans notre monde connecté, toutes les données doivent être capables de « parler » les unes aux autres.
    Le moteur doit donc enrichir ce qu’on appelle le web des données.
  • Comme nous l’avons vu précédemment, un moteur de recherche doit pouvoir indexer des données quel que soit le format de stockage. Un bon moteur peut également indexer tout type de contenu.
  • Un bon moteur de recherche propose une/des logique(s) d’autocomplétion:
    Suggestion triée,
    Suggestion d’après les requêtes les plus fréquentes,
    Suggestion d’après une logique de racinisation,
    Suggestion d’après des expressions rattachées, rajouter des indications et des explications,
    Suggestion de termes surpondérés,
    Mise en avant de suggestions de recherche.

    La logique d’autocomplétion est définie par rapport aux besoins de l’internaute sur le site.

    Ce n’est pas toujours évident, chaque moteur est différent. Il faut faire attention à proposer un nombre restreint de résultats, à mettre en avant les différences par rapport au contenu saisi (mise en gras) ou encore montrer l’historique de recherche avant que l’utilisateur ne commence à taper une requête.

    Les meilleurs moteurs d’autocomplétion actuellement sont ceux des sites e-commerce (Amazon).
  • Là encore, lors du choix du moteur de recherche, il faut prêter attention à ce qu’est capable de faire le moteur. Tous les moteurs ne gèrent pas de la même manière les facettes.
  • Un bon moteur de recherche gère le multilinguisme (analyseurs de langues).
    Souvent les moteurs Open Source ont une longueur d’avance grâce à leur communauté.
  • Les optimisations linguistiques et statistiques sont à prendre en compte.

    Optimisations linguistiques (analyse de la langue):
    Racinisation (capacité du moteur à extraire la racine d’un terme et à diriger sa recherche à partir de cette racine),
    Synonymie (capacité du moteur à proposer des réponses avec le mot « auto » lorsqu’on a taper « voiture » par exemple),
    Stop words (capacité du moteur à éliminer les articles (le, la, les…)),
    Orthographe (capacité du moteur à gérer les fautes d’orthographe des utilisateurs).

    Optimisations statistiques:
    Scoring et pondération (Densité d’un mot par rapport à un document. Poids d’un mot en fonction de sa place dans le document)
    Text minding ou fouille de texte (on parle d’intelligence artificielle) = extrait des connaissances d’après l’analyse des contenus soumis au moteur. Text minding est beaucoup utilisé dans les moteurs de spam.
    Proximité (capacité du moteur à trouver la similarité entre 2 termes. Correspondance d’expression).
  • Grâce à l’analyse linguistique vu précédemment, le moteur de recherche va suggérer des mots-clés ou expressions.

    Exemple: on tape « recette gâteau framboise », le moteur va afficher les résultats et proposer des suggestions associées « recette glace framboise »…

    On peut gérer, personnaliser les réponses selon le corpus du texte ou selon le comportement des internautes.
  • Un bon moteur va mettre en avant la recherche et extraire la phrase recherchée (highlight).
  • Le moteur de recherche ne sert pas seulement à donner des résultats de recherche.
    Un moteur de recommandations va enrichir le « surf » de l’internaute. Il peut ainsi constituer les zones de rebond.

    Par exemple, vous êtes sur un article de réalité virtuelle, dans la colonne de gauche se trouvera des suggestions associées à votre recherche initiale sous forme de « pour en savoir plus », « pour approfondir »...
    Le moteur aura généré automatiquement des articles en fonction de l’analyse sémantique, lexical du contenu que vous êtes en train de lire.

    Lorsque l’on a un site avec beaucoup de contenu, un moteur de recommandations / cross-content est particulièrement intéressant. Cela permet de s’éviter un travail fastidieux de catégorisation.

    Il est également possible de gérer ces suggestions:
    proposer le contenu le plus pertinent, le plus récent…,
    adapter le contenu selon l’historique de recherche,
    proposer des contenus promotionnels (e-commerce),

  • Un bon moteur de recherche vous permet de gérer les campagnes promotionnelles.
    Cela est très utile pour les sites e-commerce, mais aussi pour les sites avec beaucoup de contenu.

    Dans l’exemple, ci-dessus, lorsque l’on tape « Samsung Galaxy S6 », le moteur a mis automatiquement en avant la bannière promotionnelle « Accessoires Samsung Galaxy S6 ».
    La Fnac a paramétré son moteur pour que celui-ci affiche cette bannière promotionnelle à chaque recherche de Galaxy S6.
    Cela permet de répondre au besoin de déstockage, d’orienter la navigation…
  • Un bon moteur peut faire une recherche géospatiale.
    Lorsque l’on entre une adresse, celle-ci va être géoréférencée (ou transformée en coordonnées) et être localisée sur une carte.

    Ce besoin de géolocalisation est un point essentiel depuis quelques années surtout pour les applications mobiles.
    Elle est utile pour les approximations (recherche de la station service la plus proche…).
  • Si on a un parc de plusieurs sites, un bon moteur de recherche est capable de parcourir toutes ces sources et de restituer les données via une seule interface.

    Le moteur fait donc le pont entre chacune des applications.
  • Un bon moteur est capable d’optimiser ses performances.

    Un moteur de recherche qui mettra trop de temps à donner un résultat à l’internaute fera perdre des visiteurs, des commandes…

    Il sera donc capable de gérer les temps d’indexation (à chaud, incrémentale), réindexation, d’optimiser les temps de réponse.

    Il faut prêter attention aux capacités technique du moteur à monter en charge et à répondre à mon volume de consultation, de réponse actuel.
  • Un bon moteur vous fournit un back-office de suivi statistique.

    Les back-office sont minimalistes dans les moteurs traditionnellement implantés.

    C’est pourtant utile afin de s’améliorer. On a accès au:
    Nombre de requêtes,
    Requêtes les plus fréquentes,
    Requêtes n’ayant abouti à aucun résultat,
    Temps moyen de réponse,


  • Comme vu précédemment, un moteur de recherche a beaucoup de fonctions.
    C’est aussi un outil d’alignement des données.

    Il permet de:
    Récupérer les données contenues dans les différents silos internes ou externes à votre organisation : XML, crawl web, serveurs de fichiers, entrepôts, GED, CMS, …

    Transformer ces données : nettoyage, normalisation, conversion vers un format cible ; validation, transformation, fusion, découpage, dédoublonage, normalisation de champs (numéros de tél, noms, codes, …) anonymisation, …

    Enrichir ces données en les catégorisant selon des plans de classement, en les annotant automatiquement et en les alignant avec des référentiels métier ; en les mettant en relation avec des données métiers par analyse sémantique

    Analyser et relier ces données afin de les mettre en synergie et de faire émerger l’information pertinente pour votre métier ;
  • Un bon moteur de recherche va être capable d’ouvrir vos données vers l’extérieur.
    C’est ce qu’on appelle le Web des données, le Web 3.0, le Web sémantique.

    Le moteur peut structurer les données pour les exposer dans un format universel (RDF).
    Les identifier avec une URI (adresse unique, non modifiable et pérenne dans le temps).
    Il va mettre à disposition ces données (Sparql End Point) et les catégoriser, classifier, afin de donner du sens à l’information.
  • Lorsqu’on se lance dans un projet de moteur de recherche, souvent les besoins initiaux sont mal exprimés, car on n’est pas connaisseur du domaine.

    Il faut se poser des questions :
    Quels sont les besoins métier ? (grand public ou recherche spécialisée),
    Quels sont les contenus et leur structuration ? (très structuré ou non ),
    Quelles sont les attentes des utilisateurs ? (besoin Google ou plus spécifique).

    Les suivis statistiques et les retours des utilisateurs permettent d’optimiser la pertinence du moteur de recherche.
  • 32

×