Dans le cadre de la Matinale Lingway, organisée le 9 Février avec notre partenaire image & dialogue consultants a eu la présentation d'une étude exclusive sur les thématiques et les tonalités qui circulent sur Internet à propos des médicaments mis sous surveillance par l'AFSSAPS.
Parmi les thèmes abordés:
- Comment se structure l'univers de la communication des produits pharmaceutiques sur Internet ?
- Comment classifier et quantifier automatiquement le discours des internautes sur les produits pharmaceutiques ?
- Peut-on analyser les différences de positionnement entre produits remboursés et non remboursés ?
- Comment les nouveaux outils peuvent-ils aider à planifier la communication des laboratoires ?
2. Thèmes de cette réunion
- Comment se structure l'univers de la communication des
produits pharmaceutiques sur Internet ?
- Comment classifier et quantifier automatiquement le
discours des internautes sur les produits pharmaceutiques ?
- Comment les nouveaux outils peuvent-ils aider à planifier la
communication des laboratoires ?
3. Notre présentation
Méthodes et outils: Bernard Normier et Cécile Potier, Lingway
Problématique
La plateforme LINGWAY e-REPUTATION
Exemples et démonstrations
Cas d’utilisation : Paul Séassal et Olivier Guerin image &
dialogue consultants
Les médicaments mis sous surveillance par l’ AFSSAPS, focus sur les
benzodiazépines
Les études réalisées par / pour nos clients ne pouvant être montrées pour des
raisons de confidentialité, cette étude de cas est réalisée par Lingway et I&D
Consultants à des fins de démonstration
4. > Qui sommes nous ?
Une société spécialisée sur l’analyse des données textuelles
Transformer une information non structurée en données utilisables par des logiciels
Une centaine de clients dans différents domaines
Les brevets, l’information scientifique et technique, les ressources humaines
AXA, Accor, Altran, Bull, La Poste, Manpower, etc.
Une offre e-Reputation lancée il y a un peu plus d’un an
Clients directs : Toyota, Ministère de la Culture, AXA, Union Latine, etc.
Agences: image & dialogue consultants, Occurrence, Touchvibes, LAWW etc .
Ce que nous ne sommes pas
Des spécialistes de l’industrie pharmaceutique (certains de nos clients le sont)
Des conseils en stratégie: notre rôle s’arrête au recueil et l’analyse des données
5. e-Réputation: un enjeu incontournable
Selon plusieurs études concordantes :
Les 3/4 des français sont des internautes
Les 3/4 des internautes consultent Internet avant d’acheter un
produit
La moitié des internautes consultent les avis des autres avant
de choisir un produit
6. Une idée simple
Il « suffit » d’ observer ce qui se dit sur Internet
pour avoir une perception de l’opinion des
consommateurs, électeurs, influenceurs,…
Cette information est gratuite et spontanée
Donc on pourrait passer progressivement d’un
modèle d’études basé sur les sondages à un
modèle basé sur l’observation d’Internet et des
réseaux sociaux
7. Mais une réalisation (très) complexe
Que faut-il surveiller ?
Qu’est-ce qu’un échantillon représentatif sur Internet ?
Comment analyser les contenus ?
Informations hétérogènes, non structurées, difficiles à identifier,
récupérer, trier, analyser
Faire « à la main » n’est plus possible
Ou alors on est obligé de réduire à quelques centaines ou milliers de
messages, non significatifs
Donc il faut analyser de très grands volumes d’information et
se faire aider par des logiciels
Notamment pour identifier des « signaux faibles »
8. Ce qui est possible avec Lingway e-Reputation
Où en parle t-on ?
Dans quels médias ? Quels réseaux sociaux ? Quel sites ?
Quels blogs ? Quels forums ?
De qui parle t-on ?
Quelles marques, produits, personnes, sociétés ?
De quels sujets ?
Quelles thématiques ? Quelle actualité ? Quelles offres ?
Qui parle ?
Quel internaute ? Quel bloggeur ? Quel journaliste ?
Quels jugements ?
Quels avis ? Quelles recommandations ? Quelles tonalités ?
9. Liste de sources
www.xxx.com…
Pages et
messages
non
structurés
MOTS CLES
Transformation en données structurées
personnes, lieux, marques, thèmes, tonalités,
avis, etc.
Analyseurs sémantiques
=
Logiciels + dictionnaires
Base de
données de
textes
enrichis et
structurés
12. Principes de la démonstration
Le logiciel propose de nombreuses possibilités de
paramétrage.
Pour cette démonstration:
• Sourcing
• La liste des 77 médicaments surveillés par l’Afssaps
• Une extension aux benzodiazépines et associés
• Pas de sourcing sur les noms de laboratoires, pathologies, etc.
• Twitter, Forums, blogs, presse en ligne
Focus sur les verbatims
• Un document est « découpé » en autant de passages que de citations de
médicaments
• Chaque commentaire constitue un document
• Chaque intervention dans un fil de discussion constitue un document
• >> objectif : une analyse fine au niveau de chaque médicament, une
appréciation de l’impact en fonction du nombre de citations
13. 1 – Où en parle t-on ?
(les sources)
Quels médias ?,
Quels réseaux sociaux ?
Quels sites ?
Quels blogs ?
Quels forums ? etc.
14. Nature des sources
Annuaire
Blog (généraliste , spécialisé) + commentaires
Media (généraliste , spécialisé)
Forum (généraliste , spécialisé) + fils de discussions
Organisation ou entreprise
Presse (nationale, régionale, spécialisée)
Réseaux sociaux (Twitter, facebook)
Sites d’avis ( Ciao, … )
Webzine (généraliste , spécialisé)
15. Domaines des sources
Automobile Loisirs
Business Mode
Divers Musique
Economie People
Finances Politique et Société
Environnement Santé
Hi-tech Sciences
16. Les reprises, la propagation de l’influence
Sur Twitter
Le RT ( re-tweets ) multiplient l’impact du tweet original
Dans cette étude, chaque RT compte autant que le tweet
original
C’est un paramétrage du système
Forums
La « longueur » d’une discussion est un indice de son impact
Chaque intervention est comptée
Blogs et sites de presse
Les commentaires sont un indice important de l’importance du
texte initial
20. 2 - De qui parle t-on ?
(les acteurs)
Quelles marques ,
quels médicaments ?
Quels laboratoires ?
etc…
21. L’identification des noms propres
Ou « entités nommées »
Grâce à des listes ( « thesaurus »)
De sociétés
De médicaments
De pathologies
Grâce à des règles contextuelles
Parce qu’on ne peut pas tout prévoir dans les listes
Le chiffre d’affaires de Blablabla SA a augmenté de…
Le pdg de la sociéré Blablabla a annoncé que…
24. 3 - De quels sujets parle t-on ?
(LES THEMES)
Sur des thèmes connus (grille d’analyse)
Sur des thèmes « découverts »
25. La grille d’analyse
Ou « plan de classement »
Organisée de façon hiérarchique
Chaque thématique est décrite par un ensemble de
termes qui deviennent des questions au moteur
sémantique
La mise à jour se fait en temps réél
Des alertes et des outils de diffusions peuvent être
associés.
26. Les thèmes découverts « à la volée »
Basé sur un extracteur de groupes nominaux
Permet d’identifier des thématiques émergentes
Les thèmes ainsi découverts peuvent être
recatégorisés dans des thématiques spécifiques à
l’application considérée.
Par ailleurs, le moteur sémantique permet de faire
des recherches sur n’importe quel thème nouveau
35. Le point fort de LeR = l’analyse linguistique des contenus
Un accès facilité aux données primaires
Tous les résultats sont vérifiables
Expansion sémantique multilingue basée sur
Des dictionnaires généraux et spécialisés très complets dans de
nombreuses langues
Extraction des entités nommées
Déjà connues ou découvertes par le système
Catégorisation automatique
Sur des thématiques connues ou découvertes par le système
Calcul automatique des tonalités
A la pointe de l’état de l’art
Mais aussi, toutes les fonctions standard pour gérer la veille
36. Niveaux de prestations
Accès à la plateforme
Mode SaaS
Paramétrage et support
Périmètre de la veille, mot-clés, filtrage, etc.
Veille externalisée
Rapports réguliers
Quotidiens, hebdomadaires, mensuels
37. Tarification
Accès à la plateforme
Abonnement 12.000 euros par an
Incréments
en fonction des volumes > 100.000 « remontées »
En fonction du nombre de langues suivies
En fonction du nombre d’utilisateurs
Services et support
Formation, paramétrage
Veille externalisée en fonction du périmètre à surveiller