Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Presentation 04 03 08 Nicolas Flavier
1. Les syst`mes de questions-r´ponses
e e
Int´gration de connaissances
e
Travail ` venir
a
Int´gration de connaissances au sein d’un Syst`me
e e
de Questions-R´ponses en Chimie Organique
e
Nicolas Flavier
Laboratoire d’Informatique d’Avignon
Universit´ d’Avignon et des Pays du Vaucluse
e
-
Laboratoire de Chimie Organique de Synth`se
e
Facult´s Universitaires Notre-Dame de la Paix Namur
e
4 mars 2008
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 1/16
2. Les syst`mes de questions-r´ponses
e e
Int´gration de connaissances
e
Travail ` venir
a
Plan
Les syst`mes de questions-r´ponses
e e
1
Int´gration de connaissances
e
2
Travail ` venir
a
3
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 2/16
3. Les syst`mes de questions-r´ponses
e e D´finition
e
Int´gration de connaissances
e Principe de fonctionnement
Travail ` venir
a Evaluation
Les Syst`mes de Questions-R´ponses
e e
= moteurs de recherche documentaire
Question pr´cise en langue naturelle
e
ex. : Quelle est l’´quipe qui a marqu´ le plus de buts pendant
e e
la coupe du monde ? au lieu de ´quipe buts coupe monde.
e
R´ponse (ou liste de r´ponses candidates)
e e
Campagnes d’´valuation
e
1
TREC (Question Answering track)
EQUER
NTCIR
CLEF
1
VOORHEES E. M., « Overview of the TREC-9 Question Answering Track.
», TREC, 2000.
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 3/16
4. Les syst`mes de questions-r´ponses
e e D´finition
e
Int´gration de connaissances
e Principe de fonctionnement
Travail ` venir
a Evaluation
Principe d’un syst`me de questions-r´ponses
e e
corpus
↓
documents pertinents
↓
passages pertinents
↓
r´ponses candidates
e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 4/16
5. Les syst`mes de questions-r´ponses
e e D´finition
e
Int´gration de connaissances
e Principe de fonctionnement
Travail ` venir
a Evaluation
S´lection de passages
e
Pour chaque mot de la question trouv´ dans un document, on
e
calcule la densit´ d’´l´ments caract´ristiques autour de celui-ci :
e ee e
autres mots de la question
mots de la question ´tendue (synonymes, hyperonymes, etc.)
e
mots de la mˆme classe que des mots de la question
e
On choisit ensuite les passages autour d’´l´ments de forte densit´.
ee e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 5/16
6. Les syst`mes de questions-r´ponses
e e D´finition
e
Int´gration de connaissances
e Principe de fonctionnement
Travail ` venir
a Evaluation
Extraction de r´ponses
e
d´terminer le type de la question
e
chercher dans les passages retenus une entit´ nomm´e
e e
correspondant au type de r´ponse attendu
e
autour de ces entit´s, on calcule un score de compacit´ des
e e
mots de la question
On s´lectionne ensuite les entit´s qui poss`dent la plus forte
e e e
compacit´.
e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 6/16
7. Les syst`mes de questions-r´ponses
e e D´finition
e
Int´gration de connaissances
e Principe de fonctionnement
Travail ` venir
a Evaluation
Evaluation
2 principales mesures :
Rappel
nb de docs pertinents retournes
R=
nb de docs pertinents
→ s’am´liore en retournant plus de documents (g´n´ralisation,
e ee
extension de la requˆte, etc.) mais augmente le bruit
e
Pr´cision
e
nb de docs pertinents retournes
P=
nb de docs retournes
→ am´lioration : analyse et traitement de la question plus fins
e
Il faut trouver le meilleur compromis entre les deux.
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 7/16
8. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
Les syst`mes de questions-r´ponses
e e
1
Int´gration de connaissances
e
2
Int´rˆt et modalit´s
ee e
Probl`mes
e
Base terminologique
S´lection de passages
e
Travail ` venir
a
3
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 8/16
9. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
Int´gration de connaissances
e
principal objectif : am´liorer le rappel ;
e
extension de la question (ajout de synonymes, d’hyp´ronymes,
e
etc.) ;
indexation conceptuelle.
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 9/16
10. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
Probl`mes de cette approche
e
→ elle n´cessite des ressources :
e
ontologie (requiert des experts/linguistes) ;
liste de termes sp´cialis´ du domaine ;
e e
dictionnaire de synonymes ;
bases de donn´es chimiques (formules, r´actions, etc.)
e e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 10/16
11. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
Base terminologique (glossaire)
caract´ristiques
e
¯ ≈ 6500 termes
¯ possibilit´ d’entrer d´finitions, ´quivalents, contexte, classes
e e e
s´mantiques
e
¯ multi-utilisateur, possibilit´ pour chacun de valider les termes
e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 11/16
12. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
S´lection de passages : r´sultats de l’approche g´n´rale
e e ee
¯ pond´ration = des mots de chimie
e
¯ pas encore de r´sultats chiffr´s
e e
¯ exemple de r´sultats :
e
What is the heat of hydrogenation of benzene ?
thus it is possible to calculate such quantities as the heat of combustion or heat
of hydrogenation of cyclohexatriene by assuming that it is a compound with no
interaction between the conjugated double bonds for example a very simple
calculation of the heat of hydrogenation for cyclohexatriene would be to multiply
the heat of hydrogenation of cyclohexene by 3 i e 3 x 28 6 = 85 8 kcal/mol
3 x 28 6 = 85 8 kcal/mol the actual heat of hydrogenation of benzene is 49 8
kcal/mol suggesting a total stabilization or delocalization energy of 36 0
kcal/mol there are other more elaborate ways of approximating the
thermodynamic properties of the hypothetical cyclohexatriene
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 12/16
13. Int´rˆt et modalit´s
ee e
Les syst`mes de questions-r´ponses
e e
Probl`mes
e
Int´gration de connaissances
e
Base terminologique
Travail ` venir
a
S´lection de passages
e
Approche conceptuelle
extension de questions avec les concepts issus de l’ontologie
indexation conceptuelle
¯ manque une v´ritable ontologie
e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 13/16
14. Les syst`mes de questions-r´ponses
e e
Int´gration de connaissances
e
Travail ` venir
a
Travail ` venir
a
impl´menter l’approche conceptuelle dans la recherche de
e
passages
affiner les pond´rations
e
extraction de r´ponses
e
¯ utilisant aussi des connaissances
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 14/16
15. Les syst`mes de questions-r´ponses
e e
Int´gration de connaissances
e
Travail ` venir
a
Extraction de r´ponses
e
¯ n´cessite un corpus annot´
e e
¯ annotation automatique
¯ apprentissage : grande quantit´ de texte annot´
e e
¯ r`gles : lourd ` mettre en oeuvre, requiert des experts
e a
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 15/16
16. Les syst`mes de questions-r´ponses
e e
Int´gration de connaissances
e
Travail ` venir
a
Et enfin....
Int´gration au sein d’une ”plate-forme” EnCOrE, coupl´ au
e e
syst`me de r´sum´ automatique : en fonction de la question pos´e
e e e e
par l’utilisateur, un r´ponse courte lui sera fournie ou un r´sum´ lui
e e e
sera propos´.e
Nicolas Flavier (LIA - Universit´ d’Avignon)
e Connaissances dans un SQR sp´cialis´ en CO
e e 16/16