SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
Quart d'heure académique du SéminDoc 06/05/2009
               LIRMM – Montpellier



       Estimation du nombre
      de citations de papillotes
      et de blagues Carambar

    Philippe Gambette (équipes MAB/AlGco)
Introduction

• Papillotes créées en 1790
- un billet doux pour enrober un chocolat, à l'origine
- depuis, rébus, dessins d'humour, citations




  papillotesrevillon.fr




• Carambars créés en 1954
                                                  http://fr.wikipedia.org/wiki/Carambar
- mélange accidentel de caramel et cacao
- devinettes et blagues sur l'emballage depuis 1969
Problématique

Combien de citations ou blagues différentes ?
• pour le fabricant :
- limiter les coûts de production → nombre fini
- satisfaire le consommateur
• pour le consommateur :
- frustration de retomber sur une blague déjà lue
- souci d'exhaustivité : combien en manger pour les lire
toutes ?
• pour le statisticien :
- estimer ce nombre n d'après un échantillon
Echantillonnage

• tirer un échantillon aléatoire de k papillotes
on suppose que les citations sont uniformément réparties
dans les sachets
• discrétiser les données
associer une citation à chaque papillote
• identifier les doublons                        choix de la citation la plus
                                                proche du centre du papier
associer un entier unique à chaque citation


Modélisation de l'échantillonnage :
tirer un mot aléatoire de k lettres, choisies parmi un
alphabet de n lettres.
Modélisation du problème
                             Sachant qu'il y a
                                                     un alphabet de n lettres
n papillotes différentes au total
                         quelle est la probabilité
                                                            d'avoir 40 lettres
de tirer 40 citations
                         différentes, exactement,
                                                 dans un mot de 52 lettres
parmi un échantillon de 52 papillotes
                                     ?



Modélisation du problème :
trouver la valeur de n qui maximise cette probabilité
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba
 aac aca acc caa cac cca
 bbc bcb bcc cbb cbc ccb
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba      on trouve les mots sur d=2 lettres
 aac aca acc caa cac cca      on en déduit les mots sur n lettres
 bbc bcb bcc cbb cbc ccb      par projection.
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba      on trouve les mots sur d=2 lettres
 aac aca acc caa cac cca      on en déduit les mots sur n lettres
                              par projection : ad,k(n) = ad,k(k) Cnd
 bbc bcb bcc cbb cbc ccb
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres nk


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 ad,k(n) = ad,k(k) Cnd
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
             ad,k(k) Cnd
 Pd,k(n) =
                 nk
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.     constante par rapport à n
             ad,k(k) Cnd
 Pd,k(n) =
                 nk
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                             Cnd
 argmaxn Pd,k(n) = argmaxn
                              nk
Résultats

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                                          Cnd
 argmaxn Pd,k(n) = argmaxn
                                           nk

 Pour les papillotes Révillon “Festives” pour k=52 et d=40 :
                                   n=93 ?
            P (n)
             d,k




                                                                                                             n
                   40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
Résultats

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                                                      Cnd
 argmaxn Pd,k(n) = argmaxn
                                                       nk

 Pour les papillotes Révillon “Festives” pour k=52 et d=40 :
                        n=93 ?         En fait, n=108,
 Pd,k(n)
                                       soit 14% d'erreur.



                                                                                                 n
       40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
Résultats

 Evolution du nombre de blagues Carambar “Caramel” estimé
 en fonction de la taille du tirage :

         45


         40
                                                                                                             valeur de n estimée
         35


         30

                                                                                                             nombre d de blagues
         25
                                                                                                             différentes trouvées
         20


         15


         10


          5


          0
                                                                                                       nombre k de
              10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

                                                                                                  carambars ouverts
Perspectives

 • étude de la précision de la méthode par simulations
 • formule directe pour la valeur de n estimée
 • utilisations d'autres caractéristiques du tirage pour une
 évaluation plus précise :
 - nombre de citations présentes deux fois
 - distribution des nombres d'apparition de citations
 - taille la plus longue d'une séquence de blagues consécutives

 • estimation plus précise du nombre de blagues Carambar
 • estimation du nombre de surprises Kinder


                                 ebay.fr




                                                   Bientôt sur http://gambette.blogspot.com

Weitere ähnliche Inhalte

Mehr von Philippe Gambette

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kPhilippe Gambette
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Philippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Mehr von Philippe Gambette (11)

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau k
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboré
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Kürzlich hochgeladen

Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 

Kürzlich hochgeladen (16)

Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 

Estimation du nombre de citations de papillotes et de blagues Carambar

  • 1. Quart d'heure académique du SéminDoc 06/05/2009 LIRMM – Montpellier Estimation du nombre de citations de papillotes et de blagues Carambar Philippe Gambette (équipes MAB/AlGco)
  • 2. Introduction • Papillotes créées en 1790 - un billet doux pour enrober un chocolat, à l'origine - depuis, rébus, dessins d'humour, citations papillotesrevillon.fr • Carambars créés en 1954 http://fr.wikipedia.org/wiki/Carambar - mélange accidentel de caramel et cacao - devinettes et blagues sur l'emballage depuis 1969
  • 3. Problématique Combien de citations ou blagues différentes ? • pour le fabricant : - limiter les coûts de production → nombre fini - satisfaire le consommateur • pour le consommateur : - frustration de retomber sur une blague déjà lue - souci d'exhaustivité : combien en manger pour les lire toutes ? • pour le statisticien : - estimer ce nombre n d'après un échantillon
  • 4. Echantillonnage • tirer un échantillon aléatoire de k papillotes on suppose que les citations sont uniformément réparties dans les sachets • discrétiser les données associer une citation à chaque papillote • identifier les doublons choix de la citation la plus proche du centre du papier associer un entier unique à chaque citation Modélisation de l'échantillonnage : tirer un mot aléatoire de k lettres, choisies parmi un alphabet de n lettres.
  • 5. Modélisation du problème Sachant qu'il y a un alphabet de n lettres n papillotes différentes au total quelle est la probabilité d'avoir 40 lettres de tirer 40 citations différentes, exactement, dans un mot de 52 lettres parmi un échantillon de 52 papillotes ? Modélisation du problème : trouver la valeur de n qui maximise cette probabilité
  • 6. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres.
  • 7. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres
  • 8. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba aac aca acc caa cac cca bbc bcb bcc cbb cbc ccb
  • 9. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba on trouve les mots sur d=2 lettres aac aca acc caa cac cca on en déduit les mots sur n lettres bbc bcb bcc cbb cbc ccb par projection.
  • 10. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba on trouve les mots sur d=2 lettres aac aca acc caa cac cca on en déduit les mots sur n lettres par projection : ad,k(n) = ad,k(k) Cnd bbc bcb bcc cbb cbc ccb
  • 11. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres nk Nombre ad,k(n) de mots de k lettres dont d différentes : ad,k(n) = ad,k(k) Cnd
  • 12. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. ad,k(k) Cnd Pd,k(n) = nk
  • 13. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. constante par rapport à n ad,k(k) Cnd Pd,k(n) = nk
  • 14. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk
  • 15. Résultats Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk Pour les papillotes Révillon “Festives” pour k=52 et d=40 : n=93 ? P (n) d,k n 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
  • 16. Résultats Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk Pour les papillotes Révillon “Festives” pour k=52 et d=40 : n=93 ? En fait, n=108, Pd,k(n) soit 14% d'erreur. n 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
  • 17. Résultats Evolution du nombre de blagues Carambar “Caramel” estimé en fonction de la taille du tirage : 45 40 valeur de n estimée 35 30 nombre d de blagues 25 différentes trouvées 20 15 10 5 0 nombre k de 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 carambars ouverts
  • 18. Perspectives • étude de la précision de la méthode par simulations • formule directe pour la valeur de n estimée • utilisations d'autres caractéristiques du tirage pour une évaluation plus précise : - nombre de citations présentes deux fois - distribution des nombres d'apparition de citations - taille la plus longue d'une séquence de blagues consécutives • estimation plus précise du nombre de blagues Carambar • estimation du nombre de surprises Kinder ebay.fr Bientôt sur http://gambette.blogspot.com