SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
Quart d'heure académique du SéminDoc 06/05/2009
               LIRMM – Montpellier



       Estimation du nombre
      de citations de papillotes
      et de blagues Carambar

    Philippe Gambette (équipes MAB/AlGco)
Introduction

• Papillotes créées en 1790
- un billet doux pour enrober un chocolat, à l'origine
- depuis, rébus, dessins d'humour, citations




  papillotesrevillon.fr




• Carambars créés en 1954
                                                  http://fr.wikipedia.org/wiki/Carambar
- mélange accidentel de caramel et cacao
- devinettes et blagues sur l'emballage depuis 1969
Problématique

Combien de citations ou blagues différentes ?
• pour le fabricant :
- limiter les coûts de production → nombre fini
- satisfaire le consommateur
• pour le consommateur :
- frustration de retomber sur une blague déjà lue
- souci d'exhaustivité : combien en manger pour les lire
toutes ?
• pour le statisticien :
- estimer ce nombre n d'après un échantillon
Echantillonnage

• tirer un échantillon aléatoire de k papillotes
on suppose que les citations sont uniformément réparties
dans les sachets
• discrétiser les données
associer une citation à chaque papillote
• identifier les doublons                        choix de la citation la plus
                                                proche du centre du papier
associer un entier unique à chaque citation


Modélisation de l'échantillonnage :
tirer un mot aléatoire de k lettres, choisies parmi un
alphabet de n lettres.
Modélisation du problème
                             Sachant qu'il y a
                                                     un alphabet de n lettres
n papillotes différentes au total
                         quelle est la probabilité
                                                            d'avoir 40 lettres
de tirer 40 citations
                         différentes, exactement,
                                                 dans un mot de 52 lettres
parmi un échantillon de 52 papillotes
                                     ?



Modélisation du problème :
trouver la valeur de n qui maximise cette probabilité
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba
 aac aca acc caa cac cca
 bbc bcb bcc cbb cbc ccb
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba      on trouve les mots sur d=2 lettres
 aac aca acc caa cac cca      on en déduit les mots sur n lettres
 bbc bcb bcc cbb cbc ccb      par projection.
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 n=3, k=3, d=2 :
 aab aba abb baa bab bba      on trouve les mots sur d=2 lettres
 aac aca acc caa cac cca      on en déduit les mots sur n lettres
                              par projection : ad,k(n) = ad,k(k) Cnd
 bbc bcb bcc cbb cbc ccb
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.

             nombre de mots de k lettres dont d différentes
 Pd,k(n) =           nombre de mots de k lettres nk


 Nombre ad,k(n) de mots de k lettres dont d différentes :

 ad,k(n) = ad,k(k) Cnd
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
             ad,k(k) Cnd
 Pd,k(n) =
                 nk
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.     constante par rapport à n
             ad,k(k) Cnd
 Pd,k(n) =
                 nk
Calculs

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                             Cnd
 argmaxn Pd,k(n) = argmaxn
                              nk
Résultats

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                                          Cnd
 argmaxn Pd,k(n) = argmaxn
                                           nk

 Pour les papillotes Révillon “Festives” pour k=52 et d=40 :
                                   n=93 ?
            P (n)
             d,k




                                                                                                             n
                   40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
Résultats

 Trouver la valeur de n qui maximise
 la probabilité Pd,k(n) de tirer un mot de k lettres ayant
 exactement d lettres différentes dans un alphabet de n
 lettres.
                                                      Cnd
 argmaxn Pd,k(n) = argmaxn
                                                       nk

 Pour les papillotes Révillon “Festives” pour k=52 et d=40 :
                        n=93 ?         En fait, n=108,
 Pd,k(n)
                                       soit 14% d'erreur.



                                                                                                 n
       40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
Résultats

 Evolution du nombre de blagues Carambar “Caramel” estimé
 en fonction de la taille du tirage :

         45


         40
                                                                                                             valeur de n estimée
         35


         30

                                                                                                             nombre d de blagues
         25
                                                                                                             différentes trouvées
         20


         15


         10


          5


          0
                                                                                                       nombre k de
              10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

                                                                                                  carambars ouverts
Perspectives

 • étude de la précision de la méthode par simulations
 • formule directe pour la valeur de n estimée
 • utilisations d'autres caractéristiques du tirage pour une
 évaluation plus précise :
 - nombre de citations présentes deux fois
 - distribution des nombres d'apparition de citations
 - taille la plus longue d'une séquence de blagues consécutives

 • estimation plus précise du nombre de blagues Carambar
 • estimation du nombre de surprises Kinder


                                 ebay.fr




                                                   Bientôt sur http://gambette.blogspot.com

Weitere ähnliche Inhalte

Mehr von Philippe Gambette

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kPhilippe Gambette
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Philippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Mehr von Philippe Gambette (11)

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau k
 
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraireUtilisation de la visualisation en nuage arboré pour l'analyse littéraire
Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3Analyse de textes avec TreeCloud et Lexico3
Analyse de textes avec TreeCloud et Lexico3
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Visualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboréVisualiser un texte par un nuage arboré
Visualiser un texte par un nuage arboré
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Kürzlich hochgeladen

RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKNassimaMdh
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Coursebenezerngoran
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLElebaobabbleu
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsJaouadMhirach
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 

Kürzlich hochgeladen (20)

RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 

Estimation du nombre de citations de papillotes et de blagues Carambar

  • 1. Quart d'heure académique du SéminDoc 06/05/2009 LIRMM – Montpellier Estimation du nombre de citations de papillotes et de blagues Carambar Philippe Gambette (équipes MAB/AlGco)
  • 2. Introduction • Papillotes créées en 1790 - un billet doux pour enrober un chocolat, à l'origine - depuis, rébus, dessins d'humour, citations papillotesrevillon.fr • Carambars créés en 1954 http://fr.wikipedia.org/wiki/Carambar - mélange accidentel de caramel et cacao - devinettes et blagues sur l'emballage depuis 1969
  • 3. Problématique Combien de citations ou blagues différentes ? • pour le fabricant : - limiter les coûts de production → nombre fini - satisfaire le consommateur • pour le consommateur : - frustration de retomber sur une blague déjà lue - souci d'exhaustivité : combien en manger pour les lire toutes ? • pour le statisticien : - estimer ce nombre n d'après un échantillon
  • 4. Echantillonnage • tirer un échantillon aléatoire de k papillotes on suppose que les citations sont uniformément réparties dans les sachets • discrétiser les données associer une citation à chaque papillote • identifier les doublons choix de la citation la plus proche du centre du papier associer un entier unique à chaque citation Modélisation de l'échantillonnage : tirer un mot aléatoire de k lettres, choisies parmi un alphabet de n lettres.
  • 5. Modélisation du problème Sachant qu'il y a un alphabet de n lettres n papillotes différentes au total quelle est la probabilité d'avoir 40 lettres de tirer 40 citations différentes, exactement, dans un mot de 52 lettres parmi un échantillon de 52 papillotes ? Modélisation du problème : trouver la valeur de n qui maximise cette probabilité
  • 6. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres.
  • 7. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres
  • 8. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba aac aca acc caa cac cca bbc bcb bcc cbb cbc ccb
  • 9. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba on trouve les mots sur d=2 lettres aac aca acc caa cac cca on en déduit les mots sur n lettres bbc bcb bcc cbb cbc ccb par projection.
  • 10. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres Nombre ad,k(n) de mots de k lettres dont d différentes : n=3, k=3, d=2 : aab aba abb baa bab bba on trouve les mots sur d=2 lettres aac aca acc caa cac cca on en déduit les mots sur n lettres par projection : ad,k(n) = ad,k(k) Cnd bbc bcb bcc cbb cbc ccb
  • 11. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. nombre de mots de k lettres dont d différentes Pd,k(n) = nombre de mots de k lettres nk Nombre ad,k(n) de mots de k lettres dont d différentes : ad,k(n) = ad,k(k) Cnd
  • 12. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. ad,k(k) Cnd Pd,k(n) = nk
  • 13. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. constante par rapport à n ad,k(k) Cnd Pd,k(n) = nk
  • 14. Calculs Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk
  • 15. Résultats Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk Pour les papillotes Révillon “Festives” pour k=52 et d=40 : n=93 ? P (n) d,k n 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
  • 16. Résultats Trouver la valeur de n qui maximise la probabilité Pd,k(n) de tirer un mot de k lettres ayant exactement d lettres différentes dans un alphabet de n lettres. Cnd argmaxn Pd,k(n) = argmaxn nk Pour les papillotes Révillon “Festives” pour k=52 et d=40 : n=93 ? En fait, n=108, Pd,k(n) soit 14% d'erreur. n 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160
  • 17. Résultats Evolution du nombre de blagues Carambar “Caramel” estimé en fonction de la taille du tirage : 45 40 valeur de n estimée 35 30 nombre d de blagues 25 différentes trouvées 20 15 10 5 0 nombre k de 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 carambars ouverts
  • 18. Perspectives • étude de la précision de la méthode par simulations • formule directe pour la valeur de n estimée • utilisations d'autres caractéristiques du tirage pour une évaluation plus précise : - nombre de citations présentes deux fois - distribution des nombres d'apparition de citations - taille la plus longue d'une séquence de blagues consécutives • estimation plus précise du nombre de blagues Carambar • estimation du nombre de surprises Kinder ebay.fr Bientôt sur http://gambette.blogspot.com