SlideShare ist ein Scribd-Unternehmen logo
1 von 60
Downloaden Sie, um offline zu lesen
Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα.
Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος.
MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’
Team Site: A.E.A.C. Co. Project Manager-Site Administrator
e-mail: s_4goum@yahoo.com , My Blog, Twitter
16/07/2011
ΕΙΣΑΓΩΓΗ
Η στατιστική αποτελεί ένα επιστημονικό κλάδο όπου το πεδίο εφαρμογής της
συγκαταλέγεται σε πλήθος άλλων επιστημών. Η συλλογή και η ανάλυση δεδομένων
έχει γίνει πλέον επιτακτική πριν τη λήψη αποφάσεων. Έτσι λοιπόν σε μια επιχείρηση/
οργανισμό οι ερευνητές ασχολούνται με τη συλλογή και την επεξεργασία
στατιστικών στοιχείων ώστε να διευκολύνουν τα υπόλοιπα στελέχη στη λήψη ορθών
αποφάσεων όπου θα ωφελήσουν την πορεία την επιχείρησης.
Ένας βασικός κλάδος της στατιστικής είναι η κατανόηση των στατιστικών
κατανομών. Οι κατανομές αποτελούν ένα μαθηματικό υπόδειγμα μοντελοποίησης
των στατιστικών δεδομένων. Τα μαθηματικά μοντέλα απαλλάσσουν τους ερευνητές
από περιορισμός και τους επιτρέπουν να εργαστούν και να αναπτύξουν θεωρίες υπό
ιδανικές συνθήκες. Σκοπός των κατανομών είναι να προσομοιωθεί μια σειρά
δεδομένων με βάση ένα μαθηματικό μοντέλο το οποίο έχει συγκεκριμένες ιδιότητες.
Η κατανόηση και η μοντελοποίηση του συνόλου υπό μια στατιστική κατανομή έχει
πολλαπλά οφέλη όπως 1) Είναι δυνατή η πρόβλεψη των μελλοντικών τιμών της
σειράς 2) Κατανόηση των περιγραφικών μεγεθών (μέση τιμή, διακύμανση, διάμεσος
κτλ), το οποίο συνεπάγεται ότι υπάρχει η δυνατότητα να κατανοούμε εκ των
πρότερων της εξέλιξη της σειράς. 3) Μοντελοποίηση πολλαπλών σειρών σε πιο
σύνθετα υποδείγματα με γνώστες ιδιότητες. 4) Έχοντας γνώση των αδυναμιών του
εκάστοτε μοντέλου/ κατανομής έχουμε τη δυνατότητα διόρθωσης αυτών των
σφαλμάτων και των αποτελεσμάτων.
ΠΕΡΙΛΗΨΗ
Στην παρουσιαση αυτή θα επιδείξουμε μερικες βασικές στατιστικές κατανομές
που χρησιμοποιούνται ευρέως καθώς και μερικές πιο προχωρημένες. Οι κατανομές
κατηγοριοποιούνται σε δυο βασικές ομάδες. 1) Διακριτές 2) Συνεχείς. Οι Συνεχείς
χωρίζονται στις εξής υποομάδες α) Φραγμένες β) Μη Φραγμένες 3) Μη Αρνητικές.
Διακριτή Κατανομή. Η μεταβλητή λαμβάνει μεμονωμένες τιμές σε ένα διάστημα
[α,β].
Παράδειγμα. 1) Αριθμός παιδιών (0,1,2,3, κτλ), 2) Φορολογικός Συντελεστής (0%,
10%, 30%, 40%). Μεταξύ αυτών των μεμονωμένων τιμών ΔΕΝ λαμβάνονται άλλες
τιμές. Τουτέστιν, δεν είναι δυνατό να υπάρξουν 2.5 παιδιά. Επίσης δεν είναι δυνατό
(προς το παρόν) να υπάρξει Φορολογικός Συντελεστής 10.78%.
Συνεχής Κατανομή. Η μεταβλητή λαμβάνει οποιεσδήποτε τιμές μεταξύ δυο
μεμονωμένων τιμών σε ένα διάστημα [α,β]. Όταν η κατανομή είναι συνεχής τότε η
πιθανότητα Ρ υπολογίζεται ως ∫=<<
b
a
dxxfbxaP )()(
Παράδειγμα. 1) Ηλικία (15, 50, 60 κτλ), 2)Ύψος (1.75, 1.80, 1.90 κτλ). Μεταξύ
αυτών των μεμονωμένων τιμών λαμβάνονται όλες οι ενδιάμεσες τιμές. Δηλαδή,
υφίστανται ηλικίες 20 ετών και 2 μηνών, 35 ετών 5 μηνών και 4 ημερών κτλ. Ομοίως
υπάρχει τιμή ύψους 1.76, 1.77, 1.80 και 4 χιλιοστά κτλ
Συνεχής Κατανομή (Μη Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές
τιμές στο διάστημα (-∞,+∞).
Συνεχής Κατανομή (Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές τιμές
στο διάστημα [α,β]
Συνεχής Κατανομή (Μη αρνητική). Οι περισσότερες μη αρνητικές κατανομές
ορίζονται για x>γ ετσι ώστε x-γ>0, όπου γ είναι συνεχής παράμετρος.
Για την παρουσίαση των συνεχών στατιστικών κατανομών έχουμε χρησιμοποιήσει
κυρίως το πρόγραμμα Easy Fit 5.1 καθώς και μερικές στατιστικές συναρτήσεις του
excel. Το Easy Fit 5.1 περιλαμβάνει περίπου 50 κατανομές, οπότε ο ενδιαφερόμενος
έχει μεγάλο εύρος επιλογής. Κατά την άποψή μου, είναι ένα πλήρες πρόγραμμα
οπότε είναι βέβαιο ότι οι δυνατότητες του θα εξυπηρετήσουν τις ανάγκες που
εκάστοτε ενδιαφερομένου.
Για τις διακριτές κατανομές θα παρουσιάσουμε παραδείγματα και εφαρμογές σε κάθε
ενότητα.
Για τις συνεχείς κατανομής έχουμε χρησιμοποιήσει τις αποδόσεις μιας μετοχής
λαμβάνοντας δεδομένα για 4 μήνες. Σκοπός μας είναι χρησιμοποιώντας το
πρόγραμμα Easy Fit 5.1 να μελετήσουμε και να κατανοήσουμε την προσαρμογή των
συνεχών κατανομών στα δεδομένα που διαθέτουμε.
Κατανομές που διαθέτει το Easy Fit 5.1.
Συνεχείς Φραγμένες: Beta, Johnson SB, Kumaraswamy, Pert, Power Function,
Reciprocal, Triangular, Uniform,
Συνεχείς Μη Φραγμένες: Cauchy, Error, Gumbel Max Gumbel Min, Hyperbolic
Secant, Johnson SU, Laplace (Double Exponential), Logistic, Normal, t-Student
Συνεχείς Μη Αρνητικές Burr, Levy, Gamma, Inverse Gaussian, F Distribution,
Fatigue Life (Birnbaum-Saunders), Frechet, Chi-Squared, Dagum, Erlang,
Exponential, Weibull, Rice, Rayleigh, Pearson, Pareto, Nakagami, Lognormal,
Log-Logistic, Log-Gamma.
Διακριτές: Bernoulli, Binomial Discrete Uniform, Geometric, Hypergeometric,
Logarithmic, Negative Binomial, Poisson.
Προχωρημένες Κατανομές: Generalized Extreme Value, Generalized Logistic,
Generalized Pareto, Phased Bi-Exponential, Phased Bi-Weibull, Wakeby.
Στην παρουσίασή μας δεν είναι δυνατόν να αναλύσουμε λεπτομερώς όλες τις
παραπανω κατανομές. Θα επιλέξουμε μερικές από αυτές οι οποίες έχουν ευρεία
χρήση και εφαρμογή. Εξάλλου πολλές από αυτές προσεγγίζονται ικανοποιητικά από
την κανονική κατανομή, όπως θα εξηγήσουμε παρακάτω, οπότε έχουμε την ευχέρεια
να χρησιμοποιούμε την κανονική κατανομή στην περίπτωση που αντιμετωπίζουμε
δυσκολίες με τη χρήση άλλων πιο εξειδικευμένων κατανομών.
----------------ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ
Α) ΜΗ ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ [διάστημα (-∞, +∞)]
ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ (Laplace-Gauss ή NORMAL DISTRIBUTION)
Η κανονική κατανομή είναι η πιο συνήθης συνεχής συνάρτηση κατανομής.
Επινοήθηκε από τον Gauss και χρησιμοποιείται για να περιγράψει μεγέθη που είναι
συγκεντρωμένα γύρω από μια μέση τιμή. Η κανονική κατανομή, γνωστή και ως
‘’καμπάνα’’, προσαρμόζεται σε δεδομένα όπου υποθέτουμε ότι η κατανομή είναι
μεσοκυρτη (βαθμός κυρτωσης=3) και συμμετρική (βαθμός ασυμμετριας=0)
Η σημασία της προέρχεται κυρίως από το κεντρικό οριακό θεώρημα, σύμφωνα με το
οποίο το άθροισμα μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων
μεταβλητών είναι κανονικά κατανεμημένο.
Συνάρτηση Πυκνότητας Πιθανότητας1
(σ.π.π.)
2
)(*
2
1
2*
1
)( σ
μ
πσ
−−
=
x
exf , Συμβολισμός Χ~Ν(μ,σ)
1
Συνάρτηση Πυκνότητας Πιθανότητας- Probability Density Function
Αθροιστική Συνάρτηση Πιθανότητας- Cumulative Distribution Function
Αθροιστική Συνάρτηση Πιθανότητας1
F(x)= ⎟
⎠
⎞
⎜
⎝
⎛ −
Φ
σ
μx
, Φ είναι το ολοκλήρωμα Laplace // Φ(x)= dte
x t
∫
−
0
2
2
*
2
1
π
Εναλλακτικά με μετασχηματισμό έχουμε ότι F(x)=z=
σ
μ−x
,
Όπου σ>0 (scale parameter/ τυπική απόκλιση),
R∈μ (location parameter/ μέση τιμή) και +∞<<∞− x
ΓΡΑΦΗΜΑ NORMAL ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Normal
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
Ορισμός
Αν η τυχαία μεταβλητή Χ~ Ν(μ,σ2
) τότε για τα κατωθι διαστήματα ισχύει
[μ-σ, μ+σ] 68.28%
[μ-2σ, μ+2σ] 95.44%
[μ-3σ, μ+3σ] 99.75%
Παράδειγμα
1) Έστω μια μεταβλητή Χ ακολουθεί την κανονική κατανομή Χ~Ν(8,9). Να βρεθεί η
πιθανότητα .)105( ≤≤ XP
Από τα δεδομένα έχουμε ότι μ=8 και σ2
=9
Χρησιμοποιώντας τον μετασχηματισμό z=
σ
μ−x
θα έχουμε ότι
z=
3
85 −
= -1
z=
3
810 −
= 0.66
Άρα θα έχουμε ότι
)105( ≤≤ XP = =)66,01( ≤≤− zP
)66,0( ≤zP - )1( −≤zP = -)66,0( ≤zP ))1(1( ≤− zP
0,7454-(1-0,8413) = 0,8413
(βλ. πινάκες της κανονικής κατανομής από βιβλία στατιστικής )
Για να κατανοήσουμε την παραπανω διαδικασία έχουμε σχεδιάσει προσεγγιστικά το
εξής γράφημα, όπου ουσιαστικά έχουμε υπολογίσει το εμβαδόν από το (-∞, 0.66) και
το εμβαδόν από το (-∞, -1). Έπειτα αφαιρώντας αυτά τα δυο εμβαδά υπολογίσουμε το
εμβαδόν στο (-1, 0.66)
2) Έστω Χ~Ν(3,σ2
) και έχουμε επίσης ότι .7291,0)5,1( =≥XP
Να βρεθεί το σ2
Από τον μετασχηματισμό z=
σ
μ−x
έχουμε ότι z=
σ
35,1 −
z=
σ
5,1−
.7291,0)5,1( =≥XP z= 0.61 (Βλ. πινάκες της κανονικής κατανομής από βιβλία
στατιστικής)
Επειδή όμως z<0, (εξ ορισμού τυπική απόκλιση (σ) > 0), λογω συμμετρίας θα έχουμε
z= -0.61
Αρά -0.61=
σ
5,1−
σ=2,46 (Αν καταλήγαμε ότι σ<0 οφείλουμε να ελέγξουμε για την
ύπαρξη σφάλματος στην διαδικασία μας))
ΛΟΓΙΣΤΙΚΗ ΚΑΤΑΝΟΜΗ (LOGISTIC DISTRIBUTION)
Συνάρτηση Πυκνότητας Πιθανότητας
2
)1(*
)(
ze
ze
xf
−+
−
=
σ
, Συμβολισμός X~Logistic(μ,σ)
Αθροιστική Συνάρτηση Πιθανότητας
ze
xF −+
=
1
1
)( ,
Όπου
σ
μ−
=
x
z ,
σ>0 (scale parameter), R∈μ (location parameter) και +∞<<∞− x
Παρατήρηση: Η λογιστική κατανομή εμφανίζει πολλές ομοιότητες με την κανονική
κατανομή. Χρησιμοποιείται κυρίως στην περίπτωση που η σειρά προσεγγίζεται από
την κανονική κατανομή αλλά εμφανίζει παχιές ουρές 2
.
Εφαρμογές Λογιστικής Κατανομής: Επιδημιολογία, Βιολογία (Ρυθμός αύξησης
πληθυσμού), Ψυχολογία (Ρυθμός μάθησης) κτλ
2
Παχιές ουρές Πλακυκυρτη (Βαθμός Κυρτωσης<3) Λεπτές ουρές Λεπτοκυρτη (Βαθμός
Κυρτωσης>3)
ΓΡΑΦΗΜΑ LOGISTIC ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Logistic
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
CAUCHY ΚΑΤΑΝΟΜΗ (CAUCHY DISTRIBUTION)
Η κατανομή Cauchy επινοήθηκε από τους Augustin Cauchy και Hendrik Lorentz
Τούτη η κατανομή αποτελεί ένα πρότυπο για κατανομές που δεν έχουν μέση τιμή και
διακύμανση, εντούτοις η επικρατούσα τιμή και η διάμεσος είναι καλά ορισμένες.
Μοιάζει πολύ με την κατανομή Poisson Kernel.
Όταν δυο μεταβλητές Χ,Υ ακολουθούν την κανονική κατανομή με μέση τιμή ιση με
μηδέν και σταθερή διακύμανση ίση με την μονάδα, τότε το πηλίκο Χ/Υ ακολουθεί
την τυπική Cauchy κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
12)))(1(**()( −−
+=
σ
μ
σπ
x
xf , Συμβολισμός X~C(μ,σ)
Αθροιστική Συνάρτηση Πιθανότητας
5.0arctan
1
)( +
−
= ⎟
⎠
⎞
⎜
⎝
⎛
σ
μ
π
x
xF
όπου σ>0 (scale parameter ) , R∈μ (location parameter)
arctan αντίστροφη συνάρτηση εφαπτομένης και +∞<<∞− x
ΓΡΑΦΗΜΑ CAUCHY ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Cauchy
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
JOHNSON SU ΚΑΤΑΝΟΜΗ (JOHNSON SU DISTRIBUTION)
Τούτη η κατανομή που επινοήθηκε από τον Norman Lloyd Johnson (1917-2004).
Στην ίδια οικογένεια ανήκουν η Johnson SB και Log-Normal κατανομές. Αυτές οι
τρεις κατανομές είναι παρόμοιες με την κανονική κατανομή ωστόσο δεν έχουν τους
περιορισμούς της, καθώς διαθέτουν εκείνες τις ιδιότητες που τις καθιστούν ικανές να
προσαρμοστούν σε δεδομένα με διάφορες τιμές ασυμμετρίας και κύρτωσης, ιδιότητες
τις οποίες δεν διαθέτει η κανονική κατανομή.
Η κανονική κατανομή, γνωστή και ως ‘’καμπάνα’’, προσαρμόζεται σε δεδομένα
όπου υποθέτουμε ακολουθούν μια κατανομή μεσόκυρτη (βαθμός κυρτωσης=3) και
συμμετρική (βαθμός ασυμετριας=0). Ωστόσο, επειδή στην πράξη τούτο σπάνια
συμβαίνει, οι προαναφερθείσες κατανομές είναι ιδανικές σε περιπτώσεις όπου δεν
ισχύουν οι υποθέσεις της κανονικής κατανομής. Ειδικότερα για τις λεπτοκυρτες
κατανομές, οι Johnson SB, Johnson, SU και Log-Normal είναι αποτελεσματικότερες
και πιο ιδανικές από την κανονική.
Συνάρτηση Πυκνότητας Πιθανότητας
2
))12ln(*(*5.0
*)(
1*2* 2
+++−
+
=
zz
exf
z
δγ
πλ
δ
,
Συμβολισμός Χ~ Jsu(γ,δ,λ,ξ)
Αθροιστική Συνάρτηση Πιθανότητας
))1ln(* 2
()( +++Φ= zzxF δγ
όπου
λ
ξ−
=
x
z , Φ Ολοκλήρωμα Laplace // Φ(x)= dte
x t
∫
−
0
2
2*
2
1
π
Επίσης τα γ,δ,λ,ξ είναι παράμετροι με δ,λ>0. ),( +∞−∞∈x
γ,δ (shape parameter), λ (scale parameter), ξ (location parameter)
ΓΡΑΦΗΜΑ JOHNSON SU ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Johnson SU
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
LAPLACE ή DOUBLE EXPONENTIAL ΚΑΤΑΝΟΜΗ
(LAPLACE ή DOUBLE EXPONENTIAL DISTRIBUTION)
Τούτη η κατανομή επινοήθηκε από τον Pierre-Simon Laplace. Ονομάζεται και double
exponential (διπλή εκθετική) κατανομή διοτι το γράφημά της μοιάζει με δυο
εκθετικές κατανομές η μια διπλά στην άλλη και συμμετρικές ως προς τον
κατακόρυφο άξονα..
Από μαθηματικής απόψεως έχει κοινά χαρακτηριστικά με την κανονική κατανομή
καθώς η μεν Laplace εκφράζεται σε απόλυτες διαφορές η δε κανονική σε διαφορές
τετραγώνων (βλ τα αντίστοιχα ‘’Συνάρτηση Πυκνότητας Πιθανότητας’’).
Συνάρτηση Πυκνότητας Πιθανότητας
||*
*)(
2
μλλ −−
=
x
exf , Συμβολισμός Χ~ Laplace(μ,λ)
Αθροιστική Συνάρτηση Πιθανότητας
μ
μ
μλ
μλ
>−
≤
=
−−
−−
xe
x
e
xF
x
x
)(*
)(*
*
2
1
1
*
2
1
)(
Όπου λ, μ είναι παράμετροι με λ>0. ),( +∞−∞∈x
λ (scale parameter ) , μ (location parameter)
ΓΡΑΦΗΜΑ LAPLACE ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Laplace
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
LOG-NORNAL ΚΑΤΑΝΟΜΗ με 3- παραμέτρους
(LOG-NORNAL DISTRIBUTION 3Ρ)
Μια μεταβλητή Χ ακολουθεί την Log-Normal κατανομή όταν ο λογάριθμός της
ακολουθεί την κανονική κατανομή.
Μια μεταβλητή είναι πιθανό να ακολουθεί την Log-Normal κατανομή όταν είναι
αποτέλεσμα πολλών τυχαίων θετικών μεταβλητών. Συνήθως οι χρηματοοικονομικές
σειρές3
(μετοχές, παράγωγα κτλ) προσεγγίζονται ικανοποιητικά από την Log-Normal
κατανομή. Επίσης έχει παρατηρηθεί ότι οι λογάριθμοι βιολογικών μεταβλητών
(μήκος μαλλιών/ νυχιών, ύψος, βάρος, πίεση) τείνουν να ακολουθούν την κανονική
κατανομή)
3
Για μετοχές ισχύει συνήθως το εξής: Όταν η απόδοση μια μετοχής ακολουθει την κανονική κατανομή
τότε η τιμή ακολουθει την Log-Normal κατανομή
Συνάρτηση Πυκνότητας Πιθανότητας
πσγ
σ
μγ
*2**)(
)(
2)ln(
*5.0
−
=
⎟
⎠
⎞
⎜
⎝
⎛ −−
−
x
xf
x
e
, Συμβολισμός Χ~ LogN(μ,σ,γ)
Αθροιστική Συνάρτηση Πιθανότητας
⎟
⎠
⎞
⎜
⎝
⎛ −−
Φ=
σ
μγ )ln(
)(
x
xF
Φ Ολοκλήρωμα Laplace // Φ(x)= dte
x t
∫
−
0
2
2*
2
1
π
Όπου σ, μ, γ είναι παράμετροι με σ>0. ),( +∞∈ γx
σ (scale parameter ), μ (shape parameter), γ (location parameter)
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Log-Normal
κατανομή 2-παραμετρων (Log-Normal 2Ρ). Το τυπολογιο των συναρτήσεων των
πιθανοτήτων της Log-Normal 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι
θέτουμε γ=0
ΓΡΑΦΗΜΑ LOG-NORMAL ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Lognormal (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
GAMMA ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (GAMMA 3Ρ DISTRIBUTION)
Τούτη η κατανομή προσεγγίζει συχνά μοντέλα μεταβλητών αναμονής (waiting time
models). Λόγου χάρη, η αναμονή μέχρι την απεβίωση, ο υπολογισμός του ρυθμού της
βροχόπτωσης και οι ασφαλιστικές αποζημιώσεις είναι μερικές μεταβλητές που
προσεγγίζονται από την Gamma κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
β
γ
α
α
αβ
γ
)(
1
*
)(*
)(
)(
−−
−
Γ
−
=
x
e
x
xf , Συμβολισμός Χ~ Γ(α,β,γ)
Αθροιστική Συνάρτηση Πιθανότητας
)(
)(
/)(
)(
α
αβγ
Γ
Γ −
=
x
xF
Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta
x
−−
∫ *
0
1
Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx
α (shape parameter), β (scale parameter) , γ (location parameter)
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Gamma κατανομή
2-παραμετρων (Gamma 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Gamma 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
Αν Ζ∈α τότε η Gamma κατανομή αναπαριστά την Erlang κατανομή
ΓΡΑΦΗΜΑ GAMMA ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Gamma (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
WEIBULL ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (WEIBULL 3Ρ DISTRIBUTION)
Τούτη η κατανομή περιγράφθηκε ολοκληρωμένα και από τον Waloddi Weibull
(1887-1979), ωστόσο υπήρχαν και προγενέστερες αναφορές από άλλους επιστήμονες.
Έχει κοινά χαρακτηριστικά με την Εκθετική (Exponential) και την Rayleigh
κατανομή. Πιο συγκεκριμένα, παρεμβάλλεται μεταξύ της Εκθετικής (α=1) και της
Rayleigh (α=2). Η Weibull κατανομή υπολογίζει τον ρυθμό αποτυχίας ενός
ενδεχόμενου για ένα χρονικό διάστημα. Για α<1, ο ρυθμός αποτυχίας φθίνει καθώς ο
χρόνος κυλάει, για α=1 ο ρυθμός αποτυχία είναι σταθερός, ενώ για α>1 ο ρυθμός
αποτυχίας αυξάνει με το πέρασμα του χρόνου. (βλ. παρακάτω το τυπολόγιο)
Η Weibull κατανομή χρησιμοποιείται στην βιομηχανία για να περιγράψει το χρόνο
κατασκευής και παράδοσης ενός προϊόντος, στην μετεωρολογία, στις τηλεπικοινωνίες
κ.α.
Συνάρτηση Πυκνότητας Πιθανότητας
α
β
γα
β
γ
β
α ⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
−
−
=
x
e
x
xf **)(
1
, Συμβολισμός Χ~ W(α,β,γ)
Αθροιστική Συνάρτηση Πιθανότητας
α
β
γ
⎟
⎠
⎞
⎜
⎝
⎛ −
−
−=
x
exF 1)(
Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx
α (shape parameter), β (scale parameter) , γ (location parameter)
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Weibull κατανομή
2-παραμετρων (Weibull 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Weibull 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
ΓΡΑΦΗΜΑ WEIBULL ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Weibull (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
FATIGUE LIFE ΚΑΤΑΝΟΜΗ ή (Birnbaum–Saunders) με 3-παραμέτρους
(FATIGUE LIFE 3Ρ DISTRIBUTION)
Τούτη η κατανομή επινοήθηκε για να προσδιοριστεί η αποτυχία στον κύκλο ζωής
μιας κατασκευής εξαιτίας των φθορών. Με το μοντέλο αυτό, είναι δυνατό να
εντείνουμε το ρυθμό των φθορών ώστε να προσεγγιστεί το μέγεθος εκείνο που θα
προκαλέσει την κατάρρευση της κατασκευής. Στην ιδία κατηγορία με αυτή την
κατανομή ανήκουν η Lognormal, Exponential and Weibull.
Χρησιμοποιείται κυρίως για να καθοριστεί η ζημία σε μηχανικά, ηλεκτρολογικά,
οικοδομικά υλικά, στις ασφαλιστικές απαιτήσεις αλλά και στα σοκ των αγορών.
Συνάρτηση Πυκνότητας Πιθανότητας
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
−
−
−
+
−
=
γ
β
β
γ
α
φ
γ
γ
β
β
γ
x
x
xa
x
x
xf *
1
*
)(**2
)(
Συμβολισμός Χ~ BS(α,β,γ)
Αθροιστική Συνάρτηση Πιθανότητας
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
−
Φ=
γ
β
β
γ
α x
x
xF *
1
)(
Όπου Φ Ολοκλήρωμα Laplace // Φ(x)= dte
x t
∫
−
0
2
2*
2
1
π
φ
π*2
2
2x
e
−
α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx
α (shape parameter), β (scale parameter) , γ (location parameter)
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Fatigue Life
κατανομή 2-παραμετρων (Fatigue Life 2Ρ). Το τυπολόγιο των συναρτήσεων των
πιθανοτήτων της Fatigue Life 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι
θέτουμε γ=0
ΓΡΑΦΗΜΑ FATIGUE LIFE ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Fatigue Life (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ERLANG ΚΑΤΑΝΟΜΗ με 3 παραμέτρους (ERLANG 3Ρ DISTRIBUTION)
Η κατανομή Erlang επινοήθηκε από τον μαθηματικό Agner Krarup Erlang (1878 –
1929). Ανήκει στην ίδια οικογένεια και έχει πολλές ομοιότητες με την Gamma και
Exponential κατανομή. Αρχικά χρησιμοποιήθηκε από τον Agner Krarup Erlang για
να μελετήσει τον ρυθμό των τηλεφωνικών κλήσεων που γίνονται την ίδια ώρα σε ένα
σταθμό. Μετέπειτα εφαρμόστηκε στις στοχαστικές διαδικασίες και τα
βιομαθηματικά.
Παρατηρώντας προσεκτικά το τυπολόγιο της Erlang και της Gamma κατανομής θα
διαπιστώσουμε ότι πρόκειται για ακριβώς τις ίδιες εξισώσεις με την μόνη διαφορά ότι
η shape parameter της Erlang (m) ανήκει στους θετικούς ακέραιους αριθμούς ενώ η
shape parameter της Gamma (α) ανήκει στους θετικούς αριθμούς. Εναλλακτικά
μπορεί να ειπωθεί ότι η Erlang αποτελεί ειδική περίπτωση της Gamma. Να
σημειώσουμε επιπλέον ότι για m=1 η Erlang καταλήγει στην Exponential κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
β
γ
β
γ
)(
1
*
)(*
)(
)(
−−
−
Γ
−
=
x
m
e
mm
x
xf , Συμβολισμός Χ~ Erlang(m,β,γ)
Αθροιστική Συνάρτηση Πιθανότητας
)(
)(
/)(
)(
m
m
x
xF
Γ
Γ −
=
βγ
Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta
x
−−
∫ *
0
1
Όπου m, β, γ είναι παράμετροι με m *N∈ , β>0, R∈γ ),( +∞∈ γx
m (shape parameter), β (scale parameter) , γ (location parameter)
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Erlang κατανομή 2-
παραμετρων (Erlang 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Erlang 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
ΓΡΑΦΗΜΑ ERLANG ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Erlang (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΕΚΘΕΤΙΚΗ ΚΑΤΑΝΟΜΗ (EXPONENTIAL DISTRIBUTION)
Η εκθετική κατανομή χρησιμοποιείται πρωτίστως για να περιγράψει τα χρονικά
διαστήματα που μεσολαβούν μεταξύ δυο γεγονότων μιας Poisson διαδικασίας.
Μπορεί επίσης να εφαρμοστεί σε πειράματα φυσικής (π.χ. παρατήρηση της
μεταβολής του όγκου ενός αερίου με σταθερή θερμοκρασία), στην υδρολογία για να
υπολογιστεί ο ρυθμός βροχόπτωσης για μια συγκεκριμένη χρονική περίοδο, στις
τηλεπικοινωνίες, στην μηχανική για να εξεταστεί η σταθερότητα ενός συστήματος,
στο οδικό δίκτυο για να μελετηθεί ο ρυθμός ατυχημάτων κ.α.
Το μειονέκτημα της εκθετικής κατανομής είναι ότι υποθέτουμε ένα σταθερό ρυθμό
μεταβολής ίσο με λ. Ωστόσο, αν επιλεγεί εκ των πρότερων ένα χρονικό διάστημα
όπου είναι γνωστό ότι ο ρυθμός μεταβολής είναι σταθερός ή περίπου σταθερός τότε η
εκθετική κατανομή προσεγγίζει αρκετά ικανοποιητικά τις παρατηρήσεις.
Συνάρτηση Πυκνότητας Πιθανότητας
)(*
exp*)( γλ
λ −−
= x
xf , Συμβολισμός Χ~ Exp(λ,γ)
Αθροιστική Συνάρτηση Πιθανότητας
)(*
exp1)( γλ −−
−= x
xF
Όπου λ, γ είναι παράμετροι λ>0, R∈γ ),( +∞∈ γx
λ (scale parameter) , γ (location parameter)
ΓΡΑΦΗΜΑ ΕΚΘΕΤΙΚΗΣ ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Exponential (2P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
PEARSON TYPE 6 ΚΑΤΑΝΟΜΗ 4- ΠΑΡΑΜΕΤΡΟΙ
(PEARSON TYPE 6 4Ρ DISTRIBUTION)
Αυτή η κατανομή επινοήθηκε από τον Άγγλο μαθηματικό Karl Pearson (1857-1936)
και χρησιμοποιήθηκε αρχικά για μελέτες βιοστατιστικης. Μετέπειτα και με την
εξέλιξη των υπολογιστών εφαρμόστηκε στις χρηματοοικονομικές αναλύσεις, στην
συμπεριφορά των αποδοσεων των μετοχών, στα επιτόκια, στις συναλλαγματικές
ισοτιμίες, στις συχνότητα των πλημμύρων και των σεισμών κτλ. Είναι επίσης
ιδιαίτερα χρήσιμη στις περιπτώσεις όπου η κατανομή εμφανίζει διάφορες μορφές
κύρτωσης. Εκτός από την Pearson Type6 κατανομή προηγήθηκαν 5 ακόμα τύποι
κατανομών οι όποιοι είτε βελτίωναν είτε συμπλήρωναν είτε επέκτειναν τις
δυνατότητες τις προηγούμενης εξίσωσης της κατανομής.
Σε ότι αφόρα την σχέση της με τις υπόλοιπες κατανομές, έχει αποδειχτεί ότι
εμφανίζει αρκετές ομοιότητες με την Cauchy, Κανονική, Βeta, Gamma, X2
και την F
κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
21*)
21
1
1
))(1(,(*
)(
)(
aa
a
b
x
aaBb
b
x
xf
+
−
−
+
−
=
γ
γ
Συμβολισμός Χ~ Pearson6(α1,α2, b,γ)
Αθροιστική Συνάρτηση Πιθανότητας
),()( 21
aaIxF
bx
x
+−
−
=
γ
γ
Όπου α1, α2, b, γ είναι παράμετροι με α1,α2,b>0 , +∞≤≤ xγ
α1,α2 (shape parameter) , b (scale parameter), γ (location parameter)
B Συνάρτηση Beta: B(α1,α2)= dtt
aa
t∫
−−
−
1
0
11 21 )1(*
Iz Κανονικοποιημένη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
),(
),(
21
21
aaB
aaBx
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Pearson κατανομή
3-παραμετρων (Pearson 3Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Pearson 3Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
ΓΡΑΦΗΜΑ PEARSON TYPE 6 ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Pearson 6 (4P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ
(GENERALIZED EXTREME VALUE DISTRIBUTION)
Η generalized extreme value κατανομή αναπτύχθηκε παράλληλα με τον κλάδο της
στατιστικής που αφορά την θεωρία ακραίων τιμών (extreme value theory). Αρχικά
τέτοιου είδους σειρές μελετήθηκαν από τους Fisher και Tippett, (1928) οι οποίοι
περιέγραψαν το πρώτο θεώρημα ακραίων τιμών και αργότερα από τον Gnedenko
(1943) ο οποίος περιέγραψε το δεύτερο θεώρημα ακραίων τιμών.
Η κατανομή αυτή αποσκοπεί να συνδυάσει τις οικογένειες των κατανομών Gumbel,
Fréchet και Weibull καθώς συσχετίζει παραδοχές και από τις τρεις αυτές κατανομές.
Είναι εξαιρετικά χρήσιμη για τη μελέτη φαινομένων που δεν παρουσιάζονται συχνά
και αντιμετωπίζονται ως ακραία. Εφαρμόζεται για την μελέτη και την πρόβλεψη
γιγαντιαίων κυμάτων (τσουναμι), για πυρκαγιές μεγάλης έκτασης πλημμύρες-
κατακλυσμούς, στα χρηματοοικονομικά, στην μέτρηση του χρηματοοικονομικού-
πιστωτικού κινδύνου, στον υπολογισμό της πιθανότητας μεγάλων αποζημιώσεων κτλ.
Από υπολογιστικής πλευράς, θα μπορούσαμε να αναφέρουμε ότι χρησιμοποιείται
συχνά σε σειρές που εμφανίζουν μεγάλη και ασυνήθιστη διακύμανση.
Συνάρτηση Πυκνότητας Πιθανότητας
0
*
1
0
*
1
)(
)(
1
1
)*1(*
1
)*1(
=
≠
=
−
−−
−−
+
−
+−
k
e
k
e
xf
z
ez
kzkkzk
σ
σ
Συμβολισμός Χ~ GEV(μ,σ,k)
Αθροιστική Συνάρτηση Πιθανότητας
0
0
)(
)(
1
)*1(
=
≠
=
−
−−
−
+−
k
e
k
e
xF
z
ez
kzk
Όπου z=
σ
μ−x
, σ>0
001 ≠>
−
+ k
x
k για
σ
μ
και 0=+∞<<∞− kx για
k (shape parameter), σ (scale parameter ) , μ (location parameter)
ΓΡΑΦΗΜΑ GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ
Probability Density Function
Histogram Gen. Extreme Value
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ERROR ΚΑΤΑΝΟΜΗ (ERROR DISTRIBUTION)
Τούτη η κατανομή χρησιμοποιείται κυρίως σε σειρές όπου εμφανίζουν ασυμμετρία ή/
και κύρτωση, εν αντίθεση με την κανονική κατανομή όπου δεν λαμβάνει υπόψη
αυτούς τους δυο παράγοντες. Εμφανίζει αρκετές ομοιότητες με την κατανομές
Generalized Extreme Value, Weibull, Log-Normal και χρησιμοποιείται σε αρκετές
εφαρμογές όπως σε χρηματοοικονομικά μοντέλα, εκτίμηση αποδοσεων για μετοχές,
παράγωγα, μοντέλα VaR (Value at Risk) κτλ. Ειδικότερα στα οικονομετρικά μοντέλα
GARCH, είναι η συνηθέστερη κατανομή που επιλέγεται για την εκτίμηση των
δεδομένων
Συνάρτηση Πυκνότητας Πιθανότητας
1
1
1
|*
0
|
**)(
−
−
−
=
zc
ecxf σ Συμβολισμός Χ~ Error(μ,σ,k)
Αθροιστική Συνάρτηση Πιθανότητας
μ
μ
<
Γ
Γ
−
≥
Γ
Γ
+
=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
x
k
k
x
k
k
xF
k
zc
k
zc
)
1
(
)
1
(
1*5.0
)
1
(
)
1
(
1*5.0
)(
|*
0
|
|*
0
|
Όπου
2
1
0
)
1
(
)
3
(
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
Γ
Γ
=
k
kc
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
Γ
=
)
1
(*2
* 0
1
k
ck
c
σ
μ−
=
x
z
Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta
x
−−
∫ *
0
1
+∞<<∞− x , k (shape parameter), σ (scale parameter ) , μ (location parameter)
Σημείωση: Για k=2 η Error καταλήγει στην Κανονική κατανομή ενώ για k=1
καταλήγει στην Laplace
ΓΡΑΦΗΜΑ ERROR ΚΑΤΑΝΟΜΗ
Probability Density Function
Histogram Error
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
F -ΚΑΤΑΝΟΜΗ (F- DISTRIBUTION)
Η κατανομή F επινοήθηκε από τους R.A. Fisher και George W. Snedecor.
Εφαρμόζεται κυρίως για στατιστικούς ελέγχους και στην ανάλυση διακύμανσης.
Συνάρτηση Πυκνότητας Πιθανότητας
21)
2
*
1
2
1
1*
1
21 (
*)(
*
),(*
1
)(
νν
νν
ν
ν
ν
ν
νν +
+
=
x
x
Bx
xf Συμβολισμός Χ~ F(ν1,ν2)
Αθροιστική Συνάρτηση Πιθανότητας
),()(
21
ννz
xF Ι=
B Συνάρτηση Beta: B(α1,α2)= dtt
aa
t∫
−−
−
1
0
11 21 )1(*
Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
),(
),(
21
21
aaB
aaBx
21
1
*
*
νν
ν
+
=
x
x
z
+∞<≤ x0 , (ν1,ν2 βαθμοί ελευθερίας)Nvv ∈21 ,
Χ2
-ΚΑΤΑΝΟΜΗ (CHI-SQUARED DISTRIBUTION)
Η κατανομή X2
αποτελεί το άθροισμα των τετραγώνων κ ανεξάρτητων μεταβλητών
οι οποίες ακολουθούν την κανονική κατανομή. Εφαρμόζεται κυρίως για στατιστικούς
ελέγχους, τεστ υποθέσεων και την κατασκευή των διαστημάτων εμπιστοσύνης.
Να σημειώσουμε επίσης ότι η X2
αποτελεί μια ειδική περίπτωση της κατανομής
Gamma.
Συνάρτηση Πυκνότητας Πιθανότητας
)
2
(*2
*)(
)(
2
2
)(
12
ν
γ
ν
γν
Γ
−
=
−−
−
x
ex
xf Συμβολισμός Χ~ Χ2
(ν,γ)
Αθροιστική Συνάρτηση Πιθανότητας
)
2
(
)
2
(
)
2
(
)(
ν
ν
Γ
Γ
=
x
xF
Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta
x
−−
∫ *
0
1
Γ(α) Συνάρτηση Gamma// Γ(α) = dtet ta −−
∫
∞
*
0
1
Όπου ν βαθμοί ελευθερίας // Ν∈ν , R∈γ , ),( +∞∈ γx
γ (location parameter)
Σημείωση: Για γ=0 καταλήγουμε στην X2
με μια παράμετρο.
B) ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ (διάστημα [α,β])
ΟΜΟΙΟΜΟΡΦΗ ΚΑΤΑΝΟΜΗ (UNIFORM DISTRIBUTION)
Η ομοιόμορφη κατανομή είναι μια από τις πιο συχνές και απλές κατανομές που
μπορούν να συναντηθούν στις αναλύσεις και τη έρευνα. Είναι επίσης γνωστή με το
όνομα ορθογωνική κατανομή εξαιτίας του σχήματός της. Μερικές μεταβλητές που
συνήθως ακολουθούν την ομοιόμορφη κατανομή είναι το ύψος, ηλικία και βάρος των
μαθητών μιας συγκεκριμένης σχολικής τάξης (π.χ. οι μαθητές τη Γ λυκείου έχουν
άλικα από 17-18 ετών με όλες τις ενδιάμεσες τιμές να είναι πιθανές, έχουν περίπου
ίδιο ύψος (τόσο τα αγόρια οσο και τα κορίτσια) και περίπου ίδιο βάρος. Άλλο
παράδειγμα είναι ο μισθός μιας συγκεκριμένης κατηγορίας υπάλληλων σε μια
επιχείρηση (π.χ. υπάλληλοι γραφείου)
Τούτη η κατανομή είναι εύκολη στη χρήση της, ενώ παράλληλα το τυπολογιο της
είναι εξαιρετικά απλό και εύχρηστο, όπου δεν χρειάζεται η χρήση Η/Υ. Επιπλέον με
την χρήση διαφόρων μετασχηματισμών η ομοιόμορφη κατανομή σχετίζεται με την
εκθετική, την Beta και την τριγωνική κατανομή
Συνάρτηση Πυκνότητας Πιθανότητας
ab
xf
−
=
1
)( , Συμβολισμός Χ~ U(a,b)
Αθροιστική Συνάρτηση Πιθανότητας
ab
ax
xF
−
−
=)(
όπου a<b και a<x<b.
Παρατήρηση: To χαρακτηριστικό της ομοιόμορφης κατανομής είναι ότι όλα τα
ενδεχόμενα είναι ισοπίθανο να εμφανιστούν.
ΓΡΑΦΗΜΑ UNIFORM ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Uniform
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
Παράδειγμα
1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 6;
Η πιθανότητα εμφάνισης ενός αριθμού του ζαριού είναι ίση με 1/6, καθώς όλοι οι
αριθμοί είναι ισοπίθανο να εμφανιστούν.
Άρα η πιθανότητα να φέρουμε 6 είναι p=1/6
2) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε ένα αριθμό μικρότερο του 5;
Τα πιθανά ενδεχόμενα είναι να φέρουμε τους αριθμός Α{1,2,3,4}
Αρά Ρ(Χ<5)= P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)
Ρ(Χ<5)= 1/6 + 1/6 + 1/6 + 1/6 = 4/6
2) Ρίχνουμε δυο ζάρια. Υπολογίστε τις εξής πιθανότητες
ι) Το άθροισμα τους να είναι ίσο με 10
ιι) Το άθροισμα τους να είναι μικρότερο από 7
ιιι) Να φέρουμε πεντάρες
ιv) Να φέρουμε δυο και τρία
Αρχικά κατασκευάζουμε τον παρακάτω πίνακα στον οποίο έχουμε υπολογίσει όλα τα
πιθανά αθροίσματα
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Παρατηρούμε ότι έχουμε 36 (6*6) πιθανά ενδεχόμενα. Έχοντας τούτο υπόψη μας
μπορούμε να απαντήσουμε στα ερωτήματα.
ι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 3
παρατηρήσεις που έχουν αθροισμα=10. Το σύνολο των παρατηρήσεων είναι 36. Αρά
Ρ(S=10)= 3/36
ιι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 15
παρατηρήσεις που έχουν άθροισμα < 7. Το σύνολο των παρατηρήσεων είναι 36. Αρά
Ρ(S<7)= 15/36
ιιι) Η πιθανότητα να φέρουμε πεντάρες υπολογίζεται ως εξής.
Πρώτο ζάρι: Ρ(Χ=5)=1/6 και Δεύτερο ζάρι: Ρ(Χ=5)=1/6 (βλ. Παράδειγμα 1)
Αρά Ρ(πεντάρες)=1/6*1/6=1/36
Ομοίως από τον παραπανω πίνακα παρατηρούμε ότι ο αριθμός ‘’5’’ των Στηλών και
ο αριθμός ‘’5’’ των Γραμμών τέμνονται μια μόνο φορά.
Γενικά όλα τα διπλά νούμερα (άσσοι, δίπλες, τριάρες…..) έχουν πιθανότητα p=1/36
να εμφανιστούν
ιv) Ο συλλογισμός είναι ίδιος όπως στο προηγούμενο ερώτημα
Πρώτο ζάρι: Ρ(Χ=2)=1/6 και Δεύτερο ζάρι: Ρ(Χ=3)=1/6 Ρ(2,3)= 1/6*1/6
Όμως θα έχουμε ακόμα ότι
Πρώτο ζάρι: Ρ(Χ=3)=1/6 και Δεύτερο ζάρι: Ρ(Χ=2)=1/6 Ρ(3,2)= 1/6*1/6
Αρά Ρ(ολικό)=Ρ(2,3)+Ρ(3,2)=1/6*1/6+1/6*1/6=1/36+1/36=2/36
Ομοίως στο ίδιο συμπέρασμα καταλήγουμε από τον παραπανω πίνακα.
ΒΕΤΑ ΚΑΤΑΝΟΜΗ (ΒΕΤΑ DISTRIBUTION)
Τούτη η κατανομή χρησιμοποιείται κυρίως για να περιγράψει την κατανομή μιας
μεταβλητής με άγνωστη πιθανότητα. Τυπικά περιγράφει την εκ των πρότερων
(a-priori)4
κατανομή μιας πιθανότητας όπως την πιθανότητα επιτυχώς ενός
πειράματος (Διωνυμικη, Bernoulli κατανομή). Στην πραγματικότητα η Beta
κατανομή είναι ένα συνονθύλευμα της Διωνυμικής με την Bernoulli κατανομή.
4
A-Priori Οι πιθανότητες των ενδεχομένων είναι γνώστες εκ των πρότερων. π.χ. Ρίψη ενός ζαριού
Α-Posteriori (εμπειρική πιθανότητα) Οι πιθανότητες των ενδεχομένων είναι γνωστές αφού
ολοκληρωθεί το πείραμα. Π.χ. Σουτ από την γραμμή των βολών σε έναν αγώνα μπάσκετ.
Συνάρτηση Πυκνότητας Πιθανότητας
1
)(
1
)(*
1
)(
*
,(
1
)(
21
21
)
21
−+
−
−
−
−
−
=
aa
ab
a
xb
a
ax
aaB
xf
Συμβολισμός Χ~ Βeta(α1,α2, α, b)
Αθροιστική Συνάρτηση Πιθανότητας
),()( 21
aaIxF
z
=
Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤
α1,α2 (shape parameter)
B Συνάρτηση Beta: B(α1,α2)= dtt
aa
t∫
−−
−
1
0
11 21 )1(*
Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
),(
),(
21
21
aaB
aaBx
Παρατηρήσεις
Για α1= α2=1 Η Beta κατανομή καταλήγει στην ομοιόμορφη κατανομή
Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Η Beta κατανομή είναι φθίνουσα συνάρτηση
Για α1>1 και α2 ≤ 1 ή α2=1 α2<1 Η Beta κατανομή είναι αύξουσα συνάρτηση
Για α1<1 και α2<1 Η Beta κατανομή έχει σχήμα U (U-shaped). Μοιάζει με το
παρακάτω γράφημα γυρνώντας το ανάποδα
Για α1=1 και α2>2 Η Beta κατανομή είναι κυρτή
Για α1=1 και α2=2 Η Beta κατανομή είναι ευθεία γραμμή
Για α1=1 και 1< α2<2 Η Beta κατανομή είναι κοίλη
Για α1>2 και α2=1 Η Beta κατανομή είναι κυρτή
Για α1=2 και α2=1 Η Beta κατανομή είναι ευθεία γραμμή
Για 1< α1<2 και α2=1 Η Beta κατανομή είναι κοίλη
Για α1>1, α2>1 Η Beta είναι unimodal (Έχει δηλαδή μια επικρατούσα τιμη.
Γραφικά αυτό ορίζεται με τη συνάρτηση πυκνότητας πιθανότητας να έχει μια μόνο
κορυφή. Βλ το παρακάτω γράφημα ‘’unimodal-bimodal’’ )
ΓΡΑΦΗΜΑ BETA ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Beta
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
KUMARASWAMY ΚΑΤΑΝΟΜΗ (KUMARASWAMY DISTRIBUTION)
Αυτή η κατανομή επινοήθηκε από τον μηχανικό- υδρολόγο Ponnambalam
Kumaraswamy. Εχει πολλές ομοιότητες με την κατανομή Beta και αρκετά συχνά
χρησιμοποιείται αντ’ αυτης λογω της απλούστερης εξίσωσης της συνάρτησης
πιθανότητας και της αθροιστικής συνάρτησης.
Παρόλο που έχει κοινά χαρακτηριστικά με την Beta, η χρήση και οι εφαρμογές της
δεν είναι διαδεδομένες.
Συνάρτηση Πυκνότητας Πιθανότητας
)(
)1(***
)(
1
21
1
1
21
ab
aa
z
a
zaa
xf
−
−
=
−−
Συμβολισμός Χ~ Kumaraswamy(α1,α2, α, b)
Αθροιστική Συνάρτηση Πιθανότητας
21)1(1)(
aa
zxF −−=
Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤ , z=
ab
ax
−
−
,
α1,α2 (shape parameter)
Παρατηρήσεις
Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Η Kumaraswamy είναι φθίνουσα συνάρτηση
Για α1>1 και α2 ≤ 1 ή α2=1 α2<1 Η Kumaraswamy είναι αύξουσα συνάρτηση
Για α1<1 και α2<1 Η Kumaraswamy κατανομή έχει σχήμα U (U-shaped). Μοιάζει
με το παρακάτω γράφημα γυρνώντας το ανάποδα
Για α1=1 και α2>2 Η Kumaraswamy κατανομή είναι κυρτή
Για α1=1 και α2=2 Η Kumaraswamy κατανομή είναι ευθεία γραμμή
Για α1=1 και 1< α2<2 Η Kumaraswamy κατανομή είναι κοίλη
Για α1>2 και α2=1 Η Kumaraswamy κατανομή είναι κυρτή
Για α1=2 και α2=1 Η Kumaraswamy κατανομή είναι ευθεία γραμμή
Για 1< α1<2 και α2=1 Η Kumaraswamy κατανομή είναι κοίλη
Για α1>1, α2>1 Η Kumaraswamy είναι unimodal (Έχει δηλαδή μια επικρατούσα
τιμη)
ΓΡΑΦΗΜΑ KUMARASWAMY ΚΑΤΑΝΟΜΗΣ
Probability Density Function
Histogram Kumaraswamy
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
Στα παρακάτω γραφήματα συγκρίνουμε την κανονική κατανομή με τις υπόλοιπες
κατανομές ώστε να κατανοήσουμε τις διαφορές τους. Στο κάτω μέρος του κάθε
γραφήματος γίνεται επεξήγηση των κατανομών.
ΓΡΑΦΗΜΑ (Κανονική-Johnson SU- LogNormal κατανομες)
Probability Density Function
Histogram Lognormal (3P) Normal Johnson SU
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Error- Logistic κατανομές)
Probability Density Function
Histogram Error Logistic Normal
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Gamma- Weibull κατανομές)
Probability Density Function
Histogram Normal Weibull (3P) Gamma (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Gen. Extreme Value- Pearson 6 κατανομές)
Probability Density Function
Histogram Gen. Extreme Value Normal
Pearson 6 (4P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Fatigue Life- Erlang κατανομές)
Probability Density Function
Histogram Normal Erlang (3P) Fatigue Life (3P)
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Beta- Kumaraswamy κατανομές)
Probability Density Function
Histogram Normal Kumaraswamy Beta
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
ΓΡΑΦΗΜΑ (Κανονική-Laplace- Cauchy κατανομές)
Probability Density Function
Histogram Cauchy Laplace Normal
x
0,060,040,020-0,02-0,04-0,06
f(x)
0,32
0,28
0,24
0,2
0,16
0,12
0,08
0,04
0
Από τα γραφήματα διαπιστώνουμε ότι όλες σχεδόν οι κατανομές συγκλίνουν
ουσιαστικά με την κανονική κατανομή. Σε πολλές περιπτώσεις μάλιστα συμπίπτουν
εξ’ ολόκληρου με την προσέγγιση της κανονικής κατανομής. Οι μοναδικές που έχουν
μερικές ουσιαστικές διαφοροποιήσεις είναι η Laplace και η Cauchy, όπου είναι
περισσότερο λεπτοκυρτες από τις υπόλοιπες.
Τελειώνοντας να τονίσουμε ότι το πρόγραμμα Easy Fit 5.1 εχει την δυνατότητα
σύγκρισης των κατανομών με τρία κριτήρια ώστε να επιλέξουμε ποια από όλες
προσαρμόζεται καλύτερα στα δεδομένα μας. Τα κριτήρια που χρησιμοποιούνται είναι
οι στατιστικές Kolmogorov-Smirnov, Anderson-Darling και η Chi-Squared, Καθεμία
επικεντρώνεται σε διαφορετικά γνωρίσματα και χαρακτηριστικά και εξάγει
διαφορετικά αποτελέσματα. Ωστόσο είναι στην διακριτική ευχέρεια του αναλυτή να
δώσει βαρύτητα στα κριτήρια που επιθυμεί και να επιλέξει τη στατιστική μέθοδο με
την οποία θα γίνει η σύγκριση των κατανομών. Παρακάτω ακολουθεί ο πίνακας με
την ταξινόμηση των κατανομών.
Goodness of Fit – Summary
Distribution
Kolmogorov
Smirnov
Anderson
Darling
Chi-Squared
Statistic Rank Statistic Rank Statistic Rank
Normal 0,05615 1 0,23175 9 1,5421 5
Beta 0,05627 2 0,22765 8 1,5311 2
Pearson 6 (4P) 0,05665 3 0,22592 6 1,5333 3
Fatigue Life (3P) 0,05684 4 0,22559 5 1,5337 4
Johnson SU 0,05764 5 0,19995 1 1,9826 9
Lognormal (3P) 0,05888 6 0,22212 3 2,0897 10
Error 0,05989 7 0,20537 2 1,5881 8
Gen. Extreme Value 0,06144 8 0,27963 11 1,0682 1
Gamma (3P) 0,06228 9 0,22488 4 1,5591 7
Logistic 0,06339 10 0,22756 7 2,2183 11
Weibull (3P) 0,06475 11 0,3477 12 2,5702 12
Kumaraswamy 0,06487 12 0,34846 13 2,5706 13
Erlang (3P) 0,0685 13 0,2426 10 1,5534 6
Cauchy 0,0892 14 1,2244 15 10,665 14
Laplace 0,10541 15 0,87108 14 14,147 15
Στον παραπανω πίνακα έχουμε επιλέξει την ταξινόμηση με τη μέθοδο Kolmogorov-
Smirnov. Σύμφωνα με αυτή τη μέθοδο πρώτη στην κατάταξη (rank) έρχεται η
κανονική κατανομή και ακολουθούν η Beta και η Pearson 6 (4P).
Στη δεύτερη στήλη φαίνονται τα αποτελέσματα με τη μέθοδο Anderson-Darling όπου
πρώτη στην κατάταξη (rank) έρχεται η κατανομή Johnson SU και ακολουθούν η
Error και η Lognormal (3P).
Τέλος, έχουμε τη μέθοδο Chi-Squared, όπου εξάγεται το συμπέρασμα ότι καλύτερη
προσαρμογή επιτυγχάνεται με την κατανομή Gen. Extreme Value και έπονται η Beta
και η Pearson 6 (4P)
----------------ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ
BERNOULLI ΚΑΤΑΝΟΜΗ (BERNOULLI DISTRIBUTION)
Η κατανομή Bernoulli είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής.
Περιγράφει ένα τυχαίο πείραμα με δυο μόνο πιθανά ενδεχόμενα (επιτυχία-αποτυχία).
Μερικά παραδείγματα της Bernoulli κατανομής είναι η ρίψη ενός νομίσματος
(κορώνα-γράμματα), το φύλο ενός παιδιού (αγόρι-κορίτσι) πιθανότητα ευστοχίας
μιας βολής κτλ.
Συνάρτηση Πυκνότητας Πιθανότητας
pxf −=1)( για x=0 και pxf =)( για x=1
Αθροιστική Συνάρτηση Πιθανότητας
pxF −=1)( για x=0 και 1)( =xF για x=1
όπου πιθανότητα 0<p<1 και x={0,1}
Μαθηματική Ελπίδα: E(X)= p
Διακύμανση V(X)= p*(1-p)
ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ (BINOMIAL DISTRIBUTION)
Η διωνυμική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας
μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία -
αποτυχία) και πιθανότητα επιτυχίας p που επαναλαμβάνεται n φορές. Η διωνυμία
κατανομή αποτελεί το άθροισμα των μεταβλητών της Bernoulli.
Παρατήρηση: Για n=1 η δυωνυμική κατανομή καταλήγει στην κατανομή Bernoulli.
Για μεγάλο n η διωνυμική κατανομή συγκλίνει σύμφωνα με το θεώρημα ‘’de
Moivre–Laplace’’ στην κανονική κατανομή με μέση τιμή np και διασπορά np(1 − p)
Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των επιτυχιών. Η
πιθανότητα να έχουμε k επιτυχίες σε n ανεξάρτητα πειράματα με πιθανότητα
επιτυχίας p κάθε φορά είναι:
Συνάρτηση Πυκνότητας Πιθανότητας
xnpxp
x
n
xf −−= ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
)1(**)( , Συμβολισμός Χ ~ Β(n,p)
Αθροιστική Συνάρτηση Πιθανότητας
inpp
n
i
xF −−∑
=
= )1(*
0
)(
Όπου
!)!(
!
xxn
n
x
n
−
=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
, πιθανότητα 0<p<1 και nx ≤≤0
n αριθμός δοκίμων του πειράματος, με Nn∈
p πιθανότητα επιτυχίας 1-p πιθανότητα αποτυχίας, x=0,1,2,….n
(x καλείται διωνυμική τυχαία μεταβλητή)
Μαθηματική Ελπίδα: E(X)=n*p
Διακύμανση V(X)=n*p*(1-p)
Παράδειγμα 1.
Σε μια πολύ το 48% των παιδιών είναι αγόρια (Α) και το 52% κορίτσια (Κ). Αν
επιλέξουμε μια πενταμελή οικογένεια να βρεθούν
ι) Πιθανότητα να έχει μόνο αγόρια.
ιι) Πιθανότητα να έχει ένα κορίτσι
ιιι) Πιθανότητα να έχει τουλάχιστον ένα αγόρι
ιv) Πιθανότητα να έχει το πολύ ένα κορίτσι.
Έστω Α ο αριθμός των αγοριών και Κ ο αριθμός των κοριτσιών. Από τα δεδομένα
του προβλήματος έχουμε ότι το Α είναι τυχαία μεταβλητή λαμβάνοντας τις τιμές
0,1,2,3,4,5 και ακολουθεί την διωνυμική κατανομή Β(5,0.48) Ομοίως και για το Κ
ακολουθεί την διωνυμικη κατανομή Β(5,0.52).
ι) Ρ(Α=5) = = 0.025555 )48.01(*48.0*
5
5 −
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
ιι) Ρ(Κ=1) = = 0.138151 )52.01(*52.0*
1
5 −
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
iii) Ρ(Α≥ 1) = 1-Ρ(Α=0)= 1- = 0.962050 )48.01(*48.0*
0
5 −
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
iv) Ρ(Κ 1) = Ρ(Κ=0) + Ρ(Κ=1) =≤
15)52.01(*152.0*
1
505)52.01(*052.0*
0
5 −−+−− ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
= 0.025+0.138=0.163
(Το πολύ ένα κορίτσι συνεπάγεται ότι θα έχουμε είτε ένα είτε κανένα κορίτσι)
Παράδειγμα 2.
Έστω ότι ένας πωλητής εχει πιθανότητα p=28% να επιτύχει πώληση. Έστω ότι ο
πωλητής σε μια τυχαία ημέρα τηλεφωνεί σε 12 άτομα.
Να υπολογισθούν:
i) Η πιθανότητα να επιτύχει 4 πωλήσεις.
ii) Η πιθανότητα να επιτύχει το πολύ 2 πωλήσεις.
iii) Η πιθανότητα να επιτύχει τουλάχιστον 3 πωλήσεις.
Έστω Χ ο αριθμός πωλήσεων του πωλητή. Η πιθανότητα επιτυχίας των πωλήσεων
ακολουθεί την διωνυμική κατανομή Β(n=12, p=28%).
i) Ρ(Χ=4) = = 0.21974124 )28.01(*28.0*
4
12 −
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
ii) Ρ(Χ≤ 2) = Ρ(Χ=0) + Ρ(Χ=1) + Ρ(Χ=2)
212211210120 )28.01(28.0
2
12
)28.01(28.0
1
12
)28.01(28.0
0
12 −
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛−
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛−
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−+−+−
= 0.3037
iii) Ρ(Χ≥ 3) = 1- Ρ(Χ 2) = 1- 0.3037= 0.6963 (βλ προηγούμενο ερώτημα)≤
POISSON ΚΑΤΑΝΟΜΗ (POISSON DISTRIBUTION)
Η κατανομή Poisson είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής
που περιγράφει τον αριθμό εμφανίσεων ενός γεγονότος σε ένα συγκεκριμένο χρονικό
διάστημα. Έχει πάρει το όνομά της από τον Γάλλο μαθηματικό, Siméon Denis
Poisson, (1781–1840).
Η κατανομή Poisson έχει την παράμετρο λ που δηλώνει τη μέση τιμή αριθμού
εμφανίσεων ενός γεγονότος, οι οποίες είναι ανεξάρτητες της τελευταίας χρονικής
στιγμής εμφάνισης του γεγονότος.
Παρατήρηση: Πρακτικά ισχύει ότι αν πιθανότητα p<0.2 και δείγμα n>20 η
προσέγγιση της μεταβλητής επιτυγχάνεται ικανοποιητικά από την κατανομή Poisson.
Σε άλλες βιβλιογραφίες αναφέρεται ότι η προσέγγιση ισχύει για n>50 και p<0.1
Ορίζουμε την παράμετρο λ= n* p. Όσο το λ αυξάνει η κατανομή Poisson συγκλίνει
στην κανονική κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
!
*
)(
x
ex
xf
λλ −
= Συμβολισμός Χ~ Po(np)
Αθροιστική Συνάρτηση Πιθανότητας
∑
=
−=
x
i
e
i
i
xF
0
*
!
)(
λλ
όπου παράμετρος λ=n*p>0 (n μέγεθος δείγματος, p Πιθανότητα επιτυχίας)
και +∞<≤ x0
Μαθηματική Ελπίδα: E(X)=λ
Διακύμανση V(X)=λ
Παράδειγμα.
1) Η πιθανότητα κάποιος οδηγός να μην έχει θεωρημένη άδεια οδήγησης είναι
p=0.05. Έστω ότι σε μια μέρα έγιναν 50 έλεγχοι. Να βρεθούν
ι) Δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους
ιι) Το πολύ δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους.
Έστω Χ η μεταβλητή που εκφράζει τον αριθμό των οδηγών που δεν έχουν θεωρήσει
το δίπλωμά τους. Επειδή πιθανότητα p=0.05<0.2 και δείγμα n=50>20, η μεταβλητή
προσεγγίζεται από την κατανομή Poisson. Άρα έχουμε ότι λ=n*p=0.05*20 λ=2.5
i) p(X=2)=
!2
*5.2 5,22 −
e
=0.2562
iι) p(X≤ 2)= p(X=0)+ p(X=1)+ p(X=2) =
!0
*5.2 5.20 −
e
+
!1
*5.2 5.21 −
e
+
!2
*5.2 5.22 −
e
=0.5432
2) Έστω σε ένα γραφείο δέχονται 2 φαξ ανα 4 ώρες τα οποία απαντώνται με ρυθμό 2
φαξ ανα 6 ώρες
i) Ποια η πιθανότητα σε μια μέρα να λάβουμε τουλάχιστον 4 φαξ;
ii) Ποια η πιθανότητα να απαντήσουμε σε τρία φαξ σε μια μερα;
iii) Έστω ότι δεν έχουμε κανένα φαξ. Ποια η πιθανότητα να λάβουμε 6 φαξ σε μια
μέρα και να μην προλάβουμε απαντήσουμε σε όλα;
Έστω Χ ο αριθμός των φαξ που λαμβάνουμε κα Υ ο αριθμός των φαξ που απαντάμε
Από τα δεδομένα έχουμε ότι λαμβάνουμε 2 φαξ/ 4 ώρες 12 φαξ/ 24ώρες. Επίσης
απαντάμε σε 2 φαξ/6ωρες 8 φαξ/24 ώρες
Αρά θα έχουμε ότι Χ~Ρο(λ1=12|24ωρες) και Υ~Ρο(λ2=8|24ωρες)
i) ==≥ )4(XP )3(1 ≤− XP
)]0()1()2()3([1 =+=+=+=− XPXPXPXP =
]
!0
12
*
!1
12
*
!2
12
*
!3
12
*[1
0
12
1
12
2
12
3
12 −−−−
+++− eeee =
=+++− −
]
!0
12
!1
12
!2
12
!3
12
[*1
0123
12
e
=+++− −
]112144288[*1 12
e
1-0.0027=0,9973
ii) Ρ(Υ=3) =
!3
8
*
3
8−
e = 0,0286
iii) =<Υ= )66( καιXP Ρ(Χ=6) * Ρ(Υ<6) =
)]0()1()2()3()4()5([*)
!6
12
*(
6
12
=+=+=+=+=+=−
YPYPYPYPYPYPe
]
!0
8
*
!1
8
*
!2
8
*
!3
8
*
!4
8
*
!5
8
*[*)
!6
12
*(
0
8
1
8
2
8
3
8
4
8
5
8
6
12 −−−−−−−
+++++ eeeeeee = 0,0048
ΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (GEOMETRIC DISTRIBUTION)
Η γεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας
μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία -
αποτυχία) και πιθανότητα επιτυχίας p.
Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των δοκιμών. Η
πιθανότητα να χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα
p κάθε δοκιμης είναι:
Συνάρτηση Πυκνότητας Πιθανότητας
xppxf )1(*)( −= Συμβολισμός Χ~Ge(p)
Αθροιστική Συνάρτηση Πιθανότητας
1)1(1)( +−−= xpxF
όπου πιθανότητα 0<p<1 και +∞<≤ x0
Μαθηματική Ελπίδα: E(X)=
p
1
Διακύμανση V(X)= 2
1
p
p−
Με άλλα λόγια, προσπαθούμε να υπολογίσουμε την πιθανότητα να έχουμε επιτυχία
στην n-οστη δόκιμη έπειτα από n-1 αποτυχίες, με πιθανότητα επιτυχίας της κάθε
δόκιμης ιση με p.
Παράδειγμα.
1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 1 μετά από 5 ρίψεις;
Αρχικά υπολογίζουμε την πιθανότητα να φέρουμε 1. Όπως γνωρίζουμε, η πιθανότητα
να φέρουμε οποιοδήποτε αριθμό ενός ζαριού είναι p=1/6 (ισοπίθανα ενδεχόμενα).
Άρα έχουμε ότι
p = 1/6. Πιθανότητα (επιτυχία) για να φέρουμε 1
q = 1-1/6=5/6. Πιθανότητα (αποτυχία) για να φέρουμε οποιοδήποτε άλλο αριθμό
εκτός από το 1.
Υποθέτουμε ότι x είναι α αριθμός των αποτυχιών πριν την επιτυχία. Άρα, θεωρώντας
ότι η 5η
ρίψη είναι επιτυχής (δηλαδή στην 5η
ρίψη θα φέρουμε 1) θα έχουμε ότι x=4
(αποτυχίες).
Με τα δεδομένα αυτά p=1/6, q=5/6 και x=4 έχουμε ότι
P(x)= 4
)
6
5
(*
6
1
= 0,0803. Η πιθανότητα να φέρουμε 1 στην 5η
ρίψη είναι p=0.0803
2) Ένας παίχτης μπάσκετ ρίχνει βολές με επιτυχία 93%. Ποια η πιθανότητα να μην
αστοχήσει μέχρι την 20η
βολή;
Από τα δεδομένα του προβλήματος καταλαβαίνουμε θα πρέπει να υπολογίσουμε την
πιθανότητα ο παίχτης να ευστοχήσει σε 19 βολές και να αστοχήσει στην 20η
βολή.
Στην περίπτωση αυτού του προβλήματος, ο συλλογισμός μας θα λειτουργήσει
αντίστροφα. Ο ορισμός της γεωμετρικής κατανομής είναι ο εξής: ‘’Η πιθανότητα να
χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα p σε κάθε
δοκιμή’’.
Άρα στην περίπτωσή μας η επιτυχής δοκιμή είναι να αστοχήσει στην βολή, ενώ η
αποτυχία είναι να ευστοχεί στις βολές.
Συνοψίζοντας έχουμε ότι
Εύστοχη Βολή Αποτυχία με πιθανότητα q=0.93
Άστοχη Βολή Επιτυχία με πιθανότητα p=1-q =0.07
x=19 εύστοχες βολές (αποτυχία)
Ρ(x)= 0.07*0.9319
= 0.0176. Η πιθανότητα να μην αστοχήσει μέχρι την 20η
βολή είναι
0.0176
ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (HYPERGEOMETRIC DISTRIBUTION)
Η υπεργεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας
μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία -
αποτυχία) σε πεπερασμένο πληθυσμό που επαναλαμβάνεται n φορές χωρίς
επαναφορά.
Η κατανομή γίνεται εύκολα κατανοητή με την περιγραφή ενός μοντέλου κάλπης:
Θεωρούμε μια κάλπη με Ν μπάλες από τις οποίες οι m είναι λευκές (επιτυχίες) και
Ν-m μαύρες (αποτυχίες). Από την κάλπη παίρνουμε χωρίς επαναφορά n μπάλες. Η
υπεργεωμετρική κατανομή μας δίνει την πιθανότητα οι x από αυτές να είναι λευκές.
Συνάρτηση Πυκνότητας Πιθανότητας
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
−
−
⎟
⎠
⎞
⎜
⎝
⎛
=
n
N
xn
mN
x
m
xf
*
)( , Συμβολισμός X ~ h(N,m,n)
Αθροιστική Συνάρτηση Πιθανότητας
∑
= ⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
−
−
⎟
⎠
⎞
⎜
⎝
⎛
=
x
i
n
N
in
mN
i
m
xF
0
*
)(
Μαθηματική Ελπίδα: E(X)=
N
mn*
Διακύμανση V(X)=
)1(*
)(*)(**
2
−
−−
NN
nNmNmn
Όπου n Μέγεθος δείγματος , m Αριθμός επιτυχιών πληθυσμού,
N Μέγεθος πληθυσμού, x Αριθμός επιτυχιών δείγματος
Ισχύουν επίσης ότι
max(0, n+m-N)< x <min(n,m) , 0<n N≤ , 0<m N≤
Υπενθυμίζουμε επίσης ότι
!)!(
!
bba
a
b
a
−
=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
Παρατήρηση. Αν η επιλογή γίνεται με επαναφορά τότε η μεταβλητή ακολουθεί την
Διωνυμικη Κατανομή (βλ. αντίστοιχη ενότητα). Επίσης για n=1 η υπεργεωμετρική
κατανομή συμπίπτει με την Bernoulli. Για υψηλές τιμές των Ν, m οι οποίες είναι
επίσης συγκριτικά υψηλές με το n και για πιθανότητα p η οποία δεν είναι κοντά στο 0
ή 1, τότε η υπεργεωμετρική κατανομή προσεγγίζει την κανονική.
Παράδειγμα
1) Υποθέτουμε ότι σε ένα δοχείο έχουμε 50 βόλους. Από αυτούς 5 είναι άσπροι ναι
45 μαύροι. Επιλεγούμε στην τύχη 10 βόλους χωρίς επαναφορά στο δοχείο. Ποια η
πιθανότητα να έχουμε 4 άσπρους από τους 10 βόλους που επιλέξαμε;
Από τα δεδομένα του προβλήματος έχουμε ότι
Μέγεθος πληθυσμού Ν=50
Μέγεθος δείγματος n=10
Αριθμός επιτυχιών πληθυσμού m=5 (Υπάρχουν 5 άσπροι βόλοι)
Αριθμός επιτυχιών δείγματος x=4 (Θέλουμε να επιλέξουμε 4 άσπρους βόλους)
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
−
−
⎟
⎠
⎞
⎜
⎝
⎛
=
10
50
410
550
*
4
5
)(xf =
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
10
50
6
45
*
4
5
=……=0.0039
Η πιθανότητα να έχουμε 4 άσπρους βόλους από τους 10 βόλους που επιλέξαμε είναι
0.0039
2) Διαθέτουμε μια τράπουλα 52 φύλλων. Επιλεγούμε 8 φύλλα χωρίς επαναφορά.
Ποια η πιθανότητα να έχουμε 2 Βαλέδες στα 8 φύλλα;
(Η τράπουλα διαθέτει τους αριθμούς 1,2,3….,10 και τις 3 φιγούρες στα τέσσερα
χρώματα: καρό, μπαστούνι, σπαθί και κούπα. Σύνολο 52 τραπουλόχαρτα)
Από τα δεδομένα του προβλήματος έχουμε ότι
Μέγεθος πληθυσμού Ν=52
Μέγεθος δείγματος n=8
Αριθμός επιτυχιών πληθυσμού m=4 (Μια τράπουλα έχει 4 Βαλέδες)
Αριθμός επιτυχιών δείγματος x=2 (Θέλουμε να επιλέξουμε 2 Βαλέδες)
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
−
−
⎟
⎠
⎞
⎜
⎝
⎛
=
8
52
28
452
*
2
4
)(xf =
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
8
52
6
48
*
2
4
=……=0.0978
Η πιθανότητα να έχουμε 2 Βαλέδες στα 8 επιλεγμένα φύλλα είναι p=0.0978
ΛΟΓΑΡΙΘΜΙΚΗ ΚΑΤΑΝΟΜΗ (LOGARITHMIC DISTRIBUTION)
Συνάρτηση Πυκνότητας Πιθανότητας
)1ln(*
)(
θ
θ
−
−
=
x
x
xf , Συμβολισμός Χ~log(θ)
Αθροιστική Συνάρτηση Πιθανότητας
∑
=−
−
=
x
xF
1
*
)1ln(
1
)(
ι ι
ιθ
θ
όπου παράμετρος 0<θ<1 και +∞<≤ x1
Μαθηματική Ελπίδα: E(X)=
)1(*)1ln( pp
p
−−
−
Διακύμανση V(X)=
)1(ln*)1(
)1ln(
* 22
pp
pp
p
−−
−+
−
ΠΑΡΑΡΤΗΜΑ
Το excel διαθέτει τις εξης κατανομές, οι οποίες είναι αρκετά εύκολες στη χρήση τους.
1) Κατανομή Beta
Αθροιστική Συνάρτηση Πιθανότητας BETADIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας BETAINV
2) Κατανομή Nomral
Αθροιστική Συνάρτηση Πιθανότητας NORMDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας NORMINV
3) Κατανομή X2
Αθροιστική Συνάρτηση Πιθανότητας CHIDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας CHIINV
4) Κατανομή F
Αθροιστική Συνάρτηση Πιθανότητας FDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας FINV
5) Κατανομή Gamma
Αθροιστική Συνάρτηση Πιθανότητας GAMMADIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας GAMMAINV
6) Κατανομή T-student (Παρομοια με την Κανονιμη. Χρησιμοποιειται όταν εχουμε
μικρο αριθμο παρατηρησεω, λιγοτερες από 50)
Αθροιστική Συνάρτηση Πιθανότητας ΤDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας ΤINV
7) Διωνυμικη BINOMDIST
8) Υπεργεωμετρικη HYPDEOMDIST
9) Poisson POISSON
ΑΝΑΦΟΡΕΣ- ΒΙΒΛΙΟΓΡΑΦΙΑ
Πιθανότητες και στατιστική (J. Fourastie- F. Laslier)
Στατιστικές Μέθοδοι ( Δονάτος Γ.- Χομπας Β.)
Πιθανότητες και στατιστική (Δάρας Τ.)
Θεωρία πιθανοτήτων και εφαρμογές (Χαραλαμπιδης Χ.)
Θεωρία Πιθανοτήτων 1 - Λογισμός Πιθανοτήτων Τυχαίων Γεγονότων
(Αθανασόπουλος Δ.)
Wikipedia
Manual Easy Fit 5.1
Manual Excel 2003

Weitere ähnliche Inhalte

Was ist angesagt?

η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολήη ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
ksealexa
 

Was ist angesagt? (20)

Ασκήσεις στα Όρια-Συνέχεια Συνάρτησης Γ' Λυκείου ΕΠΑΛ
Ασκήσεις στα Όρια-Συνέχεια Συνάρτησης Γ' Λυκείου ΕΠΑΛΑσκήσεις στα Όρια-Συνέχεια Συνάρτησης Γ' Λυκείου ΕΠΑΛ
Ασκήσεις στα Όρια-Συνέχεια Συνάρτησης Γ' Λυκείου ΕΠΑΛ
 
Επαναληπτικό διαγώνισμα Β Λυκείου Άλγεβρα - Πολυώνυμα
Επαναληπτικό διαγώνισμα Β Λυκείου Άλγεβρα - ΠολυώνυμαΕπαναληπτικό διαγώνισμα Β Λυκείου Άλγεβρα - Πολυώνυμα
Επαναληπτικό διαγώνισμα Β Λυκείου Άλγεβρα - Πολυώνυμα
 
Βασικά τριγωνομετρικά όρια - Εργασία μαθητών
Βασικά τριγωνομετρικά όρια - Εργασία μαθητώνΒασικά τριγωνομετρικά όρια - Εργασία μαθητών
Βασικά τριγωνομετρικά όρια - Εργασία μαθητών
 
ΑΕΠΠ - Λογικές Εκφράσεις
ΑΕΠΠ - Λογικές ΕκφράσειςΑΕΠΠ - Λογικές Εκφράσεις
ΑΕΠΠ - Λογικές Εκφράσεις
 
ΘΕΩΡΙΕΣ ΜΑΘΗΣΗΣ
ΘΕΩΡΙΕΣ ΜΑΘΗΣΗΣΘΕΩΡΙΕΣ ΜΑΘΗΣΗΣ
ΘΕΩΡΙΕΣ ΜΑΘΗΣΗΣ
 
Σημειώσεις στα πολυώνυμα για προχωρημένους!!
Σημειώσεις στα πολυώνυμα για προχωρημένους!! Σημειώσεις στα πολυώνυμα για προχωρημένους!!
Σημειώσεις στα πολυώνυμα για προχωρημένους!!
 
Ας μιλήσουμε για τη σύνθεση των συναρτήσεων - Εισήγηση ΕΜΕ Λάρισας 2019
Ας μιλήσουμε για τη σύνθεση των συναρτήσεων - Εισήγηση ΕΜΕ Λάρισας 2019Ας μιλήσουμε για τη σύνθεση των συναρτήσεων - Εισήγηση ΕΜΕ Λάρισας 2019
Ας μιλήσουμε για τη σύνθεση των συναρτήσεων - Εισήγηση ΕΜΕ Λάρισας 2019
 
ερευνητικη γραπτη εργασια
ερευνητικη γραπτη εργασιαερευνητικη γραπτη εργασια
ερευνητικη γραπτη εργασια
 
η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολήη ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
η ομαδοσυνεργατική μέθοδος διδασκαλίας και η συμβολή
 
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)75 ερωτήσεις Σ-Λ  στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
75 ερωτήσεις Σ-Λ στο Κεφάλαιο 1ο Ανάλυσης (word+mathtype)
 
Εφαρμογές νέφους (cloud computing)
Εφαρμογές νέφους (cloud computing)Εφαρμογές νέφους (cloud computing)
Εφαρμογές νέφους (cloud computing)
 
Αρχές Οικονομίας Α' Λυκείου (18 διαγωνίσματα)
Αρχές Οικονομίας Α'  Λυκείου (18 διαγωνίσματα)Αρχές Οικονομίας Α'  Λυκείου (18 διαγωνίσματα)
Αρχές Οικονομίας Α' Λυκείου (18 διαγωνίσματα)
 
'Αλγεβρα Β λυκείου,συστήματα
'Αλγεβρα Β λυκείου,συστήματα'Αλγεβρα Β λυκείου,συστήματα
'Αλγεβρα Β λυκείου,συστήματα
 
[Φυσική Α´ Λυκείου] Φυλλάδιο για την Ευθύγραμμη Κίνηση
[Φυσική Α´ Λυκείου] Φυλλάδιο για την Ευθύγραμμη Κίνηση[Φυσική Α´ Λυκείου] Φυλλάδιο για την Ευθύγραμμη Κίνηση
[Φυσική Α´ Λυκείου] Φυλλάδιο για την Ευθύγραμμη Κίνηση
 
Φύλλα εργασίας Β Γυμνασίου 2020
Φύλλα εργασίας Β Γυμνασίου 2020Φύλλα εργασίας Β Γυμνασίου 2020
Φύλλα εργασίας Β Γυμνασίου 2020
 
Σημειώσεις μαθηματικών θετικής Κατεύθυνσης Β΄ Λυκείου
Σημειώσεις μαθηματικών θετικής Κατεύθυνσης Β΄ ΛυκείουΣημειώσεις μαθηματικών θετικής Κατεύθυνσης Β΄ Λυκείου
Σημειώσεις μαθηματικών θετικής Κατεύθυνσης Β΄ Λυκείου
 
η δύναμη της ομάδας! Ομαδοσυνεργατική μέθοδος.pptx
η δύναμη της ομάδας! Ομαδοσυνεργατική μέθοδος.pptxη δύναμη της ομάδας! Ομαδοσυνεργατική μέθοδος.pptx
η δύναμη της ομάδας! Ομαδοσυνεργατική μέθοδος.pptx
 
ρυθμιστικά διαλύματα
ρυθμιστικά διαλύματαρυθμιστικά διαλύματα
ρυθμιστικά διαλύματα
 
συνολο τιμων συναρτησησ
συνολο τιμων συναρτησησσυνολο τιμων συναρτησησ
συνολο τιμων συναρτησησ
 
Βασικές ανισότητες και ερμηνεία από τις γραφικές παραστάσεις
Βασικές ανισότητες και ερμηνεία από τις γραφικές παραστάσειςΒασικές ανισότητες και ερμηνεία από τις γραφικές παραστάσεις
Βασικές ανισότητες και ερμηνεία από τις γραφικές παραστάσεις
 

Ähnlich wie Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα.

στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2
Kozalakis
 
Lesson 8 spss lab
Lesson 8 spss labLesson 8 spss lab
Lesson 8 spss lab
nansouko
 
Τεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευσηΤεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευση
Stesia Papavasileiou
 
S3 drast 1_μπουραζανη_αφροδιτη
S3 drast 1_μπουραζανη_αφροδιτηS3 drast 1_μπουραζανη_αφροδιτη
S3 drast 1_μπουραζανη_αφροδιτη
sixry1934
 
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).pptΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
EfthimisDimakis1
 

Ähnlich wie Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα. (20)

Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.
Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.
Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.
 
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
Εφαρμογές Οικονομικών-Μαθηματικών με χρήση excel 2003. Θεωρία και πράξη.
 
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
Στατιστική 1 για τους φοιτητές του ΕΚΠΑ
 
Στατιστική - Διαφάνειες - Μάθημα 3ο
Στατιστική - Διαφάνειες - Μάθημα 3οΣτατιστική - Διαφάνειες - Μάθημα 3ο
Στατιστική - Διαφάνειες - Μάθημα 3ο
 
Important Probability distributions (in Greek)
Important Probability distributions (in Greek)Important Probability distributions (in Greek)
Important Probability distributions (in Greek)
 
Απλά Στατιστικά Εργαλεία Η/Υ
Απλά Στατιστικά Εργαλεία Η/ΥΑπλά Στατιστικά Εργαλεία Η/Υ
Απλά Στατιστικά Εργαλεία Η/Υ
 
Mg ed1 ed4_ekf_plus_lys
Mg ed1 ed4_ekf_plus_lysMg ed1 ed4_ekf_plus_lys
Mg ed1 ed4_ekf_plus_lys
 
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
Σημειώσεις Στατιστική Μαθηματικά Γενικής Παιδείας
 
Στατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4οΣτατιστική - Διαφάνειες - Μάθημα 4ο
Στατιστική - Διαφάνειες - Μάθημα 4ο
 
Nonlinear dynamics and chaos in neural networks course project
Nonlinear dynamics and chaos in neural networks course projectNonlinear dynamics and chaos in neural networks course project
Nonlinear dynamics and chaos in neural networks course project
 
στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2στατιστική μέτρα θέσης 2
στατιστική μέτρα θέσης 2
 
Lesson 8 spss lab
Lesson 8 spss labLesson 8 spss lab
Lesson 8 spss lab
 
1_Εισαγωγή_στο_SPSS
1_Εισαγωγή_στο_SPSS1_Εισαγωγή_στο_SPSS
1_Εισαγωγή_στο_SPSS
 
Didakt lathi
Didakt lathiDidakt lathi
Didakt lathi
 
Τεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευσηΤεχνολογίες πολυμέσων στην εκπαίδευση
Τεχνολογίες πολυμέσων στην εκπαίδευση
 
S3 drast 1_μπουραζανη_αφροδιτη
S3 drast 1_μπουραζανη_αφροδιτηS3 drast 1_μπουραζανη_αφροδιτη
S3 drast 1_μπουραζανη_αφροδιτη
 
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-ΥποδείξειςΔιαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
Διαγωνίσματα Στατιστικής Γ' Λυκείου ΕΠΑΛ Απαντήσεις-Υποδείξεις
 
194441315 στατιστικη
194441315 στατιστικη194441315 στατιστικη
194441315 στατιστικη
 
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).pptΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
ΜΑΘΗΜΑ2 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ (14).ppt
 
Προβλέψεις ΕΠΑΛ 2019
Προβλέψεις ΕΠΑΛ 2019 Προβλέψεις ΕΠΑΛ 2019
Προβλέψεις ΕΠΑΛ 2019
 

Mehr von stratos goumas

Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
stratos goumas
 
Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.
stratos goumas
 
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
stratos goumas
 
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
stratos goumas
 
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
stratos goumas
 
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
stratos goumas
 
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
stratos goumas
 
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
stratos goumas
 

Mehr von stratos goumas (18)

Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
Επενδυτικές ιδέες για χαμηλά, μεσαία εισοδήματα και αρχάριους.
 
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdfBitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
Bitcoin. Είναι εφικτό να γίνει ο διάδοχος του δολαρίου;.pdf
 
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
Ασαφής Λογική (Fuzzy Logic). Βασικές αρχές και θεωρία. Ανάπτυξη εφαρμογής της...
 
Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.Τεχνικές εκτίμησης κινδύνου.
Τεχνικές εκτίμησης κινδύνου.
 
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριώνΤεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
Τεχνική και Θεμελιώδης Ανάλυση μετοχών και εταιριών
 
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξηΣχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
Σχηματισμός χαρτοφυλακίου με χρήση Excel. Θεωρία και πράξη
 
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
Ομήρου Οδύσσεια και θεωρία παιγνίων. Γνώριζε η Πηνελοπη από στρατηγική;
 
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
Παρουσίαση: Γραμμικός Προγραμματισμός (Αλγόριθμος Simplex). Λύση δυο προβλημά...
 
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
Εξέλιξη του Δείκτη Τιμών Τροφίμων κατά τη διάρκεια των ετών 1990-2012.
 
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
Διαχρονική εξέλιξη των τιμών του πετρελαίου και της βενζίνης.
 
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
Εξέλιξη ελληνικών τραπεζικών καταθέσεων κατά τη διάρκεια των ετών 2001-2010.
 
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
Σύγκριση κύκλου εργασιών δέκα πολυεθνικών εταιριών με το ΑΕΠ δέκα κρατών και ...
 
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
Λογιστική- Χρηματοοικονομική ανάλυση με χρήση αριθμοδεικτών. Περίπτωση ναυτιλ...
 
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
Ανάλυση και μελέτη του δείκτη ανθρώπινης ανάπτυξης (HDI) μεταξύ ανεπτυγμένων,...
 
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
Αναλογία εργαζομένων ελληνικού δημοσίου τομέα σε σχέση με δεκαπέντε πολυεθνικ...
 
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
Παρουσίαση και μελέτη μακροοικονομικών μεγεθών κρατών της Ε.Ε., ΗΠΑ και Ιαπων...
 
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
Επίδραση και αλληλεξάρτηση μεταξύ των μεγαλυτέρων χρηματαγορών. Σχέση μακροχρ...
 
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
Η επίδραση των διακυμάνσεων της τιμής του πετρελαίου στις χρηματιστηριακές απ...
 

Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα.

  • 1. Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα. Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος. MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’ Team Site: A.E.A.C. Co. Project Manager-Site Administrator e-mail: s_4goum@yahoo.com , My Blog, Twitter 16/07/2011 ΕΙΣΑΓΩΓΗ Η στατιστική αποτελεί ένα επιστημονικό κλάδο όπου το πεδίο εφαρμογής της συγκαταλέγεται σε πλήθος άλλων επιστημών. Η συλλογή και η ανάλυση δεδομένων έχει γίνει πλέον επιτακτική πριν τη λήψη αποφάσεων. Έτσι λοιπόν σε μια επιχείρηση/ οργανισμό οι ερευνητές ασχολούνται με τη συλλογή και την επεξεργασία στατιστικών στοιχείων ώστε να διευκολύνουν τα υπόλοιπα στελέχη στη λήψη ορθών αποφάσεων όπου θα ωφελήσουν την πορεία την επιχείρησης. Ένας βασικός κλάδος της στατιστικής είναι η κατανόηση των στατιστικών κατανομών. Οι κατανομές αποτελούν ένα μαθηματικό υπόδειγμα μοντελοποίησης των στατιστικών δεδομένων. Τα μαθηματικά μοντέλα απαλλάσσουν τους ερευνητές από περιορισμός και τους επιτρέπουν να εργαστούν και να αναπτύξουν θεωρίες υπό ιδανικές συνθήκες. Σκοπός των κατανομών είναι να προσομοιωθεί μια σειρά δεδομένων με βάση ένα μαθηματικό μοντέλο το οποίο έχει συγκεκριμένες ιδιότητες. Η κατανόηση και η μοντελοποίηση του συνόλου υπό μια στατιστική κατανομή έχει πολλαπλά οφέλη όπως 1) Είναι δυνατή η πρόβλεψη των μελλοντικών τιμών της σειράς 2) Κατανόηση των περιγραφικών μεγεθών (μέση τιμή, διακύμανση, διάμεσος κτλ), το οποίο συνεπάγεται ότι υπάρχει η δυνατότητα να κατανοούμε εκ των πρότερων της εξέλιξη της σειράς. 3) Μοντελοποίηση πολλαπλών σειρών σε πιο σύνθετα υποδείγματα με γνώστες ιδιότητες. 4) Έχοντας γνώση των αδυναμιών του εκάστοτε μοντέλου/ κατανομής έχουμε τη δυνατότητα διόρθωσης αυτών των σφαλμάτων και των αποτελεσμάτων.
  • 2. ΠΕΡΙΛΗΨΗ Στην παρουσιαση αυτή θα επιδείξουμε μερικες βασικές στατιστικές κατανομές που χρησιμοποιούνται ευρέως καθώς και μερικές πιο προχωρημένες. Οι κατανομές κατηγοριοποιούνται σε δυο βασικές ομάδες. 1) Διακριτές 2) Συνεχείς. Οι Συνεχείς χωρίζονται στις εξής υποομάδες α) Φραγμένες β) Μη Φραγμένες 3) Μη Αρνητικές. Διακριτή Κατανομή. Η μεταβλητή λαμβάνει μεμονωμένες τιμές σε ένα διάστημα [α,β]. Παράδειγμα. 1) Αριθμός παιδιών (0,1,2,3, κτλ), 2) Φορολογικός Συντελεστής (0%, 10%, 30%, 40%). Μεταξύ αυτών των μεμονωμένων τιμών ΔΕΝ λαμβάνονται άλλες τιμές. Τουτέστιν, δεν είναι δυνατό να υπάρξουν 2.5 παιδιά. Επίσης δεν είναι δυνατό (προς το παρόν) να υπάρξει Φορολογικός Συντελεστής 10.78%. Συνεχής Κατανομή. Η μεταβλητή λαμβάνει οποιεσδήποτε τιμές μεταξύ δυο μεμονωμένων τιμών σε ένα διάστημα [α,β]. Όταν η κατανομή είναι συνεχής τότε η πιθανότητα Ρ υπολογίζεται ως ∫=<< b a dxxfbxaP )()( Παράδειγμα. 1) Ηλικία (15, 50, 60 κτλ), 2)Ύψος (1.75, 1.80, 1.90 κτλ). Μεταξύ αυτών των μεμονωμένων τιμών λαμβάνονται όλες οι ενδιάμεσες τιμές. Δηλαδή, υφίστανται ηλικίες 20 ετών και 2 μηνών, 35 ετών 5 μηνών και 4 ημερών κτλ. Ομοίως υπάρχει τιμή ύψους 1.76, 1.77, 1.80 και 4 χιλιοστά κτλ Συνεχής Κατανομή (Μη Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές τιμές στο διάστημα (-∞,+∞). Συνεχής Κατανομή (Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές τιμές στο διάστημα [α,β] Συνεχής Κατανομή (Μη αρνητική). Οι περισσότερες μη αρνητικές κατανομές ορίζονται για x>γ ετσι ώστε x-γ>0, όπου γ είναι συνεχής παράμετρος. Για την παρουσίαση των συνεχών στατιστικών κατανομών έχουμε χρησιμοποιήσει κυρίως το πρόγραμμα Easy Fit 5.1 καθώς και μερικές στατιστικές συναρτήσεις του excel. Το Easy Fit 5.1 περιλαμβάνει περίπου 50 κατανομές, οπότε ο ενδιαφερόμενος έχει μεγάλο εύρος επιλογής. Κατά την άποψή μου, είναι ένα πλήρες πρόγραμμα οπότε είναι βέβαιο ότι οι δυνατότητες του θα εξυπηρετήσουν τις ανάγκες που εκάστοτε ενδιαφερομένου.
  • 3. Για τις διακριτές κατανομές θα παρουσιάσουμε παραδείγματα και εφαρμογές σε κάθε ενότητα. Για τις συνεχείς κατανομής έχουμε χρησιμοποιήσει τις αποδόσεις μιας μετοχής λαμβάνοντας δεδομένα για 4 μήνες. Σκοπός μας είναι χρησιμοποιώντας το πρόγραμμα Easy Fit 5.1 να μελετήσουμε και να κατανοήσουμε την προσαρμογή των συνεχών κατανομών στα δεδομένα που διαθέτουμε. Κατανομές που διαθέτει το Easy Fit 5.1. Συνεχείς Φραγμένες: Beta, Johnson SB, Kumaraswamy, Pert, Power Function, Reciprocal, Triangular, Uniform, Συνεχείς Μη Φραγμένες: Cauchy, Error, Gumbel Max Gumbel Min, Hyperbolic Secant, Johnson SU, Laplace (Double Exponential), Logistic, Normal, t-Student Συνεχείς Μη Αρνητικές Burr, Levy, Gamma, Inverse Gaussian, F Distribution, Fatigue Life (Birnbaum-Saunders), Frechet, Chi-Squared, Dagum, Erlang, Exponential, Weibull, Rice, Rayleigh, Pearson, Pareto, Nakagami, Lognormal, Log-Logistic, Log-Gamma. Διακριτές: Bernoulli, Binomial Discrete Uniform, Geometric, Hypergeometric, Logarithmic, Negative Binomial, Poisson. Προχωρημένες Κατανομές: Generalized Extreme Value, Generalized Logistic, Generalized Pareto, Phased Bi-Exponential, Phased Bi-Weibull, Wakeby. Στην παρουσίασή μας δεν είναι δυνατόν να αναλύσουμε λεπτομερώς όλες τις παραπανω κατανομές. Θα επιλέξουμε μερικές από αυτές οι οποίες έχουν ευρεία χρήση και εφαρμογή. Εξάλλου πολλές από αυτές προσεγγίζονται ικανοποιητικά από την κανονική κατανομή, όπως θα εξηγήσουμε παρακάτω, οπότε έχουμε την ευχέρεια να χρησιμοποιούμε την κανονική κατανομή στην περίπτωση που αντιμετωπίζουμε δυσκολίες με τη χρήση άλλων πιο εξειδικευμένων κατανομών.
  • 4. ----------------ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ Α) ΜΗ ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ [διάστημα (-∞, +∞)] ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ (Laplace-Gauss ή NORMAL DISTRIBUTION) Η κανονική κατανομή είναι η πιο συνήθης συνεχής συνάρτηση κατανομής. Επινοήθηκε από τον Gauss και χρησιμοποιείται για να περιγράψει μεγέθη που είναι συγκεντρωμένα γύρω από μια μέση τιμή. Η κανονική κατανομή, γνωστή και ως ‘’καμπάνα’’, προσαρμόζεται σε δεδομένα όπου υποθέτουμε ότι η κατανομή είναι μεσοκυρτη (βαθμός κυρτωσης=3) και συμμετρική (βαθμός ασυμμετριας=0) Η σημασία της προέρχεται κυρίως από το κεντρικό οριακό θεώρημα, σύμφωνα με το οποίο το άθροισμα μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων μεταβλητών είναι κανονικά κατανεμημένο. Συνάρτηση Πυκνότητας Πιθανότητας1 (σ.π.π.) 2 )(* 2 1 2* 1 )( σ μ πσ −− = x exf , Συμβολισμός Χ~Ν(μ,σ) 1 Συνάρτηση Πυκνότητας Πιθανότητας- Probability Density Function Αθροιστική Συνάρτηση Πιθανότητας- Cumulative Distribution Function
  • 5. Αθροιστική Συνάρτηση Πιθανότητας1 F(x)= ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − Φ σ μx , Φ είναι το ολοκλήρωμα Laplace // Φ(x)= dte x t ∫ − 0 2 2 * 2 1 π Εναλλακτικά με μετασχηματισμό έχουμε ότι F(x)=z= σ μ−x , Όπου σ>0 (scale parameter/ τυπική απόκλιση), R∈μ (location parameter/ μέση τιμή) και +∞<<∞− x ΓΡΑΦΗΜΑ NORMAL ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Normal x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 Ορισμός Αν η τυχαία μεταβλητή Χ~ Ν(μ,σ2 ) τότε για τα κατωθι διαστήματα ισχύει [μ-σ, μ+σ] 68.28% [μ-2σ, μ+2σ] 95.44% [μ-3σ, μ+3σ] 99.75%
  • 6. Παράδειγμα 1) Έστω μια μεταβλητή Χ ακολουθεί την κανονική κατανομή Χ~Ν(8,9). Να βρεθεί η πιθανότητα .)105( ≤≤ XP Από τα δεδομένα έχουμε ότι μ=8 και σ2 =9 Χρησιμοποιώντας τον μετασχηματισμό z= σ μ−x θα έχουμε ότι z= 3 85 − = -1 z= 3 810 − = 0.66 Άρα θα έχουμε ότι )105( ≤≤ XP = =)66,01( ≤≤− zP )66,0( ≤zP - )1( −≤zP = -)66,0( ≤zP ))1(1( ≤− zP
  • 7. 0,7454-(1-0,8413) = 0,8413 (βλ. πινάκες της κανονικής κατανομής από βιβλία στατιστικής ) Για να κατανοήσουμε την παραπανω διαδικασία έχουμε σχεδιάσει προσεγγιστικά το εξής γράφημα, όπου ουσιαστικά έχουμε υπολογίσει το εμβαδόν από το (-∞, 0.66) και το εμβαδόν από το (-∞, -1). Έπειτα αφαιρώντας αυτά τα δυο εμβαδά υπολογίσουμε το εμβαδόν στο (-1, 0.66) 2) Έστω Χ~Ν(3,σ2 ) και έχουμε επίσης ότι .7291,0)5,1( =≥XP Να βρεθεί το σ2 Από τον μετασχηματισμό z= σ μ−x έχουμε ότι z= σ 35,1 − z= σ 5,1− .7291,0)5,1( =≥XP z= 0.61 (Βλ. πινάκες της κανονικής κατανομής από βιβλία στατιστικής) Επειδή όμως z<0, (εξ ορισμού τυπική απόκλιση (σ) > 0), λογω συμμετρίας θα έχουμε z= -0.61 Αρά -0.61= σ 5,1− σ=2,46 (Αν καταλήγαμε ότι σ<0 οφείλουμε να ελέγξουμε για την ύπαρξη σφάλματος στην διαδικασία μας))
  • 8. ΛΟΓΙΣΤΙΚΗ ΚΑΤΑΝΟΜΗ (LOGISTIC DISTRIBUTION) Συνάρτηση Πυκνότητας Πιθανότητας 2 )1(* )( ze ze xf −+ − = σ , Συμβολισμός X~Logistic(μ,σ) Αθροιστική Συνάρτηση Πιθανότητας ze xF −+ = 1 1 )( , Όπου σ μ− = x z , σ>0 (scale parameter), R∈μ (location parameter) και +∞<<∞− x Παρατήρηση: Η λογιστική κατανομή εμφανίζει πολλές ομοιότητες με την κανονική κατανομή. Χρησιμοποιείται κυρίως στην περίπτωση που η σειρά προσεγγίζεται από την κανονική κατανομή αλλά εμφανίζει παχιές ουρές 2 . Εφαρμογές Λογιστικής Κατανομής: Επιδημιολογία, Βιολογία (Ρυθμός αύξησης πληθυσμού), Ψυχολογία (Ρυθμός μάθησης) κτλ 2 Παχιές ουρές Πλακυκυρτη (Βαθμός Κυρτωσης<3) Λεπτές ουρές Λεπτοκυρτη (Βαθμός Κυρτωσης>3)
  • 9. ΓΡΑΦΗΜΑ LOGISTIC ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Logistic x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 CAUCHY ΚΑΤΑΝΟΜΗ (CAUCHY DISTRIBUTION) Η κατανομή Cauchy επινοήθηκε από τους Augustin Cauchy και Hendrik Lorentz Τούτη η κατανομή αποτελεί ένα πρότυπο για κατανομές που δεν έχουν μέση τιμή και διακύμανση, εντούτοις η επικρατούσα τιμή και η διάμεσος είναι καλά ορισμένες. Μοιάζει πολύ με την κατανομή Poisson Kernel. Όταν δυο μεταβλητές Χ,Υ ακολουθούν την κανονική κατανομή με μέση τιμή ιση με μηδέν και σταθερή διακύμανση ίση με την μονάδα, τότε το πηλίκο Χ/Υ ακολουθεί την τυπική Cauchy κατανομή.
  • 10. Συνάρτηση Πυκνότητας Πιθανότητας 12)))(1(**()( −− += σ μ σπ x xf , Συμβολισμός X~C(μ,σ) Αθροιστική Συνάρτηση Πιθανότητας 5.0arctan 1 )( + − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ σ μ π x xF όπου σ>0 (scale parameter ) , R∈μ (location parameter) arctan αντίστροφη συνάρτηση εφαπτομένης και +∞<<∞− x ΓΡΑΦΗΜΑ CAUCHY ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Cauchy x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 11. JOHNSON SU ΚΑΤΑΝΟΜΗ (JOHNSON SU DISTRIBUTION) Τούτη η κατανομή που επινοήθηκε από τον Norman Lloyd Johnson (1917-2004). Στην ίδια οικογένεια ανήκουν η Johnson SB και Log-Normal κατανομές. Αυτές οι τρεις κατανομές είναι παρόμοιες με την κανονική κατανομή ωστόσο δεν έχουν τους περιορισμούς της, καθώς διαθέτουν εκείνες τις ιδιότητες που τις καθιστούν ικανές να προσαρμοστούν σε δεδομένα με διάφορες τιμές ασυμμετρίας και κύρτωσης, ιδιότητες τις οποίες δεν διαθέτει η κανονική κατανομή. Η κανονική κατανομή, γνωστή και ως ‘’καμπάνα’’, προσαρμόζεται σε δεδομένα όπου υποθέτουμε ακολουθούν μια κατανομή μεσόκυρτη (βαθμός κυρτωσης=3) και συμμετρική (βαθμός ασυμετριας=0). Ωστόσο, επειδή στην πράξη τούτο σπάνια συμβαίνει, οι προαναφερθείσες κατανομές είναι ιδανικές σε περιπτώσεις όπου δεν ισχύουν οι υποθέσεις της κανονικής κατανομής. Ειδικότερα για τις λεπτοκυρτες κατανομές, οι Johnson SB, Johnson, SU και Log-Normal είναι αποτελεσματικότερες και πιο ιδανικές από την κανονική. Συνάρτηση Πυκνότητας Πιθανότητας 2 ))12ln(*(*5.0 *)( 1*2* 2 +++− + = zz exf z δγ πλ δ , Συμβολισμός Χ~ Jsu(γ,δ,λ,ξ)
  • 12. Αθροιστική Συνάρτηση Πιθανότητας ))1ln(* 2 ()( +++Φ= zzxF δγ όπου λ ξ− = x z , Φ Ολοκλήρωμα Laplace // Φ(x)= dte x t ∫ − 0 2 2* 2 1 π Επίσης τα γ,δ,λ,ξ είναι παράμετροι με δ,λ>0. ),( +∞−∞∈x γ,δ (shape parameter), λ (scale parameter), ξ (location parameter) ΓΡΑΦΗΜΑ JOHNSON SU ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Johnson SU x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 13. LAPLACE ή DOUBLE EXPONENTIAL ΚΑΤΑΝΟΜΗ (LAPLACE ή DOUBLE EXPONENTIAL DISTRIBUTION) Τούτη η κατανομή επινοήθηκε από τον Pierre-Simon Laplace. Ονομάζεται και double exponential (διπλή εκθετική) κατανομή διοτι το γράφημά της μοιάζει με δυο εκθετικές κατανομές η μια διπλά στην άλλη και συμμετρικές ως προς τον κατακόρυφο άξονα.. Από μαθηματικής απόψεως έχει κοινά χαρακτηριστικά με την κανονική κατανομή καθώς η μεν Laplace εκφράζεται σε απόλυτες διαφορές η δε κανονική σε διαφορές τετραγώνων (βλ τα αντίστοιχα ‘’Συνάρτηση Πυκνότητας Πιθανότητας’’). Συνάρτηση Πυκνότητας Πιθανότητας ||* *)( 2 μλλ −− = x exf , Συμβολισμός Χ~ Laplace(μ,λ) Αθροιστική Συνάρτηση Πιθανότητας μ μ μλ μλ >− ≤ = −− −− xe x e xF x x )(* )(* * 2 1 1 * 2 1 )( Όπου λ, μ είναι παράμετροι με λ>0. ),( +∞−∞∈x λ (scale parameter ) , μ (location parameter)
  • 14. ΓΡΑΦΗΜΑ LAPLACE ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Laplace x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 LOG-NORNAL ΚΑΤΑΝΟΜΗ με 3- παραμέτρους (LOG-NORNAL DISTRIBUTION 3Ρ) Μια μεταβλητή Χ ακολουθεί την Log-Normal κατανομή όταν ο λογάριθμός της ακολουθεί την κανονική κατανομή. Μια μεταβλητή είναι πιθανό να ακολουθεί την Log-Normal κατανομή όταν είναι αποτέλεσμα πολλών τυχαίων θετικών μεταβλητών. Συνήθως οι χρηματοοικονομικές σειρές3 (μετοχές, παράγωγα κτλ) προσεγγίζονται ικανοποιητικά από την Log-Normal κατανομή. Επίσης έχει παρατηρηθεί ότι οι λογάριθμοι βιολογικών μεταβλητών (μήκος μαλλιών/ νυχιών, ύψος, βάρος, πίεση) τείνουν να ακολουθούν την κανονική κατανομή) 3 Για μετοχές ισχύει συνήθως το εξής: Όταν η απόδοση μια μετοχής ακολουθει την κανονική κατανομή τότε η τιμή ακολουθει την Log-Normal κατανομή
  • 15. Συνάρτηση Πυκνότητας Πιθανότητας πσγ σ μγ *2**)( )( 2)ln( *5.0 − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −− − x xf x e , Συμβολισμός Χ~ LogN(μ,σ,γ) Αθροιστική Συνάρτηση Πιθανότητας ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −− Φ= σ μγ )ln( )( x xF Φ Ολοκλήρωμα Laplace // Φ(x)= dte x t ∫ − 0 2 2* 2 1 π Όπου σ, μ, γ είναι παράμετροι με σ>0. ),( +∞∈ γx σ (scale parameter ), μ (shape parameter), γ (location parameter) Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Log-Normal κατανομή 2-παραμετρων (Log-Normal 2Ρ). Το τυπολογιο των συναρτήσεων των πιθανοτήτων της Log-Normal 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
  • 16. ΓΡΑΦΗΜΑ LOG-NORMAL ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Lognormal (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 GAMMA ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (GAMMA 3Ρ DISTRIBUTION) Τούτη η κατανομή προσεγγίζει συχνά μοντέλα μεταβλητών αναμονής (waiting time models). Λόγου χάρη, η αναμονή μέχρι την απεβίωση, ο υπολογισμός του ρυθμού της βροχόπτωσης και οι ασφαλιστικές αποζημιώσεις είναι μερικές μεταβλητές που προσεγγίζονται από την Gamma κατανομή. Συνάρτηση Πυκνότητας Πιθανότητας β γ α α αβ γ )( 1 * )(* )( )( −− − Γ − = x e x xf , Συμβολισμός Χ~ Γ(α,β,γ)
  • 17. Αθροιστική Συνάρτηση Πιθανότητας )( )( /)( )( α αβγ Γ Γ − = x xF Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta x −− ∫ * 0 1 Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx α (shape parameter), β (scale parameter) , γ (location parameter) Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Gamma κατανομή 2-παραμετρων (Gamma 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της Gamma 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0 Αν Ζ∈α τότε η Gamma κατανομή αναπαριστά την Erlang κατανομή ΓΡΑΦΗΜΑ GAMMA ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Gamma (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 18. WEIBULL ΚΑΤΑΝΟΜΗ με 3-παραμέτρους (WEIBULL 3Ρ DISTRIBUTION) Τούτη η κατανομή περιγράφθηκε ολοκληρωμένα και από τον Waloddi Weibull (1887-1979), ωστόσο υπήρχαν και προγενέστερες αναφορές από άλλους επιστήμονες. Έχει κοινά χαρακτηριστικά με την Εκθετική (Exponential) και την Rayleigh κατανομή. Πιο συγκεκριμένα, παρεμβάλλεται μεταξύ της Εκθετικής (α=1) και της Rayleigh (α=2). Η Weibull κατανομή υπολογίζει τον ρυθμό αποτυχίας ενός ενδεχόμενου για ένα χρονικό διάστημα. Για α<1, ο ρυθμός αποτυχίας φθίνει καθώς ο χρόνος κυλάει, για α=1 ο ρυθμός αποτυχία είναι σταθερός, ενώ για α>1 ο ρυθμός αποτυχίας αυξάνει με το πέρασμα του χρόνου. (βλ. παρακάτω το τυπολόγιο) Η Weibull κατανομή χρησιμοποιείται στην βιομηχανία για να περιγράψει το χρόνο κατασκευής και παράδοσης ενός προϊόντος, στην μετεωρολογία, στις τηλεπικοινωνίες κ.α. Συνάρτηση Πυκνότητας Πιθανότητας α β γα β γ β α ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − − − = x e x xf **)( 1 , Συμβολισμός Χ~ W(α,β,γ) Αθροιστική Συνάρτηση Πιθανότητας α β γ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − −= x exF 1)( Όπου α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx α (shape parameter), β (scale parameter) , γ (location parameter)
  • 19. Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Weibull κατανομή 2-παραμετρων (Weibull 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της Weibull 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0 ΓΡΑΦΗΜΑ WEIBULL ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Weibull (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 FATIGUE LIFE ΚΑΤΑΝΟΜΗ ή (Birnbaum–Saunders) με 3-παραμέτρους (FATIGUE LIFE 3Ρ DISTRIBUTION) Τούτη η κατανομή επινοήθηκε για να προσδιοριστεί η αποτυχία στον κύκλο ζωής μιας κατασκευής εξαιτίας των φθορών. Με το μοντέλο αυτό, είναι δυνατό να εντείνουμε το ρυθμό των φθορών ώστε να προσεγγιστεί το μέγεθος εκείνο που θα προκαλέσει την κατάρρευση της κατασκευής. Στην ιδία κατηγορία με αυτή την κατανομή ανήκουν η Lognormal, Exponential and Weibull.
  • 20. Χρησιμοποιείται κυρίως για να καθοριστεί η ζημία σε μηχανικά, ηλεκτρολογικά, οικοδομικά υλικά, στις ασφαλιστικές απαιτήσεις αλλά και στα σοκ των αγορών. Συνάρτηση Πυκνότητας Πιθανότητας ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − − − − + − = γ β β γ α φ γ γ β β γ x x xa x x xf * 1 * )(**2 )( Συμβολισμός Χ~ BS(α,β,γ) Αθροιστική Συνάρτηση Πιθανότητας ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − − Φ= γ β β γ α x x xF * 1 )( Όπου Φ Ολοκλήρωμα Laplace // Φ(x)= dte x t ∫ − 0 2 2* 2 1 π φ π*2 2 2x e − α, β, γ είναι παράμετροι με α,β>0, R∈γ ),( +∞∈ γx α (shape parameter), β (scale parameter) , γ (location parameter)
  • 21. Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Fatigue Life κατανομή 2-παραμετρων (Fatigue Life 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της Fatigue Life 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0 ΓΡΑΦΗΜΑ FATIGUE LIFE ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Fatigue Life (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 ERLANG ΚΑΤΑΝΟΜΗ με 3 παραμέτρους (ERLANG 3Ρ DISTRIBUTION) Η κατανομή Erlang επινοήθηκε από τον μαθηματικό Agner Krarup Erlang (1878 – 1929). Ανήκει στην ίδια οικογένεια και έχει πολλές ομοιότητες με την Gamma και Exponential κατανομή. Αρχικά χρησιμοποιήθηκε από τον Agner Krarup Erlang για να μελετήσει τον ρυθμό των τηλεφωνικών κλήσεων που γίνονται την ίδια ώρα σε ένα σταθμό. Μετέπειτα εφαρμόστηκε στις στοχαστικές διαδικασίες και τα βιομαθηματικά.
  • 22. Παρατηρώντας προσεκτικά το τυπολόγιο της Erlang και της Gamma κατανομής θα διαπιστώσουμε ότι πρόκειται για ακριβώς τις ίδιες εξισώσεις με την μόνη διαφορά ότι η shape parameter της Erlang (m) ανήκει στους θετικούς ακέραιους αριθμούς ενώ η shape parameter της Gamma (α) ανήκει στους θετικούς αριθμούς. Εναλλακτικά μπορεί να ειπωθεί ότι η Erlang αποτελεί ειδική περίπτωση της Gamma. Να σημειώσουμε επιπλέον ότι για m=1 η Erlang καταλήγει στην Exponential κατανομή. Συνάρτηση Πυκνότητας Πιθανότητας β γ β γ )( 1 * )(* )( )( −− − Γ − = x m e mm x xf , Συμβολισμός Χ~ Erlang(m,β,γ) Αθροιστική Συνάρτηση Πιθανότητας )( )( /)( )( m m x xF Γ Γ − = βγ Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta x −− ∫ * 0 1 Όπου m, β, γ είναι παράμετροι με m *N∈ , β>0, R∈γ ),( +∞∈ γx m (shape parameter), β (scale parameter) , γ (location parameter) Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Erlang κατανομή 2- παραμετρων (Erlang 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της Erlang 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
  • 23. ΓΡΑΦΗΜΑ ERLANG ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Erlang (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 ΕΚΘΕΤΙΚΗ ΚΑΤΑΝΟΜΗ (EXPONENTIAL DISTRIBUTION) Η εκθετική κατανομή χρησιμοποιείται πρωτίστως για να περιγράψει τα χρονικά διαστήματα που μεσολαβούν μεταξύ δυο γεγονότων μιας Poisson διαδικασίας. Μπορεί επίσης να εφαρμοστεί σε πειράματα φυσικής (π.χ. παρατήρηση της μεταβολής του όγκου ενός αερίου με σταθερή θερμοκρασία), στην υδρολογία για να υπολογιστεί ο ρυθμός βροχόπτωσης για μια συγκεκριμένη χρονική περίοδο, στις τηλεπικοινωνίες, στην μηχανική για να εξεταστεί η σταθερότητα ενός συστήματος, στο οδικό δίκτυο για να μελετηθεί ο ρυθμός ατυχημάτων κ.α. Το μειονέκτημα της εκθετικής κατανομής είναι ότι υποθέτουμε ένα σταθερό ρυθμό μεταβολής ίσο με λ. Ωστόσο, αν επιλεγεί εκ των πρότερων ένα χρονικό διάστημα όπου είναι γνωστό ότι ο ρυθμός μεταβολής είναι σταθερός ή περίπου σταθερός τότε η εκθετική κατανομή προσεγγίζει αρκετά ικανοποιητικά τις παρατηρήσεις.
  • 24. Συνάρτηση Πυκνότητας Πιθανότητας )(* exp*)( γλ λ −− = x xf , Συμβολισμός Χ~ Exp(λ,γ) Αθροιστική Συνάρτηση Πιθανότητας )(* exp1)( γλ −− −= x xF Όπου λ, γ είναι παράμετροι λ>0, R∈γ ),( +∞∈ γx λ (scale parameter) , γ (location parameter) ΓΡΑΦΗΜΑ ΕΚΘΕΤΙΚΗΣ ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Exponential (2P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 25. PEARSON TYPE 6 ΚΑΤΑΝΟΜΗ 4- ΠΑΡΑΜΕΤΡΟΙ (PEARSON TYPE 6 4Ρ DISTRIBUTION) Αυτή η κατανομή επινοήθηκε από τον Άγγλο μαθηματικό Karl Pearson (1857-1936) και χρησιμοποιήθηκε αρχικά για μελέτες βιοστατιστικης. Μετέπειτα και με την εξέλιξη των υπολογιστών εφαρμόστηκε στις χρηματοοικονομικές αναλύσεις, στην συμπεριφορά των αποδοσεων των μετοχών, στα επιτόκια, στις συναλλαγματικές ισοτιμίες, στις συχνότητα των πλημμύρων και των σεισμών κτλ. Είναι επίσης ιδιαίτερα χρήσιμη στις περιπτώσεις όπου η κατανομή εμφανίζει διάφορες μορφές κύρτωσης. Εκτός από την Pearson Type6 κατανομή προηγήθηκαν 5 ακόμα τύποι κατανομών οι όποιοι είτε βελτίωναν είτε συμπλήρωναν είτε επέκτειναν τις δυνατότητες τις προηγούμενης εξίσωσης της κατανομής. Σε ότι αφόρα την σχέση της με τις υπόλοιπες κατανομές, έχει αποδειχτεί ότι εμφανίζει αρκετές ομοιότητες με την Cauchy, Κανονική, Βeta, Gamma, X2 και την F κατανομή. Συνάρτηση Πυκνότητας Πιθανότητας 21*) 21 1 1 ))(1(,(* )( )( aa a b x aaBb b x xf + − − + − = γ γ Συμβολισμός Χ~ Pearson6(α1,α2, b,γ) Αθροιστική Συνάρτηση Πιθανότητας ),()( 21 aaIxF bx x +− − = γ γ
  • 26. Όπου α1, α2, b, γ είναι παράμετροι με α1,α2,b>0 , +∞≤≤ xγ α1,α2 (shape parameter) , b (scale parameter), γ (location parameter) B Συνάρτηση Beta: B(α1,α2)= dtt aa t∫ −− − 1 0 11 21 )1(* Iz Κανονικοποιημένη ‘’Ατελής’’ Συνάρτηση Beta: Ix= ),( ),( 21 21 aaB aaBx Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Pearson κατανομή 3-παραμετρων (Pearson 3Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της Pearson 3Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0 ΓΡΑΦΗΜΑ PEARSON TYPE 6 ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Pearson 6 (4P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 27. GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ (GENERALIZED EXTREME VALUE DISTRIBUTION) Η generalized extreme value κατανομή αναπτύχθηκε παράλληλα με τον κλάδο της στατιστικής που αφορά την θεωρία ακραίων τιμών (extreme value theory). Αρχικά τέτοιου είδους σειρές μελετήθηκαν από τους Fisher και Tippett, (1928) οι οποίοι περιέγραψαν το πρώτο θεώρημα ακραίων τιμών και αργότερα από τον Gnedenko (1943) ο οποίος περιέγραψε το δεύτερο θεώρημα ακραίων τιμών. Η κατανομή αυτή αποσκοπεί να συνδυάσει τις οικογένειες των κατανομών Gumbel, Fréchet και Weibull καθώς συσχετίζει παραδοχές και από τις τρεις αυτές κατανομές. Είναι εξαιρετικά χρήσιμη για τη μελέτη φαινομένων που δεν παρουσιάζονται συχνά και αντιμετωπίζονται ως ακραία. Εφαρμόζεται για την μελέτη και την πρόβλεψη γιγαντιαίων κυμάτων (τσουναμι), για πυρκαγιές μεγάλης έκτασης πλημμύρες- κατακλυσμούς, στα χρηματοοικονομικά, στην μέτρηση του χρηματοοικονομικού- πιστωτικού κινδύνου, στον υπολογισμό της πιθανότητας μεγάλων αποζημιώσεων κτλ. Από υπολογιστικής πλευράς, θα μπορούσαμε να αναφέρουμε ότι χρησιμοποιείται συχνά σε σειρές που εμφανίζουν μεγάλη και ασυνήθιστη διακύμανση. Συνάρτηση Πυκνότητας Πιθανότητας 0 * 1 0 * 1 )( )( 1 1 )*1(* 1 )*1( = ≠ = − −− −− + − +− k e k e xf z ez kzkkzk σ σ Συμβολισμός Χ~ GEV(μ,σ,k)
  • 28. Αθροιστική Συνάρτηση Πιθανότητας 0 0 )( )( 1 )*1( = ≠ = − −− − +− k e k e xF z ez kzk Όπου z= σ μ−x , σ>0 001 ≠> − + k x k για σ μ και 0=+∞<<∞− kx για k (shape parameter), σ (scale parameter ) , μ (location parameter) ΓΡΑΦΗΜΑ GENERALIZED EXTREME VALUE ΚΑΤΑΝΟΜΗ Probability Density Function Histogram Gen. Extreme Value x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 29. ERROR ΚΑΤΑΝΟΜΗ (ERROR DISTRIBUTION) Τούτη η κατανομή χρησιμοποιείται κυρίως σε σειρές όπου εμφανίζουν ασυμμετρία ή/ και κύρτωση, εν αντίθεση με την κανονική κατανομή όπου δεν λαμβάνει υπόψη αυτούς τους δυο παράγοντες. Εμφανίζει αρκετές ομοιότητες με την κατανομές Generalized Extreme Value, Weibull, Log-Normal και χρησιμοποιείται σε αρκετές εφαρμογές όπως σε χρηματοοικονομικά μοντέλα, εκτίμηση αποδοσεων για μετοχές, παράγωγα, μοντέλα VaR (Value at Risk) κτλ. Ειδικότερα στα οικονομετρικά μοντέλα GARCH, είναι η συνηθέστερη κατανομή που επιλέγεται για την εκτίμηση των δεδομένων Συνάρτηση Πυκνότητας Πιθανότητας 1 1 1 |* 0 | **)( − − − = zc ecxf σ Συμβολισμός Χ~ Error(μ,σ,k) Αθροιστική Συνάρτηση Πιθανότητας μ μ < Γ Γ − ≥ Γ Γ + = ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ x k k x k k xF k zc k zc ) 1 ( ) 1 ( 1*5.0 ) 1 ( ) 1 ( 1*5.0 )( |* 0 | |* 0 |
  • 30. Όπου 2 1 0 ) 1 ( ) 3 ( ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ Γ Γ = k kc ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ Γ = ) 1 (*2 * 0 1 k ck c σ μ− = x z Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta x −− ∫ * 0 1 +∞<<∞− x , k (shape parameter), σ (scale parameter ) , μ (location parameter) Σημείωση: Για k=2 η Error καταλήγει στην Κανονική κατανομή ενώ για k=1 καταλήγει στην Laplace ΓΡΑΦΗΜΑ ERROR ΚΑΤΑΝΟΜΗ Probability Density Function Histogram Error x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 31. F -ΚΑΤΑΝΟΜΗ (F- DISTRIBUTION) Η κατανομή F επινοήθηκε από τους R.A. Fisher και George W. Snedecor. Εφαρμόζεται κυρίως για στατιστικούς ελέγχους και στην ανάλυση διακύμανσης. Συνάρτηση Πυκνότητας Πιθανότητας 21) 2 * 1 2 1 1* 1 21 ( *)( * ),(* 1 )( νν νν ν ν ν ν νν + + = x x Bx xf Συμβολισμός Χ~ F(ν1,ν2) Αθροιστική Συνάρτηση Πιθανότητας ),()( 21 ννz xF Ι= B Συνάρτηση Beta: B(α1,α2)= dtt aa t∫ −− − 1 0 11 21 )1(* Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix= ),( ),( 21 21 aaB aaBx 21 1 * * νν ν + = x x z +∞<≤ x0 , (ν1,ν2 βαθμοί ελευθερίας)Nvv ∈21 ,
  • 32. Χ2 -ΚΑΤΑΝΟΜΗ (CHI-SQUARED DISTRIBUTION) Η κατανομή X2 αποτελεί το άθροισμα των τετραγώνων κ ανεξάρτητων μεταβλητών οι οποίες ακολουθούν την κανονική κατανομή. Εφαρμόζεται κυρίως για στατιστικούς ελέγχους, τεστ υποθέσεων και την κατασκευή των διαστημάτων εμπιστοσύνης. Να σημειώσουμε επίσης ότι η X2 αποτελεί μια ειδική περίπτωση της κατανομής Gamma. Συνάρτηση Πυκνότητας Πιθανότητας ) 2 (*2 *)( )( 2 2 )( 12 ν γ ν γν Γ − = −− − x ex xf Συμβολισμός Χ~ Χ2 (ν,γ) Αθροιστική Συνάρτηση Πιθανότητας ) 2 ( ) 2 ( ) 2 ( )( ν ν Γ Γ = x xF Γx(α) ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = dtet ta x −− ∫ * 0 1 Γ(α) Συνάρτηση Gamma// Γ(α) = dtet ta −− ∫ ∞ * 0 1 Όπου ν βαθμοί ελευθερίας // Ν∈ν , R∈γ , ),( +∞∈ γx γ (location parameter) Σημείωση: Για γ=0 καταλήγουμε στην X2 με μια παράμετρο.
  • 33. B) ΦΡΑΓΜΕΝΕΣ ΚΑΤΑΝΟΜΕΣ (διάστημα [α,β]) ΟΜΟΙΟΜΟΡΦΗ ΚΑΤΑΝΟΜΗ (UNIFORM DISTRIBUTION) Η ομοιόμορφη κατανομή είναι μια από τις πιο συχνές και απλές κατανομές που μπορούν να συναντηθούν στις αναλύσεις και τη έρευνα. Είναι επίσης γνωστή με το όνομα ορθογωνική κατανομή εξαιτίας του σχήματός της. Μερικές μεταβλητές που συνήθως ακολουθούν την ομοιόμορφη κατανομή είναι το ύψος, ηλικία και βάρος των μαθητών μιας συγκεκριμένης σχολικής τάξης (π.χ. οι μαθητές τη Γ λυκείου έχουν άλικα από 17-18 ετών με όλες τις ενδιάμεσες τιμές να είναι πιθανές, έχουν περίπου ίδιο ύψος (τόσο τα αγόρια οσο και τα κορίτσια) και περίπου ίδιο βάρος. Άλλο παράδειγμα είναι ο μισθός μιας συγκεκριμένης κατηγορίας υπάλληλων σε μια επιχείρηση (π.χ. υπάλληλοι γραφείου) Τούτη η κατανομή είναι εύκολη στη χρήση της, ενώ παράλληλα το τυπολογιο της είναι εξαιρετικά απλό και εύχρηστο, όπου δεν χρειάζεται η χρήση Η/Υ. Επιπλέον με την χρήση διαφόρων μετασχηματισμών η ομοιόμορφη κατανομή σχετίζεται με την εκθετική, την Beta και την τριγωνική κατανομή Συνάρτηση Πυκνότητας Πιθανότητας ab xf − = 1 )( , Συμβολισμός Χ~ U(a,b) Αθροιστική Συνάρτηση Πιθανότητας ab ax xF − − =)( όπου a<b και a<x<b.
  • 34. Παρατήρηση: To χαρακτηριστικό της ομοιόμορφης κατανομής είναι ότι όλα τα ενδεχόμενα είναι ισοπίθανο να εμφανιστούν. ΓΡΑΦΗΜΑ UNIFORM ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Uniform x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 Παράδειγμα 1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 6; Η πιθανότητα εμφάνισης ενός αριθμού του ζαριού είναι ίση με 1/6, καθώς όλοι οι αριθμοί είναι ισοπίθανο να εμφανιστούν. Άρα η πιθανότητα να φέρουμε 6 είναι p=1/6
  • 35. 2) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε ένα αριθμό μικρότερο του 5; Τα πιθανά ενδεχόμενα είναι να φέρουμε τους αριθμός Α{1,2,3,4} Αρά Ρ(Χ<5)= P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) Ρ(Χ<5)= 1/6 + 1/6 + 1/6 + 1/6 = 4/6 2) Ρίχνουμε δυο ζάρια. Υπολογίστε τις εξής πιθανότητες ι) Το άθροισμα τους να είναι ίσο με 10 ιι) Το άθροισμα τους να είναι μικρότερο από 7 ιιι) Να φέρουμε πεντάρες ιv) Να φέρουμε δυο και τρία Αρχικά κατασκευάζουμε τον παρακάτω πίνακα στον οποίο έχουμε υπολογίσει όλα τα πιθανά αθροίσματα 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 Παρατηρούμε ότι έχουμε 36 (6*6) πιθανά ενδεχόμενα. Έχοντας τούτο υπόψη μας μπορούμε να απαντήσουμε στα ερωτήματα. ι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 3 παρατηρήσεις που έχουν αθροισμα=10. Το σύνολο των παρατηρήσεων είναι 36. Αρά Ρ(S=10)= 3/36
  • 36. ιι) Έστω S το άθροισμα. Από τον παραπάνω πίνακα υπολογίζουμε ότι υπάρχουν 15 παρατηρήσεις που έχουν άθροισμα < 7. Το σύνολο των παρατηρήσεων είναι 36. Αρά Ρ(S<7)= 15/36 ιιι) Η πιθανότητα να φέρουμε πεντάρες υπολογίζεται ως εξής. Πρώτο ζάρι: Ρ(Χ=5)=1/6 και Δεύτερο ζάρι: Ρ(Χ=5)=1/6 (βλ. Παράδειγμα 1) Αρά Ρ(πεντάρες)=1/6*1/6=1/36 Ομοίως από τον παραπανω πίνακα παρατηρούμε ότι ο αριθμός ‘’5’’ των Στηλών και ο αριθμός ‘’5’’ των Γραμμών τέμνονται μια μόνο φορά. Γενικά όλα τα διπλά νούμερα (άσσοι, δίπλες, τριάρες…..) έχουν πιθανότητα p=1/36 να εμφανιστούν ιv) Ο συλλογισμός είναι ίδιος όπως στο προηγούμενο ερώτημα Πρώτο ζάρι: Ρ(Χ=2)=1/6 και Δεύτερο ζάρι: Ρ(Χ=3)=1/6 Ρ(2,3)= 1/6*1/6 Όμως θα έχουμε ακόμα ότι Πρώτο ζάρι: Ρ(Χ=3)=1/6 και Δεύτερο ζάρι: Ρ(Χ=2)=1/6 Ρ(3,2)= 1/6*1/6 Αρά Ρ(ολικό)=Ρ(2,3)+Ρ(3,2)=1/6*1/6+1/6*1/6=1/36+1/36=2/36 Ομοίως στο ίδιο συμπέρασμα καταλήγουμε από τον παραπανω πίνακα. ΒΕΤΑ ΚΑΤΑΝΟΜΗ (ΒΕΤΑ DISTRIBUTION) Τούτη η κατανομή χρησιμοποιείται κυρίως για να περιγράψει την κατανομή μιας μεταβλητής με άγνωστη πιθανότητα. Τυπικά περιγράφει την εκ των πρότερων (a-priori)4 κατανομή μιας πιθανότητας όπως την πιθανότητα επιτυχώς ενός πειράματος (Διωνυμικη, Bernoulli κατανομή). Στην πραγματικότητα η Beta κατανομή είναι ένα συνονθύλευμα της Διωνυμικής με την Bernoulli κατανομή. 4 A-Priori Οι πιθανότητες των ενδεχομένων είναι γνώστες εκ των πρότερων. π.χ. Ρίψη ενός ζαριού Α-Posteriori (εμπειρική πιθανότητα) Οι πιθανότητες των ενδεχομένων είναι γνωστές αφού ολοκληρωθεί το πείραμα. Π.χ. Σουτ από την γραμμή των βολών σε έναν αγώνα μπάσκετ.
  • 37. Συνάρτηση Πυκνότητας Πιθανότητας 1 )( 1 )(* 1 )( * ,( 1 )( 21 21 ) 21 −+ − − − − − = aa ab a xb a ax aaB xf Συμβολισμός Χ~ Βeta(α1,α2, α, b) Αθροιστική Συνάρτηση Πιθανότητας ),()( 21 aaIxF z = Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤ α1,α2 (shape parameter) B Συνάρτηση Beta: B(α1,α2)= dtt aa t∫ −− − 1 0 11 21 )1(* Iz Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix= ),( ),( 21 21 aaB aaBx
  • 38. Παρατηρήσεις Για α1= α2=1 Η Beta κατανομή καταλήγει στην ομοιόμορφη κατανομή Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Η Beta κατανομή είναι φθίνουσα συνάρτηση Για α1>1 και α2 ≤ 1 ή α2=1 α2<1 Η Beta κατανομή είναι αύξουσα συνάρτηση Για α1<1 και α2<1 Η Beta κατανομή έχει σχήμα U (U-shaped). Μοιάζει με το παρακάτω γράφημα γυρνώντας το ανάποδα Για α1=1 και α2>2 Η Beta κατανομή είναι κυρτή Για α1=1 και α2=2 Η Beta κατανομή είναι ευθεία γραμμή Για α1=1 και 1< α2<2 Η Beta κατανομή είναι κοίλη Για α1>2 και α2=1 Η Beta κατανομή είναι κυρτή Για α1=2 και α2=1 Η Beta κατανομή είναι ευθεία γραμμή Για 1< α1<2 και α2=1 Η Beta κατανομή είναι κοίλη Για α1>1, α2>1 Η Beta είναι unimodal (Έχει δηλαδή μια επικρατούσα τιμη. Γραφικά αυτό ορίζεται με τη συνάρτηση πυκνότητας πιθανότητας να έχει μια μόνο κορυφή. Βλ το παρακάτω γράφημα ‘’unimodal-bimodal’’ ) ΓΡΑΦΗΜΑ BETA ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Beta x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 39. KUMARASWAMY ΚΑΤΑΝΟΜΗ (KUMARASWAMY DISTRIBUTION) Αυτή η κατανομή επινοήθηκε από τον μηχανικό- υδρολόγο Ponnambalam Kumaraswamy. Εχει πολλές ομοιότητες με την κατανομή Beta και αρκετά συχνά χρησιμοποιείται αντ’ αυτης λογω της απλούστερης εξίσωσης της συνάρτησης πιθανότητας και της αθροιστικής συνάρτησης. Παρόλο που έχει κοινά χαρακτηριστικά με την Beta, η χρήση και οι εφαρμογές της δεν είναι διαδεδομένες. Συνάρτηση Πυκνότητας Πιθανότητας )( )1(*** )( 1 21 1 1 21 ab aa z a zaa xf − − = −− Συμβολισμός Χ~ Kumaraswamy(α1,α2, α, b)
  • 40. Αθροιστική Συνάρτηση Πιθανότητας 21)1(1)( aa zxF −−= Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, bxa ≤≤ , z= ab ax − − , α1,α2 (shape parameter) Παρατηρήσεις Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Η Kumaraswamy είναι φθίνουσα συνάρτηση Για α1>1 και α2 ≤ 1 ή α2=1 α2<1 Η Kumaraswamy είναι αύξουσα συνάρτηση Για α1<1 και α2<1 Η Kumaraswamy κατανομή έχει σχήμα U (U-shaped). Μοιάζει με το παρακάτω γράφημα γυρνώντας το ανάποδα Για α1=1 και α2>2 Η Kumaraswamy κατανομή είναι κυρτή Για α1=1 και α2=2 Η Kumaraswamy κατανομή είναι ευθεία γραμμή Για α1=1 και 1< α2<2 Η Kumaraswamy κατανομή είναι κοίλη Για α1>2 και α2=1 Η Kumaraswamy κατανομή είναι κυρτή Για α1=2 και α2=1 Η Kumaraswamy κατανομή είναι ευθεία γραμμή Για 1< α1<2 και α2=1 Η Kumaraswamy κατανομή είναι κοίλη Για α1>1, α2>1 Η Kumaraswamy είναι unimodal (Έχει δηλαδή μια επικρατούσα τιμη)
  • 41. ΓΡΑΦΗΜΑ KUMARASWAMY ΚΑΤΑΝΟΜΗΣ Probability Density Function Histogram Kumaraswamy x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 Στα παρακάτω γραφήματα συγκρίνουμε την κανονική κατανομή με τις υπόλοιπες κατανομές ώστε να κατανοήσουμε τις διαφορές τους. Στο κάτω μέρος του κάθε γραφήματος γίνεται επεξήγηση των κατανομών.
  • 42. ΓΡΑΦΗΜΑ (Κανονική-Johnson SU- LogNormal κατανομες) Probability Density Function Histogram Lognormal (3P) Normal Johnson SU x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 ΓΡΑΦΗΜΑ (Κανονική-Error- Logistic κατανομές) Probability Density Function Histogram Error Logistic Normal x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 43. ΓΡΑΦΗΜΑ (Κανονική-Gamma- Weibull κατανομές) Probability Density Function Histogram Normal Weibull (3P) Gamma (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 ΓΡΑΦΗΜΑ (Κανονική-Gen. Extreme Value- Pearson 6 κατανομές) Probability Density Function Histogram Gen. Extreme Value Normal Pearson 6 (4P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 44. ΓΡΑΦΗΜΑ (Κανονική-Fatigue Life- Erlang κατανομές) Probability Density Function Histogram Normal Erlang (3P) Fatigue Life (3P) x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 ΓΡΑΦΗΜΑ (Κανονική-Beta- Kumaraswamy κατανομές) Probability Density Function Histogram Normal Kumaraswamy Beta x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0
  • 45. ΓΡΑΦΗΜΑ (Κανονική-Laplace- Cauchy κατανομές) Probability Density Function Histogram Cauchy Laplace Normal x 0,060,040,020-0,02-0,04-0,06 f(x) 0,32 0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 Από τα γραφήματα διαπιστώνουμε ότι όλες σχεδόν οι κατανομές συγκλίνουν ουσιαστικά με την κανονική κατανομή. Σε πολλές περιπτώσεις μάλιστα συμπίπτουν εξ’ ολόκληρου με την προσέγγιση της κανονικής κατανομής. Οι μοναδικές που έχουν μερικές ουσιαστικές διαφοροποιήσεις είναι η Laplace και η Cauchy, όπου είναι περισσότερο λεπτοκυρτες από τις υπόλοιπες. Τελειώνοντας να τονίσουμε ότι το πρόγραμμα Easy Fit 5.1 εχει την δυνατότητα σύγκρισης των κατανομών με τρία κριτήρια ώστε να επιλέξουμε ποια από όλες προσαρμόζεται καλύτερα στα δεδομένα μας. Τα κριτήρια που χρησιμοποιούνται είναι οι στατιστικές Kolmogorov-Smirnov, Anderson-Darling και η Chi-Squared, Καθεμία επικεντρώνεται σε διαφορετικά γνωρίσματα και χαρακτηριστικά και εξάγει διαφορετικά αποτελέσματα. Ωστόσο είναι στην διακριτική ευχέρεια του αναλυτή να δώσει βαρύτητα στα κριτήρια που επιθυμεί και να επιλέξει τη στατιστική μέθοδο με την οποία θα γίνει η σύγκριση των κατανομών. Παρακάτω ακολουθεί ο πίνακας με την ταξινόμηση των κατανομών.
  • 46. Goodness of Fit – Summary Distribution Kolmogorov Smirnov Anderson Darling Chi-Squared Statistic Rank Statistic Rank Statistic Rank Normal 0,05615 1 0,23175 9 1,5421 5 Beta 0,05627 2 0,22765 8 1,5311 2 Pearson 6 (4P) 0,05665 3 0,22592 6 1,5333 3 Fatigue Life (3P) 0,05684 4 0,22559 5 1,5337 4 Johnson SU 0,05764 5 0,19995 1 1,9826 9 Lognormal (3P) 0,05888 6 0,22212 3 2,0897 10 Error 0,05989 7 0,20537 2 1,5881 8 Gen. Extreme Value 0,06144 8 0,27963 11 1,0682 1 Gamma (3P) 0,06228 9 0,22488 4 1,5591 7 Logistic 0,06339 10 0,22756 7 2,2183 11 Weibull (3P) 0,06475 11 0,3477 12 2,5702 12 Kumaraswamy 0,06487 12 0,34846 13 2,5706 13 Erlang (3P) 0,0685 13 0,2426 10 1,5534 6 Cauchy 0,0892 14 1,2244 15 10,665 14 Laplace 0,10541 15 0,87108 14 14,147 15 Στον παραπανω πίνακα έχουμε επιλέξει την ταξινόμηση με τη μέθοδο Kolmogorov- Smirnov. Σύμφωνα με αυτή τη μέθοδο πρώτη στην κατάταξη (rank) έρχεται η κανονική κατανομή και ακολουθούν η Beta και η Pearson 6 (4P). Στη δεύτερη στήλη φαίνονται τα αποτελέσματα με τη μέθοδο Anderson-Darling όπου πρώτη στην κατάταξη (rank) έρχεται η κατανομή Johnson SU και ακολουθούν η Error και η Lognormal (3P). Τέλος, έχουμε τη μέθοδο Chi-Squared, όπου εξάγεται το συμπέρασμα ότι καλύτερη προσαρμογή επιτυγχάνεται με την κατανομή Gen. Extreme Value και έπονται η Beta και η Pearson 6 (4P)
  • 47. ----------------ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ BERNOULLI ΚΑΤΑΝΟΜΗ (BERNOULLI DISTRIBUTION) Η κατανομή Bernoulli είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο μόνο πιθανά ενδεχόμενα (επιτυχία-αποτυχία). Μερικά παραδείγματα της Bernoulli κατανομής είναι η ρίψη ενός νομίσματος (κορώνα-γράμματα), το φύλο ενός παιδιού (αγόρι-κορίτσι) πιθανότητα ευστοχίας μιας βολής κτλ. Συνάρτηση Πυκνότητας Πιθανότητας pxf −=1)( για x=0 και pxf =)( για x=1 Αθροιστική Συνάρτηση Πιθανότητας pxF −=1)( για x=0 και 1)( =xF για x=1 όπου πιθανότητα 0<p<1 και x={0,1} Μαθηματική Ελπίδα: E(X)= p Διακύμανση V(X)= p*(1-p)
  • 48. ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ (BINOMIAL DISTRIBUTION) Η διωνυμική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία - αποτυχία) και πιθανότητα επιτυχίας p που επαναλαμβάνεται n φορές. Η διωνυμία κατανομή αποτελεί το άθροισμα των μεταβλητών της Bernoulli. Παρατήρηση: Για n=1 η δυωνυμική κατανομή καταλήγει στην κατανομή Bernoulli. Για μεγάλο n η διωνυμική κατανομή συγκλίνει σύμφωνα με το θεώρημα ‘’de Moivre–Laplace’’ στην κανονική κατανομή με μέση τιμή np και διασπορά np(1 − p) Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των επιτυχιών. Η πιθανότητα να έχουμε k επιτυχίες σε n ανεξάρτητα πειράματα με πιθανότητα επιτυχίας p κάθε φορά είναι: Συνάρτηση Πυκνότητας Πιθανότητας xnpxp x n xf −−= ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ )1(**)( , Συμβολισμός Χ ~ Β(n,p) Αθροιστική Συνάρτηση Πιθανότητας inpp n i xF −−∑ = = )1(* 0 )(
  • 49. Όπου !)!( ! xxn n x n − =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ , πιθανότητα 0<p<1 και nx ≤≤0 n αριθμός δοκίμων του πειράματος, με Nn∈ p πιθανότητα επιτυχίας 1-p πιθανότητα αποτυχίας, x=0,1,2,….n (x καλείται διωνυμική τυχαία μεταβλητή) Μαθηματική Ελπίδα: E(X)=n*p Διακύμανση V(X)=n*p*(1-p) Παράδειγμα 1. Σε μια πολύ το 48% των παιδιών είναι αγόρια (Α) και το 52% κορίτσια (Κ). Αν επιλέξουμε μια πενταμελή οικογένεια να βρεθούν ι) Πιθανότητα να έχει μόνο αγόρια. ιι) Πιθανότητα να έχει ένα κορίτσι ιιι) Πιθανότητα να έχει τουλάχιστον ένα αγόρι ιv) Πιθανότητα να έχει το πολύ ένα κορίτσι. Έστω Α ο αριθμός των αγοριών και Κ ο αριθμός των κοριτσιών. Από τα δεδομένα του προβλήματος έχουμε ότι το Α είναι τυχαία μεταβλητή λαμβάνοντας τις τιμές 0,1,2,3,4,5 και ακολουθεί την διωνυμική κατανομή Β(5,0.48) Ομοίως και για το Κ ακολουθεί την διωνυμικη κατανομή Β(5,0.52). ι) Ρ(Α=5) = = 0.025555 )48.01(*48.0* 5 5 − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ιι) Ρ(Κ=1) = = 0.138151 )52.01(*52.0* 1 5 − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −
  • 50. iii) Ρ(Α≥ 1) = 1-Ρ(Α=0)= 1- = 0.962050 )48.01(*48.0* 0 5 − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − iv) Ρ(Κ 1) = Ρ(Κ=0) + Ρ(Κ=1) =≤ 15)52.01(*152.0* 1 505)52.01(*052.0* 0 5 −−+−− ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = 0.025+0.138=0.163 (Το πολύ ένα κορίτσι συνεπάγεται ότι θα έχουμε είτε ένα είτε κανένα κορίτσι) Παράδειγμα 2. Έστω ότι ένας πωλητής εχει πιθανότητα p=28% να επιτύχει πώληση. Έστω ότι ο πωλητής σε μια τυχαία ημέρα τηλεφωνεί σε 12 άτομα. Να υπολογισθούν: i) Η πιθανότητα να επιτύχει 4 πωλήσεις. ii) Η πιθανότητα να επιτύχει το πολύ 2 πωλήσεις. iii) Η πιθανότητα να επιτύχει τουλάχιστον 3 πωλήσεις. Έστω Χ ο αριθμός πωλήσεων του πωλητή. Η πιθανότητα επιτυχίας των πωλήσεων ακολουθεί την διωνυμική κατανομή Β(n=12, p=28%). i) Ρ(Χ=4) = = 0.21974124 )28.01(*28.0* 4 12 − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ii) Ρ(Χ≤ 2) = Ρ(Χ=0) + Ρ(Χ=1) + Ρ(Χ=2) 212211210120 )28.01(28.0 2 12 )28.01(28.0 1 12 )28.01(28.0 0 12 − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛− ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛− ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −+−+− = 0.3037 iii) Ρ(Χ≥ 3) = 1- Ρ(Χ 2) = 1- 0.3037= 0.6963 (βλ προηγούμενο ερώτημα)≤
  • 51. POISSON ΚΑΤΑΝΟΜΗ (POISSON DISTRIBUTION) Η κατανομή Poisson είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής που περιγράφει τον αριθμό εμφανίσεων ενός γεγονότος σε ένα συγκεκριμένο χρονικό διάστημα. Έχει πάρει το όνομά της από τον Γάλλο μαθηματικό, Siméon Denis Poisson, (1781–1840). Η κατανομή Poisson έχει την παράμετρο λ που δηλώνει τη μέση τιμή αριθμού εμφανίσεων ενός γεγονότος, οι οποίες είναι ανεξάρτητες της τελευταίας χρονικής στιγμής εμφάνισης του γεγονότος. Παρατήρηση: Πρακτικά ισχύει ότι αν πιθανότητα p<0.2 και δείγμα n>20 η προσέγγιση της μεταβλητής επιτυγχάνεται ικανοποιητικά από την κατανομή Poisson. Σε άλλες βιβλιογραφίες αναφέρεται ότι η προσέγγιση ισχύει για n>50 και p<0.1 Ορίζουμε την παράμετρο λ= n* p. Όσο το λ αυξάνει η κατανομή Poisson συγκλίνει στην κανονική κατανομή. Συνάρτηση Πυκνότητας Πιθανότητας ! * )( x ex xf λλ − = Συμβολισμός Χ~ Po(np) Αθροιστική Συνάρτηση Πιθανότητας ∑ = −= x i e i i xF 0 * ! )( λλ όπου παράμετρος λ=n*p>0 (n μέγεθος δείγματος, p Πιθανότητα επιτυχίας) και +∞<≤ x0 Μαθηματική Ελπίδα: E(X)=λ Διακύμανση V(X)=λ
  • 52. Παράδειγμα. 1) Η πιθανότητα κάποιος οδηγός να μην έχει θεωρημένη άδεια οδήγησης είναι p=0.05. Έστω ότι σε μια μέρα έγιναν 50 έλεγχοι. Να βρεθούν ι) Δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους ιι) Το πολύ δυο οδηγοί να μην έχουν θεωρήσει την άδεια τους. Έστω Χ η μεταβλητή που εκφράζει τον αριθμό των οδηγών που δεν έχουν θεωρήσει το δίπλωμά τους. Επειδή πιθανότητα p=0.05<0.2 και δείγμα n=50>20, η μεταβλητή προσεγγίζεται από την κατανομή Poisson. Άρα έχουμε ότι λ=n*p=0.05*20 λ=2.5 i) p(X=2)= !2 *5.2 5,22 − e =0.2562 iι) p(X≤ 2)= p(X=0)+ p(X=1)+ p(X=2) = !0 *5.2 5.20 − e + !1 *5.2 5.21 − e + !2 *5.2 5.22 − e =0.5432 2) Έστω σε ένα γραφείο δέχονται 2 φαξ ανα 4 ώρες τα οποία απαντώνται με ρυθμό 2 φαξ ανα 6 ώρες i) Ποια η πιθανότητα σε μια μέρα να λάβουμε τουλάχιστον 4 φαξ; ii) Ποια η πιθανότητα να απαντήσουμε σε τρία φαξ σε μια μερα; iii) Έστω ότι δεν έχουμε κανένα φαξ. Ποια η πιθανότητα να λάβουμε 6 φαξ σε μια μέρα και να μην προλάβουμε απαντήσουμε σε όλα; Έστω Χ ο αριθμός των φαξ που λαμβάνουμε κα Υ ο αριθμός των φαξ που απαντάμε Από τα δεδομένα έχουμε ότι λαμβάνουμε 2 φαξ/ 4 ώρες 12 φαξ/ 24ώρες. Επίσης απαντάμε σε 2 φαξ/6ωρες 8 φαξ/24 ώρες Αρά θα έχουμε ότι Χ~Ρο(λ1=12|24ωρες) και Υ~Ρο(λ2=8|24ωρες)
  • 53. i) ==≥ )4(XP )3(1 ≤− XP )]0()1()2()3([1 =+=+=+=− XPXPXPXP = ] !0 12 * !1 12 * !2 12 * !3 12 *[1 0 12 1 12 2 12 3 12 −−−− +++− eeee = =+++− − ] !0 12 !1 12 !2 12 !3 12 [*1 0123 12 e =+++− − ]112144288[*1 12 e 1-0.0027=0,9973 ii) Ρ(Υ=3) = !3 8 * 3 8− e = 0,0286 iii) =<Υ= )66( καιXP Ρ(Χ=6) * Ρ(Υ<6) = )]0()1()2()3()4()5([*) !6 12 *( 6 12 =+=+=+=+=+=− YPYPYPYPYPYPe ] !0 8 * !1 8 * !2 8 * !3 8 * !4 8 * !5 8 *[*) !6 12 *( 0 8 1 8 2 8 3 8 4 8 5 8 6 12 −−−−−−− +++++ eeeeeee = 0,0048 ΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (GEOMETRIC DISTRIBUTION) Η γεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία - αποτυχία) και πιθανότητα επιτυχίας p. Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των δοκιμών. Η πιθανότητα να χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα p κάθε δοκιμης είναι:
  • 54. Συνάρτηση Πυκνότητας Πιθανότητας xppxf )1(*)( −= Συμβολισμός Χ~Ge(p) Αθροιστική Συνάρτηση Πιθανότητας 1)1(1)( +−−= xpxF όπου πιθανότητα 0<p<1 και +∞<≤ x0 Μαθηματική Ελπίδα: E(X)= p 1 Διακύμανση V(X)= 2 1 p p− Με άλλα λόγια, προσπαθούμε να υπολογίσουμε την πιθανότητα να έχουμε επιτυχία στην n-οστη δόκιμη έπειτα από n-1 αποτυχίες, με πιθανότητα επιτυχίας της κάθε δόκιμης ιση με p. Παράδειγμα. 1) Ρίχνουμε ένα ζάρι. Ποια η πιθανότητα να φέρουμε 1 μετά από 5 ρίψεις; Αρχικά υπολογίζουμε την πιθανότητα να φέρουμε 1. Όπως γνωρίζουμε, η πιθανότητα να φέρουμε οποιοδήποτε αριθμό ενός ζαριού είναι p=1/6 (ισοπίθανα ενδεχόμενα). Άρα έχουμε ότι p = 1/6. Πιθανότητα (επιτυχία) για να φέρουμε 1 q = 1-1/6=5/6. Πιθανότητα (αποτυχία) για να φέρουμε οποιοδήποτε άλλο αριθμό εκτός από το 1.
  • 55. Υποθέτουμε ότι x είναι α αριθμός των αποτυχιών πριν την επιτυχία. Άρα, θεωρώντας ότι η 5η ρίψη είναι επιτυχής (δηλαδή στην 5η ρίψη θα φέρουμε 1) θα έχουμε ότι x=4 (αποτυχίες). Με τα δεδομένα αυτά p=1/6, q=5/6 και x=4 έχουμε ότι P(x)= 4 ) 6 5 (* 6 1 = 0,0803. Η πιθανότητα να φέρουμε 1 στην 5η ρίψη είναι p=0.0803 2) Ένας παίχτης μπάσκετ ρίχνει βολές με επιτυχία 93%. Ποια η πιθανότητα να μην αστοχήσει μέχρι την 20η βολή; Από τα δεδομένα του προβλήματος καταλαβαίνουμε θα πρέπει να υπολογίσουμε την πιθανότητα ο παίχτης να ευστοχήσει σε 19 βολές και να αστοχήσει στην 20η βολή. Στην περίπτωση αυτού του προβλήματος, ο συλλογισμός μας θα λειτουργήσει αντίστροφα. Ο ορισμός της γεωμετρικής κατανομής είναι ο εξής: ‘’Η πιθανότητα να χρειαστούμε n δοκιμές έως ότου να έχουμε μια επιτυχία με πιθανότητα p σε κάθε δοκιμή’’. Άρα στην περίπτωσή μας η επιτυχής δοκιμή είναι να αστοχήσει στην βολή, ενώ η αποτυχία είναι να ευστοχεί στις βολές. Συνοψίζοντας έχουμε ότι Εύστοχη Βολή Αποτυχία με πιθανότητα q=0.93 Άστοχη Βολή Επιτυχία με πιθανότητα p=1-q =0.07 x=19 εύστοχες βολές (αποτυχία) Ρ(x)= 0.07*0.9319 = 0.0176. Η πιθανότητα να μην αστοχήσει μέχρι την 20η βολή είναι 0.0176
  • 56. ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (HYPERGEOMETRIC DISTRIBUTION) Η υπεργεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία - αποτυχία) σε πεπερασμένο πληθυσμό που επαναλαμβάνεται n φορές χωρίς επαναφορά. Η κατανομή γίνεται εύκολα κατανοητή με την περιγραφή ενός μοντέλου κάλπης: Θεωρούμε μια κάλπη με Ν μπάλες από τις οποίες οι m είναι λευκές (επιτυχίες) και Ν-m μαύρες (αποτυχίες). Από την κάλπη παίρνουμε χωρίς επαναφορά n μπάλες. Η υπεργεωμετρική κατανομή μας δίνει την πιθανότητα οι x από αυτές να είναι λευκές. Συνάρτηση Πυκνότητας Πιθανότητας ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = n N xn mN x m xf * )( , Συμβολισμός X ~ h(N,m,n) Αθροιστική Συνάρτηση Πιθανότητας ∑ = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = x i n N in mN i m xF 0 * )( Μαθηματική Ελπίδα: E(X)= N mn* Διακύμανση V(X)= )1(* )(*)(** 2 − −− NN nNmNmn
  • 57. Όπου n Μέγεθος δείγματος , m Αριθμός επιτυχιών πληθυσμού, N Μέγεθος πληθυσμού, x Αριθμός επιτυχιών δείγματος Ισχύουν επίσης ότι max(0, n+m-N)< x <min(n,m) , 0<n N≤ , 0<m N≤ Υπενθυμίζουμε επίσης ότι !)!( ! bba a b a − =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ Παρατήρηση. Αν η επιλογή γίνεται με επαναφορά τότε η μεταβλητή ακολουθεί την Διωνυμικη Κατανομή (βλ. αντίστοιχη ενότητα). Επίσης για n=1 η υπεργεωμετρική κατανομή συμπίπτει με την Bernoulli. Για υψηλές τιμές των Ν, m οι οποίες είναι επίσης συγκριτικά υψηλές με το n και για πιθανότητα p η οποία δεν είναι κοντά στο 0 ή 1, τότε η υπεργεωμετρική κατανομή προσεγγίζει την κανονική. Παράδειγμα 1) Υποθέτουμε ότι σε ένα δοχείο έχουμε 50 βόλους. Από αυτούς 5 είναι άσπροι ναι 45 μαύροι. Επιλεγούμε στην τύχη 10 βόλους χωρίς επαναφορά στο δοχείο. Ποια η πιθανότητα να έχουμε 4 άσπρους από τους 10 βόλους που επιλέξαμε; Από τα δεδομένα του προβλήματος έχουμε ότι Μέγεθος πληθυσμού Ν=50 Μέγεθος δείγματος n=10 Αριθμός επιτυχιών πληθυσμού m=5 (Υπάρχουν 5 άσπροι βόλοι) Αριθμός επιτυχιών δείγματος x=4 (Θέλουμε να επιλέξουμε 4 άσπρους βόλους) ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = 10 50 410 550 * 4 5 )(xf = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ 10 50 6 45 * 4 5 =……=0.0039 Η πιθανότητα να έχουμε 4 άσπρους βόλους από τους 10 βόλους που επιλέξαμε είναι 0.0039
  • 58. 2) Διαθέτουμε μια τράπουλα 52 φύλλων. Επιλεγούμε 8 φύλλα χωρίς επαναφορά. Ποια η πιθανότητα να έχουμε 2 Βαλέδες στα 8 φύλλα; (Η τράπουλα διαθέτει τους αριθμούς 1,2,3….,10 και τις 3 φιγούρες στα τέσσερα χρώματα: καρό, μπαστούνι, σπαθί και κούπα. Σύνολο 52 τραπουλόχαρτα) Από τα δεδομένα του προβλήματος έχουμε ότι Μέγεθος πληθυσμού Ν=52 Μέγεθος δείγματος n=8 Αριθμός επιτυχιών πληθυσμού m=4 (Μια τράπουλα έχει 4 Βαλέδες) Αριθμός επιτυχιών δείγματος x=2 (Θέλουμε να επιλέξουμε 2 Βαλέδες) ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = 8 52 28 452 * 2 4 )(xf = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ 8 52 6 48 * 2 4 =……=0.0978 Η πιθανότητα να έχουμε 2 Βαλέδες στα 8 επιλεγμένα φύλλα είναι p=0.0978 ΛΟΓΑΡΙΘΜΙΚΗ ΚΑΤΑΝΟΜΗ (LOGARITHMIC DISTRIBUTION) Συνάρτηση Πυκνότητας Πιθανότητας )1ln(* )( θ θ − − = x x xf , Συμβολισμός Χ~log(θ)
  • 59. Αθροιστική Συνάρτηση Πιθανότητας ∑ =− − = x xF 1 * )1ln( 1 )( ι ι ιθ θ όπου παράμετρος 0<θ<1 και +∞<≤ x1 Μαθηματική Ελπίδα: E(X)= )1(*)1ln( pp p −− − Διακύμανση V(X)= )1(ln*)1( )1ln( * 22 pp pp p −− −+ − ΠΑΡΑΡΤΗΜΑ Το excel διαθέτει τις εξης κατανομές, οι οποίες είναι αρκετά εύκολες στη χρήση τους. 1) Κατανομή Beta Αθροιστική Συνάρτηση Πιθανότητας BETADIST Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας BETAINV 2) Κατανομή Nomral Αθροιστική Συνάρτηση Πιθανότητας NORMDIST Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας NORMINV 3) Κατανομή X2 Αθροιστική Συνάρτηση Πιθανότητας CHIDIST Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας CHIINV 4) Κατανομή F Αθροιστική Συνάρτηση Πιθανότητας FDIST Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας FINV 5) Κατανομή Gamma Αθροιστική Συνάρτηση Πιθανότητας GAMMADIST
  • 60. Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας GAMMAINV 6) Κατανομή T-student (Παρομοια με την Κανονιμη. Χρησιμοποιειται όταν εχουμε μικρο αριθμο παρατηρησεω, λιγοτερες από 50) Αθροιστική Συνάρτηση Πιθανότητας ΤDIST Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας ΤINV 7) Διωνυμικη BINOMDIST 8) Υπεργεωμετρικη HYPDEOMDIST 9) Poisson POISSON ΑΝΑΦΟΡΕΣ- ΒΙΒΛΙΟΓΡΑΦΙΑ Πιθανότητες και στατιστική (J. Fourastie- F. Laslier) Στατιστικές Μέθοδοι ( Δονάτος Γ.- Χομπας Β.) Πιθανότητες και στατιστική (Δάρας Τ.) Θεωρία πιθανοτήτων και εφαρμογές (Χαραλαμπιδης Χ.) Θεωρία Πιθανοτήτων 1 - Λογισμός Πιθανοτήτων Τυχαίων Γεγονότων (Αθανασόπουλος Δ.) Wikipedia Manual Easy Fit 5.1 Manual Excel 2003