Σελίδες

Τετάρτη 19 Μαρτίου 2014

Κανονική κατανομή

androulakis.bma.upatras.gr

Η πιο σημαντική κατανομή πιθανοτήτων της στατιστικής είναι η κανονική κατανομή. Η κανονική κατανομή αναφερέται σε συνεχείς μεταβλητές , σε αντίθεση με την poisson και την διωνυμική που είναι ασυνεχείς κατανομές , και ως εκ τούτου αποτελεί μια συνεχή συνάρτηση πυκνότητας πιθανότητας και η μαθηματική έκφραση αυτής είναι:
H κανονική κατανομή (normal distribution) θεωρείται η σπουδαιότερη κατανομή της Θεωρίας Πιθανοτήτων και της Στατιστικής.
  Τύπος:f(X) = \frac {1}{s \sqrt{2p}}e^{\frac {1}{2} ( \frac{X-m}{s})^ 2}
όπου,
p = π=3,14
m = ο μέσος του πληθυσμού
s = τυπική απόκλιση
Χ = μια τιμή της συνεχούς τυχαίας μεταβλητής στο άπειρο

Ο απευθείας υπολογισμός πιθανοτήτων της κανονικής κατανομής είναι δύσκολος λόγω της μορφής της συνάρτησης πυκνότητας πιθανότητας. Ο υπολογισμός αυτός όμως διευκολύνεται με τον ορισμό της τυποποιημένης κανονικής κατανομής. Η απλούστερη μορφή της κατανομής αυτής, η οποία συνήθως χρησιμοποιείται σε πρακτικές εφαρμογές με μετασχηματισμό, είναι εκείνη που αναφέρεται στην περίπτωση όπου μ=0 και σ2 =1. Η κατανομή αυτή ονομάζεται τυποποιημένη κανονική κατανομή και έχει, προφανώς, την μορφή f(X) = \frac {1}{s \sqrt{2p}}e^{\frac {-x^2}{2}}



Σημαντικότητα κανονικης κατανομής
1).Τα περισσότερα συνεχή φαινόμενα ακολουθούν είτε με ακρίβεια είτε με μεγάλη προσέγγιση την κανονική κατανομή.

2).Με την κανονική κατανομή μπορούμε να προσεγγίσουμε πολλές ασυνεχείς κατανομές πιθανοτήτων.

3).Σύμφωνα με το κεντρικό οριακό θεώρημα , η κανονική κατανομή αποτελεί τη βάση της στατιστικής συμπερασματολογίας.

Τα βασικά χαρακτηριστικά της κανονικης κατανομής είναι ότι ακολουθεί το σχήμα της ΄΄καμπάνας΄΄ και ως εκ τούτου είναι συμμετρική.Αποτέλεσμα αυτού είναι ο μέσος να είναι ίσος με την διάμεσο και την επικρατούσα τιμή(σημείο μέγιστης συχνότητας), δηλαδη όλες οι τιμές των παραμέτρων της κεντρικής τάσης ή θέσης συμπίπτουν.
Αξίζει να σημειωθεί ότι σε μία κανονική κατανομή το εύρος ισούται περίπου με έξι φορές τη μέση τιμή, δηλαδή R≈6x.
Επίσης, σε μια δειγματοληψία από κανονική κατανομή το 68,3% των τιμών απέχει το πολύ κατά σ από τη μέση τιμή, βρίσκεται δηλαδή στο διάστημα [μ − σ,μ + σ]. Το 95,5% των τιμών βρίσκεται στο [μ − 2σ,μ + 2σ] και το 99,7% στο [μ − 3σ,μ + 3σ].
 center
Όπως είναι προφανές τόσο από το γράφημα της κατανομής, αλλά και από την μαθηματική της μορφή, η κατανομή αυτή είναι συμμετρική γύρω από την μέση τιμή της. Προφανώς, επίσης, όπως σε όλες τις κατανομές, το εμβαδόν της επιφάνειας κάτω από την καμπύλη είναι 1. Στο γράφημα της τυποποιημένης κανονικής κατανομής, η καμπύλη εμφανίζεται να σταματά σε κάποιο σημείο μεταξύ 3 και 4 και -3 και -4, αντίστοιχα. Στην πραγματικότητα, στα σημεία αυτά, πλησιάζει ασυμπτωτικά τον άξονα των x. Περίπου το 6/10000 μόνο της επιφάνειάς της βρίσκεται έξω από το διάστημα -4 έως 4.



Εφαρμογή της Κανονικής Κατανομής

Η προσεγγιστική καμπύλη στο σχήμα παριστάνει την κανονική κατανομή μιας ομαδοποιημένης μεταβλητής. Ο μαθηματικός τύπος της κατανομής που βλέπουμε στο παραπάνω σχήμα είναι ο εξής:
   f(x)=ce^{-\frac{1}{2}\bigg(\frac{x-\alpha}{\beta}\bigg)^2}
τα α, β και c είναι παράμετροι. Για παράδειγμα, το c πρέπει να είναι τέτοιο ώστε το εμβαδόν της περιοχής, που βρίσκεται κάτω από την καμπύλη της γραφικής παράστασης της f(x), να είναι ίσο με 1. Το α είναι η μέση τιμή της κατανομής και το β είναι η τυπική απόκλισή της. Δηλαδή ο προηγούμενος τύπος γράφεται:
   f(x)=ce^{-\frac{1}{2}\bigg(\frac{x-\bar{x}}{s}\bigg)^2}
εάν βρούμε την πρώτη και δεύτερη παράγωγο της συνάρτησης του παραπάνω τύπου έχουμε:
  f(x)=-\frac{1}{s^2}(x-\bar{x}) f(x) και    f"(x)=-\frac{1}{s^2}\bigg[ 1-\bigg(\frac{x-\bar{x}}{s}\bigg)^2\bigg] f(x)
από τους δύο αυτούς τύπους μπορούμε να μελετήσουμε τη συνάρτηση ως προς τη μονοτονία, ακρότατα, κυρτότητα και τα σημεία καμπής. Εάν βρούμε το ολοκλήρωμά της στο διάστημα [\bar{x}-s,\bar{x}+s] το αποτέλεσμα είναι 0,68 με προσέγγιση δύο δεκαδικών ψηφίων. Δηλαδή στο διάστημα αυτό βρίσκεται το 68% των τιμών της μεταβλητής Χ. Αντίστοιχα στο διάστημα
[\bar{x}-2s,\bar{x}+2s] το 95%  και στο διάστημα  [\bar{x}-3s,\bar{x}+3s] το 99,7% δηλαδή πλησιάζει το σύνολο των παρατηρήσεων.
Ο αριθμός \frac{x-\bar{x}}{s} λέγεται σταθερά μονάδα (standard unit) της κατανομής.


ΙΔΙΟΤΗΤΕΣ ΚΑΝΟΝΙΚΗΣ ΚΑΤΑΝΟΝΗΣ
ΜΕΣΗ ΤΙΜΗ = μ
ΔΙΑΣΠΟΡΑ = σ ^2
ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ = σ
ΣΥΝΤΕΛΕΣΤΗΣ ΡΟΠΗΣ ΛΟΞΩΣΗΣ = 0
ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ = 3
ΜΕΣΗ ΑΠΟΚΛΙΣΗ = 0,7979σ
1. Η μέση τιμή μ βρίσκεται στο κέντρο ακριβώς της κατανομής, αντιστοιχεί δηλαδή στο πιο ψηλό σημείο της καμπύλης και ταυτίζεται με τη διάμεσο και την επικρατούσα τιμή
2. Το εμβαδόν της περιοχής που περικλείεται από τον οριζόντιο άξονα και από την καμπύλη έιναι ίσο με 1. Χωρίζεται δε από τον κάθετο στο μ, σε δύο ισεμβαδικά μέρη ίσα με 0,5 το καθένα
3. Η κατανομή είναι συμμετρική ως προς τη μέση τιμή μ. Αυτό σημαίνει ότι αν πάρουμε ίσες αποστάσεις δεξιά και αριστερά του μ και φέρουμε κάθετους, τα εμβαδά που περικλείονται από την καμπύλη, τις καθέτους και τον οριζόντιο άξονα είναι ίσα
4. Η απόσταση των σημείων καμπής Α, Β της καμπύλης από τον κάθετο στο μ ισουται με μια τυπική απόκλιση σ
5. Κάθε καμπύλη συχνοτήτων που αντιστοιχεί σε κανονική κατανομή προσδιορίζεται πλήρως από τις παραμέτρους μ και σ. Όσο μεγαλύτερη είναι η μέση τιμή μ τόσο δεξιότερα ως προς τον οριζόντιο άξονα βρίσκεται η καμπύλη και όσο μεγαλύερη είναι η τυπική απόκλιση σ τόσο πιο πεπλατυσμένη είναι η καμπύλη.
Παράδειγμα 1
Κατά βιομηχανική διαδικασία παράγονται βίδες διαμέτρου 35mm που όμως λόγω τυχαίων παραγόντων μπορεί η διάμετρος τους να διαφέρει από βίδα σε βίδα και γι'αυτό η διάμετρος θεωρείται τυχαία μεταβλητή, που ακολουθεί την Ν(35, 0.52. Αν επιλεγεί τυχαία μία βίδα, να υπολογισθεί η πιθανότητα όπως:
α) να έχει διάμετρο το πολύ 35.4
β)να έχει διάμετρο τουλάχιστον 34.6
γ)να είναι μεταξύ 34.5 και 35.2 .
Λύση
Η τυποποιημένη τυχαία μεταβλητή είναι Ζ=\frac{X-35}{0.5}.
α)P(X\leq35.4)= P(\frac{X-35}{0.5}\leq\frac{35.4-35}{0.5}\frac{0.4}{0.5}= Φ(0.8)= 0.7881.
β)P(X\geq34.6)=1-P(X\leq34.6)=1-Φ(\frac{34.6-35}{0.5})= 1-Φ(-0.8)=Φ(0.8)=0.7881.
γ)P(34.5\leq{X}\leq35.2)=Φ(0.4)-Φ(-1)=Φ(0.4)+Φ(1)-1=0.6554+0.8413-1=0.4967.

Παράδειγμα 2
Ας υποθέσουμε ότι η διάρκεια κύησης Χ μιας γυναίκας ακολουθεί την κανονική κατανομή με μέση τιμή μ=270 ημέρες και τυπική απόκλιση σ=30 ημέρες. Να υπολογιστεί η πιθανότητα η διάρκεια κύησης του παιδιού να είναι μικρότερη απο 7 μήνες.
Εισάγοντας την τυποποιημένη μεταβλητή Ζ=\frac{x-\mu}{\sigma}, όπου μ=270 και σ=30 έχουμε:
P(X<210)=P(\frac {X-270}{30}<\frac{210-270}{30})=P(Z<-2)=Φ(-2)=1-Φ(2)
Από τον πίνακα της τυποποιημένης κανονικής κατανομής έχουμε ότι Φ(2)=0,9772
Άρα P(X<210)=1-0,09772=0,0228\cong2%.
Πηγή:[1] /math
Παράδειγμα 3
Έστω Z∼N (0,1). α) Να υπολογισθεί η P(-1≤Z≤1).
β) Να βρεθεί η τιμή x έτσι ώστε P(Z<x) = 0.3.
Λύση: α) P(-1≤Z≤1) = Φ(1) - Φ(-1) = Φ(1) - (1-Φ(1)) = 2Φ(1) - 1 = 2 (0.8413)-1 = 0.6826
β) Από τους πίνακες βρίσκουμε ότι η τιμή α με την ιδιότητα P(Z<α) = 0.7 είναι α=0.52. Επομένως x = -α = -0.52
Πηγή : {www.stat-athens.aueb.gr/~jpan/statistiki-skepsi-II/chapter9.pdf}

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου