Τετάρτη 22 Απριλίου 2015

Έλεγχος για τη διακύμανση

Quantitative


Έλεγχοι για τη διακύμανση.

Οι στατιστικοί έλεγχοι για την διακύμανση ενός πληθυσμού είναι ιδιαίτερα χρήσιμοι στον έλεγχο της ποιότητας ενός προϊόντος στο οποίο η μεταβλητότητα των χαρακτηριστικών του όπως το βάρος, το ύψος, η αντοχή, η ακρίβεια των μετρήσεων που κάνει κ.τ.λ. δεν πρέπει να υπερβαίνουν ορισμένα όρια. Στις περισσότερες από τις περιπτώσεις αυτές η κατανομή πληθυσμού μπορεί να υποτεθεί κανονική. Είδαμε ότι αν s είναι η διακύμανση δείγματος π στοιχείων από έναν κανονικό πληθυσμό με διακύμανση σ2 τότε η τυχαία μεταβλητή
X^{2}=\frac{(n-1)S_{2}}{\sigma^{2}}  (1)

Οι πιο συνηθισμένες στατιστικές υποθέσεις είναι:
1) H_0: \sigma^2 = \sigma_0^2,   H_1: \sigma^2< \sigma_0^2
2) H_0: \sigma^2 = \sigma_0^2,   H_1: \sigma^2> \sigma_0^2
3) H_0: \sigma^2 = \sigma_0^2,   H_1: \sigma^2 \neq \sigma_0^2
θα ελένξουμε τις υποθέσεις αυτές με την στατιστική (1) που προαναφέραμε.
Έτσι για κάθε μία από τις παραπάνω υποθέσεις έχουμε
1) Απορρίπτουμε την H0, αν X^2 < X^2_{n-1, 1-\alpha}, όπου P(X^2 < X^2_{n-1, 1-\alpha})=\alpha
2) Απορρίπτουμε την H0, αν X^2 > X^2_{n-1, \alpha}, όπου P(X^2 > X^2_{n-1, \alpha})=\alpha
3) Απορρίπτουμε την H0, αν X^2 < X^2_{n-1, 1- \alpha/2} ,\eta, X^2>X^2_{n-1,\alpha/2}, όπου P(X^2 < X^2_{n-1, 1-\alpha /2})+P(X^2>X^2_{n-1, \alpha /2})= \alpha / 2 + \alpha /2=\alpha
Οι έλεγχοι (1) και (2) μπορούν να αντικατασταθουν από τους
α) H_0: \sigma^2 \geq \sigma_0^2, H_1: \sigma^2< \sigma^2_0
β) H_0: \sigma^2 \leq \sigma_0^2, H_1: \sigma^2> \sigma^2_0
και ελέγχονται από την ίδια X2

Έλεγχοι για τη διακύμανση

Σε παραπάνω παράγραφο αναφέρθηκε ότι X^{2}=\frac{(n-1)S_{2}}{\sigma^{2}}\sim X^{2}_{n-1}.
ακολουθεί την κατανομή x_2 με ν=n-1 βαθμούς ελευθερίας Επομένως ο έλεγχος μιας στατιστικής υπόθεσης για την διακύμανση πληθυσμού θα γίνει σταδιακά ως εξής:
α. Υποθέσεις που γίνονται δεκτές: Η κατανομή πληθυσμού κανονική, το δείγμα τυχαίο.
β. Η μηδενική και η εναλλακτική υπόθεση:
Χρησιμοποιόντας το σαν στατιστικό προκύπτει το παρακάτω τεστ:
Μονόπλευρος έλεγχος \Rightarrow H_{0}:\mathit{{\sigma}}^{2}=\mathit{{\sigma}}_{0}^{2} και H_{1}:\mathit{{\sigma}}^{2}>\mathit{{\sigma}}_{0}^{2} ή H_{0}:\mathit{{\sigma}}^{2}=\mathit{{\sigma}}_{0}^{2} και H_{1}:\mathit{{\sigma}}^{2}<\mathit{{\sigma}}_{0}^{2}
Δ.Ε.: R=X^{2}>X_{n-1;a}^{2} ή R=X^{2}<X_{n-1;1-a}^{2}
Αμφίπλευρος έλεγχος \Rightarrow H_{0}:\mathit{{\sigma}}^{2}=\mathit{{\sigma}}_{0}^{2} και H_{1}:\mathit{{\sigma}}^{2}\neq \mathit{{\sigma}}_{0}^{2}
Δ.Ε.: R=X^{2}>X_{n-1;a/2}^{2} ή R=X^{2}<X_{n-1;1-a/2}^{2}
Στατιστικό: X^{2}=\frac{[(n-1)s_{2}]}{\mathit{{\sigma}}^{2}}\sim X_{n-1}^{2}
Η παραπάνω μεθοδολογία ονομάζεται χ2 έλεγχος για τη διακύμανση.
Πρακτικά, ακολουθούμε τα παρακάτω βήματα:
  1. Επιλέγουμε το επίπεδο σημαντικότητας.
  2. Υπολογίζουμε την τιμή χ2.
  3. Υπολογίζουμε την κρίσιμη περιοχή :
  • C=[0,\mathit{{\chi}}_{n-1;1-a/2}^{2})\cup(\mathit{{\chi}}_{n-1;a/2}^{2},\infty) για τον αμφίπλευρο έλεγχο.
  • C=[0,χn − 1;1 − a) και
  • C=(\mathit{{\chi}}_{n-1;a}^{2},\infty) για τους μονόπλευρους ελέγχους.
όπου τα \mathit{{\chi}}_{n-1;a}^{2} ,\mathit{{\chi}}_{n-1;1-a/2}^{2} και \mathit{{\chi}}_{n-1;a/2}^{2} είναι τα α/2, 1-α/2, 1-α και α σημεία της χ2 κατανομής με n-1 βαθμούς ελευθερίας.
Τελικά η H0 απορρίπτεται, εφ'όσον χ2 παίρνει τιμές από το C.

Παράδειγμα

Παρατηρήθηκαν σε πείραμα οι εξής μετρήσεις : 4.1, 5.2 και 10.2 . Να γίνει έλεγχος για το αν ισχύει η H0:σ2=4 και εναλλακτική H1:\mathit{{\sigma}}^{2}\neq{4} με επίπεδο σημαντικότητας α=0.10.
  1. Έχουμε από υπόθεση α=0.10.
  2. \mathit{{\chi}}^{2}=\frac{(n-1)S_{2}}{\sigma^{2}}=\frac{(2x10,57)}{4}=5.29.
  3. Η κρίσιμη περιοχή είναι C=[0,0.102)\cup[5.991,\infty), επειδή \mathit{{\chi}}_{2;0.025}^{2}=0.102 και \mathit{{\chi}}_{2;0.975}^{2}=5.991.
Αφού χ2 = 5.29 δεν είναι μια τιμή από το C, δεν απορρίπτουμε την H0.

Παράδειγμα με το R:

Μία αποθήκη παράγει λαμπτήρες οι οποίοι αναμένονται να έχουν περίπου την ίδια διάρκεια ζωής. O υπεύθυνος παραγωγής παρατηρεί ότι η διάρκεια ζωής των λαμπτήρων παρουσιάζει τυπική απόκλιση 70. Σε μία δειγματοληψία μεγέθους n=100 είχαμε τις ακόλουθες μετρήσεις για το χρόνο ζωής των παραγόμενων λαμπτήρων
> L=c(84,90,120,89,240,192,268,193,116,86,97,124,102,209,301,93,246,141,147,170, +104,275,260,107,91,151,168,119,227,258,175,132,144,249,184,190,111,98,286,115,127,88, +276,149,113,231,280,183,203,118,145,211,166,253,298,177,108,289,121,200,278, +116,242,237,133,157,180,283,135,105,163,215,129,95,187,198,138,173,263,302, +140,226,284,189,216,250,125,159,267,181,573,259,105,298,103,182,174,109,87,234) > length(L) [1] 100
Για να κάνουμε έλεγχο υποθέσεων για τη διακύμανση σε επίπεδο σημαντικότητας α=0,10 κάνουμε τα εξής:
βρίσκουμε το x2
> sd(L) [1] 76.53171 > n=100;s=70 > chisq=((n-1)*sqrt(76.53171))/sqrt(s) > chisq [1] 103.5159
Βρίσκουμε την κρίσιμη περιοχή
> var.interval = function(data, conf.level = 0.90) + { df = length(data) - 1 + chilower = qchisq((1 - conf.level)/2, df) + chiupper = qchisq((1 - conf.level)/2, df, lower.tail = FALSE) + v = var(data) + c(df * v/chiupper, df * v/chilower)} > var.interval(L) [1] 4705.637 7526.032
Βλέπουμε ότι το χ δεν ανήκει στην κρίσιμη περιοχή, άρα η μηδενική υπόθεση δεν απορρίπτεται.




iwanna giakoumaki (995)

Ενότητα 4 Έλεγχος υπόθεσης για τη μέση τιμή και τη διακύμανση
Για να κάνουμε έλεγχο διακύμανσης παίρνουμε 2 δείγματα από τον πληθυσμό μας. Σαν μηδενική υπόθεση θεωρούμε ότι τα 2 δείγματα έχουν ίδια διακύμανση.
>w=c(1.98,2.88,2.33,0.21,2.27,0.37,3.16,0.23,0.78,0.65,0.26,0.9,1.98,0.4,3.28,6.02,0.45,0.39,1.87,0.49,0.23,1.27,0.18,0,0,0.29,21.94,0.86,0.58,1.21,1.17,0.16,3.1,0.44,1.7,0.69,0.48,0,1.08,2.19,1.2,1.37,1.44,0.73,3.52,1.89,0.67,2.93).
> z=c(7.42,4.94,0.78,5.2,3.28,0,1.35,0.62,1.29,1.55,0.78,0.28,0.94,0.72,0.46,0,1.94,5.34,0,1.79,4.52,0.88,0.46,2.83,1.65,1.67,2.49,2.25,4.18,1.5,0.46,1.18,1.05,1.98,2.88,2.33,0.21,2.27,0.37,3.16,0.23,0.78,0.65,0.26,0.9,1.98,0.4,3.28) > length(z) [1] 48 > length(w) [1] 48 > var.test(w,z,0.95)
       F test to compare two variances
data: w and z F = 3.999, num df = 47, denom df = 47, p-value = 5.22e-06 alternative hypothesis: true ratio of variances is not equal to 0.95 95 percent confidence interval:
2.129702 6.776957 
sample estimates: ratio of variances
         3.799066
p-value = 5.22e-06<0.05, άρα δε δεχόμαστε τη μηδενική υπόθεση

Παράδειγμα 3

Αυτόματο μηχάνημα παράγει ατσάλινο σύρμα στο οποίο σύμφωνα με τις προδιαγραφές του μηχανήματος, η τυπική απόκλιση της αντοχής του δεν υπερβαίνει τα 5 κιλά. Αν σε 16 δοκιμές σε τυχαία σημεία του παραγόμενου σύρματος μετρήσαμε την αντοχή και υπολογίσαμε s=5.6 κιλά να ελεγχθεί σε επίπεδο σημαντικότητας α=0.01 αν το μηχάνημα ικανοποιεί τις προδιαγραφές αγοράς του. Η κατανομή της αντοχής του ατσάλινου σύρματος μπορεί να υποτεθεί κανονική. Ο ζητούμενος έλεγχος θα γίνει σταδιακά ως εξής:
Υποθέσεις που γίνονται δεκτές: 
α.Η κατανομή πληθυσμού είναι κανονική και το δείγμα τυχαίο.
β. Η μηδενική και η εναλλακτική υπόθεση:
H_o: \sigma^2 =25 H_1: \sigma^2 >25

γ. Το κριτήριο αποφάσεως: Για α=0.01 και ν=n-1 βαθμούς ελευθερίας έχουμε X^{2}=\frac{(n-1)S_{2}}{\sigma^{2}} άρα X15,0012 = 30.58
Επομένως αν
\frac{15s^2}{25}>30,58

θα απορρίψουμε την Ηο υπέρ της Η1.
δ. Η απόφαση: Υπολογίζουμε s2 = (5.6)2=31.36. Επειδή
\frac{15(31.36)}{25}=18.8<30,58
η Ηο δεν μπορεί να απορριφθεί στο επίπεδο σημαντικότητας α=0.01. Η τιμή πιθανότητας του ελέγχου δίνεται ως σκιασμένη επιφάνεια στο ακόλουθο σχήμα:

Παράδειγμα 4

Σε προβλήματα ελέγχου ποιότητας εκτός από τη διατήρηση ενός σταθερού μέσου μας ενδιαφέρει και η διατήρηση της διασποράς σε χαμηλά επίπεδα, διότι διαφορετικά αυξάνει ο κίνδυνος απόρριψης του προϊόντος. Από την παραγωγή τυχαίο δείγμα μεγέθους n=16 έδωσε δειγματική απόκλιση S = 5.5. Αν η μεγαλύτερη επιτρεπόμενη τυπική απόκλιση είναι σ0 = 4 να εξεταστεί αν η παραπάνω υπέρβαση είναι στατιστικά σημαντική ή όχι (α=0.05).
Λύση
Έχουμε έναν έλεγχο διασποράς της μορφής
Ηο: σ ≤ 4 = σ0
Η1: σ > 4 = σ0
Από τους πίνακες προκύπτει ότι η κρίσιμη περιοχή είναι:
K: |x^2|=\frac{(n-1)S^2}{\sigma_0^2} >x^2_{n-1, a}, με S2 = 5.52, n=16 και α = 0.05

Έτσι x2 | =28.36, ενώ από τους πίνακες της κατανομής χ2 προκύπτει ότι x^2_{n-1, a}=x^2_{15, 0.05}=25.00 , οπότε απορρίπτουμε την Ηo και άρα η υπέρβαση είναι στατιστικά σημαντική.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου