Από Quantitative
Ερμηνείες παραμέτρων πολλαπλής παλινδρόμησης:
εi είναι ανεξάρτητες τυχαίες μεταβλητές οι οποίες αντιπροσωπεύουν τις αποκλίσεις (σφάλματα) απο την ευθεία παλινδρόμησης και ακολουθούν την κανονική κατανομή με μέση τιμή 0 και διακύμανση s2 (N(0,s2))
Γενικά
Η πολυδιάστατη γραμμική παλινδρόμηση αποτελεί μια επέκταση της απλής παλινδρόμησης. Στην απλή παλινδρόμηση μελετάται η σχέση μεταξύ της εξαρτημένης μεταβλητής Υ και της ανεξάρτητης μεταβλητής Χ ενώ στην πολυδιάστατη παλινδρόμηση μελετάται η σχέση μεταξύ Υ και των ανεξάρτητων μεταβλητών X1
Επεκτείνουμε το απλό γραμμικό μοντέλο σε πολυδιάστατο, δεχόμενοι οτι η εξαρτημένη μεταβλητή Y είναι μια γραμμική συνάρτηση των Κ ανεξάρτητων μεταβλητών X1,...,X2 και του τυχαίου σφάλματος ε. Αυτό το μοντέλο αποτελεί μία φυσική επέκταση του απλού γραμμικού μοντέλου. Το πολυδιάστατο γραμμικό μοντέλο έχει ως εξής:
Υ = a + b1x1 + b2x2 + ... + bkxk + v , (1)
όπου Υ είναι η εξαρτημένη μεταβλητή,a είναι ο Y-σταθερός όρος της επιφάνειας παλινδρόμησης και κάθε bi , i = 1,2,...,k είναι η κλίση της επιφάνειας παλινδρόμησης ως προς την αντίστοιχη μεταβλητή Xi, x1,...,xk τιμές από τις ανεξάρτητες μεταβλητές X1,...,Xk, αντίστοιχα και v είναι το τυχαίο σφάλμα.
Προϋποθέσεις του μοντέλου: 1. ν~N(0,s2), ανεξάρτητο από άλλα σφάλματα. 2. Οι μεταβλητές Xi είναι ασυσχέτιστες με τα κατάλοιπα.
Οι μεταβλητές αυτές καλούνται και προβλεπτικές ή ερμηνευτικές. Στόχος είναι να υπολογίσουμε τη συνολική προβλεπτική-ερμηνευτική (ως προς την εξαρτημένη μεταβλητή), ικανότητα τους.
Οι παραδοχές που κάνουμε για το σφάλμα είναι οι εξής:
- το μοντέλο δίνεται από τη σχέση (1)
- το τυχαίο σφάλμα v έχει μέσο 0 και σταθερά διακύμανση s2 (ομοιοσκεδαστικότητα). Δηλαδή, Εv = 0 και Var v = s2
- οι τυχαίες μεταβλητές Y1,...,Yn είναι ανεξάρτητες τ.μ.
Για x1 = x1i, x2 = x2i,...,xk = xki, έχουμε
Yi = a + b1x1i + b2x2i + ... + bkxki + vi, i = 1,...,n
Οι τρεις παραπάνω συνθήκες γράφονται ως εξής:
Οι τ.μ. Yi, i = 1,...,n είναι ανεξάρτητες τ.μ. με
- Μέσο = a + b1x1i +...+ bkxki και
- Διακύμανση = s2
οι συντελεστές (εκφρασμένοι σε z-τιμές) που μας πληροφορούν για το βαθμό σπουδαιότητας της κάθε προβλεπτικής μεταβλητής
Για να μετατρέψουμε τους συντελεστές παλινδρόμησης σε τυποποιημένους συντελεστές παλινδρόμησης τότε χρησιμοποιούμε τον παρακάτω τύπο:
Πολυδιάστατο (πολυμεταβλητό) γραμμικό μοντέλο
Πολλές φορές σε πρακτικά προβλήματα κρίνεται απαραίτητο να χρησιμοποιήσουμε 2 ή και περισσότερες ανεξάρτητες μεταβλητές, προκειμένου να περιγράψουμε με μεγαλύτερη ακρίβεια μια εξαρτημένη μεταβλητή.
Για παράδειγμα, αν θεωρήσουμε σαν εξαρτημένη μεταβλητή (Y), την τιμή πώλησης ενός διαμερίσματος, θα επηρεαζόταν, τόσο απο την επιφάνεια του διαμερίσματος σε τετραγωνικά μέτρα(X1), όσο και απο την παλαιότητα του διαμερίσματος(X2). Άν παραλείψουμε μια απο τις 2 μεταβλητές ξέρουμε οτι θα παραλείψουμε μια πηγή διακύμανσης της εξαρτημένης μεταβλητής και το μοντέλο παλινδρόμησης δεν θα περιγράφει καλά την εξαρτημένη μεταβλητή.
Τα μοντέλα παλινδρόμησης τα οποία περιέχουν περισσότερες απο μια μεταβλητή, ονομάζονται μοντέλα πολλαπλής παλινδρόμησης.
Μοντέλο 2 ανεξάρτητων μεταβλητών
Yi = α + β1Xi1 + β2Xi2 + εi, i=1,2,...,n.
όπου Yi είναι η τιμή της εξαρτημένης μεταβλητής στην i παρατήρηση
xi1,xi2 είναι οι τιμές των ανεξάρτητων μεταβλητών X1,X2 αντίστοιχα, στην i παρατήρηση
α,β1,β2 είναι οι παράμετροι του μοντέλου.
εi είναι ανεξάρτητες τυχαίες μεταβλητές οι οποίες αντιπροσωπεύουν τις αποκλίσεις (σφάλματα) απο την ευθεία παλινδρόμησης και ακολουθούν την κανονική κατανομή με μέση τιμή 0 και διακύμανση s2 (N(0,s2))
Η συνάρτηση παλινδρόμησης (regression function) είναι: E(Y | X1,X2) = α + β1X1 + β2X2
Η συνάρτηση παλινδρόμησης oνομάζεται και συνάρτηση ανταπόκρισης (response function). Αρκετές φορές αναφέρεται σαν επιφάνεια παλινδρόμησης (regression surface) ή επιφάνεια ανταπόκρισης (responce surface). Ο όρος επιφάνεια είναι διότι στην περίπτωση αυτή η εξίσωση είναι μια επιφάνεια (επίπεδο) και όχι μια ευθεία όπως στην περίπτωση μιας μεταβλητής.
Ερμηνείες παραμέτρων πολλαπλής παλινδρόμησης:
- Το α αντιστοιχεί στο σημείο τομής του άξονα του Y και της επιφάνειας παλινδρόμησης.
- Το β1 δείχνει την μεταβολή του E(Y) όταν το X1 αυξάνει κατά μια μονάδα, ενώ το X2 παραμένει σταθερό.
- Το Το β2 δείχνει την μεταβολή του E(Y) όταν το X2 αυξάνει κατά μια μονάδα, ενώ το X1 παραμένει σταθερό.
Μοντέλο κ ανεξάρτητων μεταβλητών
Όταν έχουμε κ ανεξάρτητες μεταβλητές, το μοντέλο παλινδρόμησης είναι:
Yi = α + β1Xi1 + β2Xi2 + ... + βκXiκ + εi , i=1,2,...,n.
όπου Yi είναι η τιμή της εξαρτημένης μεταβλητής για την i παρατήρηση
Xi1,Xi2,...,Xiκ είναι οι τιμές των ανεξάρτητων μεταβλητών στην i παρατήρηση.
εi είναι ανεξάρτητες τυχαίες μεταβλητές οι οποίες αντιπροσωπεύουν τις αποκλίσεις (σφάλματα) απο την ευθεία παλινδρόμησης και ακολουθούν την κανονική κατανομή με μέση τιμή 0 και διακύμανση s2 (N(0,s2))
Ερμηνείες παραμέτρων πολλαπλής παλινδρόμησης
- Το α είναι το E(Y), όταν X1 = X2 = ... = Xκ = 0.
- Το βi, (i=1,...,k) δείχνει την την μεταβολή της E(Y) όταν η μεταβλητή Xi αυξηθεί κατά μια μονάδα ενώ όλες οι άλλες ανεξάρτητες μεταβλητές παραμένουν σταθερές.
Παράδειγμα
Στην αξία ενός σπιτιού (Y) ξέρουμε οτι βασικό ρόλο παίζουν η επιφάνεια (X1) και η παλαιότητα (X2). Απο ένα ενδεικτικό δείγμα 10 σπιτιών, θα μελετήσουμε κατά πόσον εξαρτάται η αξία τους απο τις ανεξάρτητες μεταβλητές εφαρμόζοντας ένα μοντέλο παλινδρόμησης 2 μεταβλητών.
'Διαμέρισμα (Y)' 'X1' 'X2' 102 95 12 89 67 8 82 72 17 91 83 14 128 104 13 65 46 5 80 82 28 88 93 32 65 77 40 51 54 26
> y=c(102,89,82,91,128,65,80,88,65,51) > x1=c(95,67,72,83,104,46,82,93,77,54) > x2=c(12,8,17,14,13,5,28,32,40,26)
> problem=lm(y~x1+x2) > problem
Call: lm(formula = y ~ x1 + x2)
Coefficients:
(Intercept) x1 x2
19.967 1.084 -1.009
Εδώ δημιουργήθηκε το μοντέλο παλινδρόμησης και βλέπουμε οτι η επιφάνεια επηρεάζει θετικά στην τιμή, ενώ η παλαιότητα αρνητικά.

Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου