2. Model multiple regresije

Podobni dokumenti
3. Preizkušanje domnev

Primer 1: Analiziramo produkcijske funkcije za podjetja industrijske dejavnosti v RS v podskupini DL Proizvodnja računalnikov in druge opreme za

Primer 1: V vzorec smo izbrali 35 evropskih držav in zanje pridobili naslednje podatke (datoteka tobak.dta): odstotek prebivalcev, starejših od 65 let

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

Enajste vaje

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

Osme vaje

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Microsoft Word - SI_vaja5.doc

LaTeX slides

Osnove statistike v fizični geografiji 2

glava.dvi

Brownova kovariancna razdalja

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

Microsoft Word - SI_vaja1.doc

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

LaTeX slides

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Microsoft Word - strakl-jana.doc

Osnove verjetnosti in statistika

Mrežni modeli polimernih verig Boštjan Jenčič 22. maj 2013 Eden preprostejših opisov polimerne verige je mrežni model, kjer lahko posamezni segmenti p

IZLETI V MATEMATIČNO VESOLJE Ali so fantje bolj nadarjeni za matematiko kot dekleta? Arjana Brezigar Masten UP FAMNIT in UMAR 1

Microsoft Word - RAZISKAVA_II._del.doc

Microsoft Word - DAES zbornik 2010-številke.doc

Kein Folientitel

Univerza v Ljubljani Fakulteta za elektrotehniko Kristjan Ažman Identifikacija dinamičnih sistemov z Gaussovimi procesi z vključenimi linearnimi model

Microsoft Word - Faktorska_analiza_blagovne_znamke_II

Vaje: Matrike 1. Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N 0 1 n ; n N Pokaži, da je množica x 0 y 0 x

Izvozna in uvozna funkcija slovenskega gospodarstva

Microsoft PowerPoint - Java_spremenljivke

MERE SREDNJE VREDNOSTI

OPOMNIK

1 Diskretni naklju ni vektorji 1 1 Diskretni naklju ni vektorji 1. Dopolni tabelo tako, da bosta X in Y neodvisni. X Y x x x x x

2. LINEARNA ALGEBRA

00main.dvi

Planning and Control of Operations

2

Osnove matematicne analize 2018/19

MATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje prir

PowerPoint Presentation

6.1 Uvod 6 Igra Chomp Marko Repše, Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

OSNOVE UMETNE INTELIGENCE

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/testi in izpiti/ /IZPITI/FKKT-februar-14.dvi

Model IEUBK za napoved vsebnosti svinca v krvi otrok in njegova uporaba na primeru Zgornje Mežiške doline

Slide 1

2

MODEL PRIMERNOSTI OBMOČIJ ZA POVEZOVANJE

2

FGG13

predstavitev fakultete za matematiko 2017 A

ACAD-BAU-Analiza-prostorov

Statistika, Prakticna matematika, , izrocki

2

RAČUNALNIŠKA ORODJA V MATEMATIKI

10. Meritev šumnega števila ojačevalnika Vsako radijsko zvezo načrtujemo za zahtevano razmerje signal/šum. Šum ima vsaj dva izvora: naravni šum T A, k

LaTeX slides

VELJA OD DALJE PREVERJALNI SEZNAM RAZKRITIJ ZGD- 1 (69.člen) Izobraževalna hiša Cilj

2

PowerPoint Presentation

Microsoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode]

Microsoft Word - PRAKTIKUM CELOTA 4v2.doc

Strojna oprema

OCENA VREDNOSTI STANOVANJA Z RAZLIČNIMI NAČINI KOT PODLAGA ZA IZRAČUN NAJEMNINE Jožef Murko, dipl.inž.grad., DODOMA d.o.o., stalni sodni cenilec in iz

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra unalni²tvo Izobraºevalna matematika Pisni izpit pri predmetu K

EVROPSKA KOMISIJA Bruselj, C(2018) 7942 final UREDBA KOMISIJE (EU) / z dne o spremembi prilog I, III, VI, VII, VIII, IX, X, XI in

Journal of Central European Agriculture, 2012, 13(1), p DOI: /JCEA01/ DETERMINANTS OF AGRO FOOD PRICE CHANGES IN SLOVENIA DEJAV

EKVITABILNE PARTICIJE IN TOEPLITZOVE MATRIKE Aleksandar Jurišić Politehnika Nova Gorica in IMFM Vipavska 13, p.p. 301, Nova Gorica Slovenija Štefko Mi

Reliability estimation of individual predictions

Microsoft Word - N _moderacija.docx

STAVKI _5_

Biometrija 1 Poglavje 1 PORAZDELITVE NAKLJUČNIH SPREMENLJIVK Porazdelitve nam predstavljajo pogostnost posameznih vrednosti. Predstavimo jih lahko s š

Matematika II (UN) 2. kolokvij (7. junij 2013) RE ITVE Naloga 1 (25 to k) ƒasovna funkcija f je denirana za t [0, 2] in podana s spodnjim grafom. f t

STATISTIKA - zbiranje podatkov - obdelava podatkov - analiza in prikaz podatkov Z besedo statistika označujemo sistematično zbrane številske podatke.

EVROPSKA KOMISIJA Bruselj, C(2017) 6537 final DELEGIRANA UREDBA KOMISIJE (EU) / z dne o dopolnitvi Uredbe (EU) 2016/1011 Evropskeg

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO KLJUČNI DEJAVNIKI SPREJEMANJA TEHNOLOGIJE OLAP Ljubljana, avgust 2013 PETRA VODIŠEK

Vedno pod nadzorom, kjerkoli že ste

Poslovilno predavanje

Microsoft PowerPoint - OVT_4_IzolacijskiMat_v1.pptx

Zapisnik 1

Verjetnost in statistika

11. Navadne diferencialne enačbe Začetni problem prvega reda Iščemo funkcijo y(x), ki zadošča diferencialni enačbi y = f(x, y) in začetnemu pogo

RUO

Matematika Diferencialne enačbe prvega reda (1) Reši diferencialne enačbe z ločljivimi spremenljivkami: (a) y = 2xy, (b) y tg x = y, (c) y = 2x(1 + y

Podatkovni model ER

Popravki nalog: Numerična analiza - podiplomski študij FGG : popravljena naloga : popravljena naloga 14 domače naloge - 2. skupina

Univerza na Primorskem FAMNIT, MFI Vrednotenje zavarovalnih produktov Seminarska naloga Naloge so sestavni del preverjanja znanja pri predmetu Vrednot

2019 QA_Final SL

FGG14

Matematika 2

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo

Microsoft Word - vaje2_ora.doc

UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Ekonometrija 1 Course title: Econometrics 1 Študijski program in stopnja Study programme and level Univ

Microsoft Word - 170

ENV2:

2. izbirni test za MMO 2017 Ljubljana, 17. februar Naj bosta k 1 in k 2 dve krožnici s središčema O 1 in O 2, ki se sekata v dveh točkah, ter

Mere kompleksnih mrež (angl. Network Statistics) - Seminarska naloga pri predmetu Izbrana poglavja iz diskretne matematike

Transkripcija:

2. Model multiple regresije doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014

2.1 Populacijski regresijski model in regresijski model vzorčnih podatkov

Modeli in spremenljivke 2/77

Označevanje spremenljivk 3/77

Populacijski regresijski model 4/77

Populacijski regresijski model 5/77

Populacijski regresijski model Razlogi za vključevanje u i : Najprej je to nadomestilo za vse tiste spremenljivke, ki vplivajo na odvisno spremenljivko, pa niso vključene med pojasnjevalne spremenljivke (navedimo jih nekaj za naš primer). Pogosto je temu vzrok tudi pomanjkljiva ali nedorečena ekonomska teorija. Tudi če so nekatere spremenljivke sprejete in spoznane kot pomembne pojasnjevalne spremenljivke, jih pri specifikaciji modela ne moremo upoštevati, ker jih je težko številčno izraziti ali pa zanje dobiti podatke (npr. okus ali navade; v našem primeru denimo idiosinkratično znanje"). Če obstaja velika verjetnost, da je skupni učinek večine zanemarjenih pojasnjevalnih spremenljivk majhen in nepomemben in predvsem nesistematičen, potem lahko te vplive obravnavamo kot naključne in tedaj moramo v model vključiti spremenljivko u. 6/77

Populacijski regresijski model Tudi če bi uspeli pri specifikaciji modela upoštevati vse relevantne pojasnjevalne spremenljivke, bi še vedno ostali določeni naključni elementi (lahko rečemo pravi slučajni vplivi) pri vrednostih odvisne spremenljivke. Čeprav klasični regresijski model predpostavlja, da so vrednosti spremenljivk izmerjene oziroma ugotovljene brez napak, v praksi pogosto to ne velja. Pri specifikaciji regresijskega modela naj bi se držali znanega pravila, ki pravi, da naj ima preprostejši model vedno prednost pred zapletenejšim vse dotlej, dokler se ne dokaže, da je zaradi tega neustrezen (t.i. načelo Occamove britve). 7/77

Populacijski regresijski model 8/77

Populacijski regresijski model 9/77

Vzorčni regresijski model 10/77

Vzorčni regresijski model 11/77

2.2 Ocenjevanje populacijskega regresijskega modela in metoda najmanjših kvadratov

Motivacija 13/77

Ocenjevanje PRM 14/77

Ocenjevanje PRM 15/77

Ocenjevanje PRM 16/77

Metoda najmanjših kvadratov 17/77

Metoda najmanjših kvadratov 18/77

Metoda najmanjših kvadratov 19/77

Značilnosti metode najmanjših kvadratov 20/77

Grafična ponazoritev MNKVD 21/77

2.3 Predpostavke metode najmanjših kvadratov

1. predpostavka PRM Linearnost regresijskega modela: y i = β 1 + β 2 x i + u i 23/77

2. predpostavka PRM Fiksne (nestohastične) vrednosti pojasnjevalnih spremenljivk pri ponovitvah vzorcev: POGOJNA REGRESIJSKA ANALIZA 24/77

3. predpostavka PRM Ničelna povprečna vrednost u i : Eu ( x,..., x ) = 0 ali na kratko Eu ( ) = 0; i 2i ki i v tem primeru velja: E( y x,..., x ) = β + β x +... + β x. i 2i ki 1 2 2i k ki 25/77

3. predpostavka PRM 26/77

4. predpostavka PRM 27/77

4. predpostavka PRM 28/77

5. predpostavka PRM Odsotnost avtokorelacije: Cov( u, u x, x ) = 0; i j i j i j 29/77

5. predpostavka PRM 30/77

6. predpostavka PRM Nekoreliranost med pojasnjevalnimi spremenljivkami in slučajno spremenljivko u: Cov( x, u) = Cov( x, u) =... = Cov( x, u) = 0 2 3 k 31/77

7. predpostavka PRM Število opazovanj mora presegati število ocenjenih parametrov oziroma pojasnjevalnih spremenljivk: n > k 32/77

8. predpostavka PRM Variabilnost vrednosti pojasnjevalnih spremenljivk: var(x) je končno pozitivno število 33/77

9. predpostavka PRM Regresijski model je pravilno specificiran: vključene vse relevantne pojasnjevalne spremenljivke izbrana ustrezna funkcijska oblika modela 34/77

9. predpostavka PRM 35/77

9. predpostavka PRM 36/77

10. predpostavka PRM Odsotnost popolne multikolinearnosti: med pojasnjevalnimi spremenljivkami ne obstaja popolna linearna odvisnost oblike: λ x λ x + + x = 0 1 1 + 2 2 λ k k 37/77

10. predpostavka PRM 38/77

Operacionalizacija PRM 39/77

2.4 Vzorčne značilnosti in lastnosti metode najmanjših kvadratov

Motivacija Z metodo najmanjših kvadratov dobljene ocene regresijskih koeficientov so slučajne spremenljivke. Kako ugotoviti njihovo povprečno vrednost, varianco, kovariance in verjetnostno porazdelitev? Metoda najmanjših kvadratov je le ena od možnih cenilk regresijskih koeficientov. Kako dobra je izbrana cenilka v primerjavi z ostalimi možnimi metodami? Kako je z zanesljivostjo ocen regresijskih koeficientov? Kako dobre so ocene, ki smo jih dobili na podlagi le enega vzorca? 41/77

Vzorčne značilnosti MNKVD 42/77

Vzorčne značilnosti MNKVD 43/77

Vzorčne značilnosti MNKVD 44/77

Vzorčne značilnosti MNKVD 45/77

Vzorčne značilnosti MNKVD 46/77

Gauss Markov teorem 47/77

Monte Carlo eksperimenti 48/77

Monte Carlo eksperimenti 49/77

Cenilka variance slučajne spremenljivke u 50/77

Cenilka var-cov matrike b 51/77

Porazdelitev ocen regr. koeficientov 52/77

Porazdelitev ocen regr. koeficientov 53/77

Porazdelitev ocen regr. koeficientov 54/77

Porazdelitev ocen regr. koeficientov 55/77

2.5 Mere primernosti oziroma zanesljivosti regresijskega modela

Standardna napaka ocene regresije 57/77

Analiza variance (ANOVA) Dekompozicija vsote kvadratov (VK) [angl. sum of squares SS]: SVK = PVK + NVK ( ) n 2 n 2 2 2 i= 1 i i= 1 i yy SVK = y y = y ny = ny n ( ) 2 n 2 PVK = y ˆˆ i y = yi ny = yy ny i= 1 i= 1 PVK = bxy ny = yxb ny 2 2 2 2 n ( ) 2 n 2 NVK = y ˆˆ i yi = e i = ee= yy yy i= 1 i= 1 58/77

Determinacijski koeficient 59/77

Determinacijski koeficient 60/77

Determinacijski koeficient Slabosti determinacijskega in popravljenega determinacijskega koeficienta: visoka vrednost determinacijskega koeficienta še ne pomeni, da smo v model vključili prave pojasnjevalne spremenljivke; vrednosti determinacijskih koeficientov niso primerljive med modeli z različno definirano odvisno spremenljivko; vrednosti determinacijskih koeficientov so v splošnem večje pri modelih časovnih vrst kot pri modelih presečnih podatkov; nizka vrednost determinacijskega koeficienta ne pomeni, da model ne vključuje pravih, pomembnih pojasnjevalnih spremenljivk. 61/77

Testiranje modela kot celote Testiranje statistične značilnosti regresijskega modela kot celote: R. A. Fisher je 1922. leta ugotovil, da se razmerje med pojasnjeno in nepojasnjeno varianco, ob upoštevanju stopinj prostosti, porazdeljuje v posebni porazdelitvi, po njem imenovani F porazdelitvi. 62/77

Testiranje modela kot celote 63/77

Testiranje modela kot celote 64/77

Testiranje modela kot celote 65/77

Funkcija verjetja in informacijski kriteriji 66/77

2.6 Razlaga regresijskih koeficientov

Predstavitev rezultatov ocenjevanja 68/77

Izpis rezultatov v programskem paketu Izpis rezultatov ocenjevanja regresijskega modela linearne produkcijske funkcije. regress q l k Source SS df MS Number of obs = 81 -------------+------------------------------ F( 2, 78) = 52.90 Model 6.9350e+12 2 3.4675e+12 Prob > F = 0.0000 Residual 5.1130e+12 78 6.5551e+10 R-squared = 0.5756 -------------+------------------------------ Adj R-squared = 0.5647 Total 1.2048e+13 80 1.5060e+11 Root MSE = 2.6e+05 ------------------------------------------------------------------------------ q Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- l 9687.383 3640.852 2.66 0.009 2439.003 16935.76 k 2.27941.7553228 3.02 0.003.775678 3.783142 _cons -11875.29 34865.13-0.34 0.734-81286.43 57535.85 ------------------------------------------------------------------------------ 69/77

Izpis rezultatov v programskem paketu Izpis rezultatov ocenjevanja regresijskega modela linearizirane Cobb-Douglasove produkcijske funkcije. regress lq ll lk Source SS df MS Number of obs = 81 -------------+------------------------------ F( 2, 78) = 190.75 Model 178.261263 2 89.1306313 Prob > F = 0.0000 Residual 36.44752 78.467275898 R-squared = 0.8302 -------------+------------------------------ Adj R-squared = 0.8259 Total 214.708783 80 2.68385978 Root MSE =.68358 ------------------------------------------------------------------------------ lq Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- ll.9645479.1199229 8.04 0.000.7257997 1.203296 lk.1885438.0673358 2.80 0.006.0544886.322599 _cons 7.546026.4617465 16.34 0.000 6.62676 8.465293 ------------------------------------------------------------------------------ 70/77

Definicija regresijskega koeficienta 71/77

Definicija regresijskega koeficienta 72/77

Dekompozicija skupnih vplivov 73/77

Dekompozicija skupnih vplivov 74/77

Frisch Waugh ( Lovell) teorem 75/77

Frisch Waugh ( Lovell) teorem 76/77

Frisch Waugh ( Lovell) teorem 77/77

2. Model multiple regresije doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014