Osnove statistike v fizični geografiji 2

Podobni dokumenti
3. Preizkušanje domnev

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

Microsoft Word - SI_vaja5.doc

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

Microsoft Word - Seštevamo stotice.doc

Microsoft Word - RAZISKAVA_II._del.doc

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Primer 1: Analiziramo produkcijske funkcije za podjetja industrijske dejavnosti v RS v podskupini DL Proizvodnja računalnikov in druge opreme za

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

NAVODILA AVTORJEM PRISPEVKOV

2. Model multiple regresije

ENV2:

Brownova kovariancna razdalja

Microsoft Word - SI_vaja1.doc

LaTeX slides

rm.dvi

Osnove verjetnosti in statistika

Microsoft Word - UP_Lekcija04_2014.docx

Vaje: Matrike 1. Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N 0 1 n ; n N Pokaži, da je množica x 0 y 0 x

Microsoft PowerPoint - Standardi znanja in kriteriji ocenjevanja 2 r.ppt [Samo za branje] [Združljivostni način]

PREDMETNI KURIKULUM ZA RAZVOJ METEMATIČNIH KOMPETENC

10. Meritev šumnega števila ojačevalnika Vsako radijsko zvezo načrtujemo za zahtevano razmerje signal/šum. Šum ima vsaj dva izvora: naravni šum T A, k

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

4. tema pri predmetu Računalniška orodja v fiziki Ljubljana, Grafi II Jure Senčar

glava.dvi

Drago Perko PROGRAM DEGAS Drago Perko* Priprava in risanje kart, kartogramov, diagramov in podobnega zahtevata veliko dragocenega časa, računalniški g

LaTeX slides

DN5(Kor).dvi

Osnove matematicne analize 2018/19

MERE SREDNJE VREDNOSTI

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

NAVODILA ZA IZPOLNJEVANJE OBRAZCA

Mladi za napredek Maribora srečanje DOLŽINA»SPIRALE«Matematika Raziskovalna naloga Februar 2015

Univerza na Primorskem FAMNIT, MFI Vrednotenje zavarovalnih produktov Seminarska naloga Naloge so sestavni del preverjanja znanja pri predmetu Vrednot

Microsoft PowerPoint - UN_OM_G03_Marketinsko_raziskovanje

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

ANALITIČNA GEOMETRIJA V RAVNINI

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx

2

MAGIČNI KVADRATI DIMENZIJE 4n+2

Microsoft PowerPoint _12_15-11_predavanje(1_00)-IR-pdf

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite

Prevodnik_v_polju_14_

IZVEDBENA UREDBA KOMISIJE (EU) 2018/ z dne 16. julija o spremembi Izvedbene uredbe (EU) 2017/ za razjasnitev in

Microsoft Word - ELEKTROTEHNIKA2_ junij 2013_pola1 in 2

Poslovna informatika s statistiko - Gregorc, 16_11_09

Uporaba preglednic za obdelavo podatkov B. Golli, PeF 15. november 2010 Kazalo 1 Uvod 1 2 Zgled iz kinematike Izračun hitrosti

FGG13

2. LINEARNA ALGEBRA

Microsoft Word - CelotniPraktikum_2011_verZaTisk.doc

ELEKTRIČNI NIHAJNI KROG TEORIJA Električni nihajni krog je električno vezje, ki služi za generacijo visokofrekvenče izmenične napetosti. V osnovi je "

NASELJENOST V SLOVENIJI

Matematika Diferencialne enačbe prvega reda (1) Reši diferencialne enačbe z ločljivimi spremenljivkami: (a) y = 2xy, (b) y tg x = y, (c) y = 2x(1 + y

Microsoft Word - 170

LABORATORIJSKE VAJE IZ FIZIKE

Poslovilno predavanje

ACAD-BAU-Analiza-prostorov

OSNOVE UMETNE INTELIGENCE

SESTAVA VSEBINE MATEMATIKE V 6

EKVITABILNE PARTICIJE IN TOEPLITZOVE MATRIKE Aleksandar Jurišić Politehnika Nova Gorica in IMFM Vipavska 13, p.p. 301, Nova Gorica Slovenija Štefko Mi

Poskusi s kondenzatorji

Microsoft PowerPoint - Java_spremenljivke

VST: 1. kviz

RUO

Microsoft Word - M

AAA

(Microsoft PowerPoint - vorsic ET 9.2 OES matri\350ne metode 2011.ppt [Compatibility Mode])

MATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje prir

Raziskovalna naloga MASA ŠOLSKIH TORB Področje: biologija Osnovna šola Frana Albrehta Kamnik Avtorja: Jan Maradin in Jaka Udovič, 9. razred Mentorica:

DEDOVANJE BARVNE SLEPOTE

PowerPoint Presentation

FAKULTETA ZA STROJNIŠTVO Matematika 2 Pisni izpit 9. junij 2005 Ime in priimek: Vpisna št: Zaporedna številka izpita: Navodila Pazljivo preberite bese

Slide 1

N

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra unalni²tvo Izobraºevalna matematika Pisni izpit pri predmetu K

FGG14

M

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

Microsoft Word - M docx

Microsoft Word - Astronomija-Projekt19fin

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

Primer 1: V vzorec smo izbrali 35 evropskih držav in zanje pridobili naslednje podatke (datoteka tobak.dta): odstotek prebivalcev, starejših od 65 let

Matematika II (UN) 2. kolokvij (7. junij 2013) RE ITVE Naloga 1 (25 to k) ƒasovna funkcija f je denirana za t [0, 2] in podana s spodnjim grafom. f t

3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja

Vrste

Slide 1

STATISTIKA - zbiranje podatkov - obdelava podatkov - analiza in prikaz podatkov Z besedo statistika označujemo sistematično zbrane številske podatke.

Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah

LaTeX slides

Požarna odpornost konstrukcij

Microsoft Word - 9.vaja_metoda porusnih linij_17-18

(Microsoft Word - Sinhronost svetovnih delni\232kih gibanj - mag. Jure Krajnc TRDA VEZAVA)

1. izbirni test za MMO 2018 Ljubljana, 16. december Naj bo n naravno število. Na mizi imamo n 2 okraskov n različnih barv in ni nujno, da imam

Plaèni sistem v javnem sektorju gozdarstva Sabina Kristan Štefan Bojnec

AAA

AAA

Matematika 2

PowerPoint Presentation

Transkripcija:

Osnove statistike v geografiji - Metodologija geografskega raziskovanja - dr. Gregor Kovačič, doc.

Bivariantna analiza Lastnosti so med sabo odvisne (vzročnoposledično povezane), kadar ena lastnost (spremenljivka X) vpliva na drugo (spremenljivka Y) x y Lastnosti so korelacijsko(stohastično) povezane, kadar ni (neposredne) odvisnosti Y od X oz. je ne poznamo. x y; dani vrednosti x ne ustreza ena sama vrednost y temveč interval možnosti Obliko in jakost povezanosti med dvema spremenljivkama lahko ponazorimo: Grafično (razsevni grafikon) S števili, koeficienti (različno glede na tip spremenljivk)

Razsevni grafikon ali korelacijski diagram Razsevni diagram je grafični prikaz povezanosti med dvema spremenljivkama. Regresijska črta kaže obliko povezanosti: - Linearna - Nelinearna (krivuljna)

Vrste korelacij Glede na smer povezanosti: Pozitivna: z naraščanjem X narašča tudi Y Negativna: z naraščanjem X se vrednosti Y zmanjšujejo Glede na obliko povezanosti: Linearna - premočrtna Nelinearna krivuljna (več vrst, krivulje, 3 in nadaljnjega reda; MS Excel!) Glede na jakost povezanosti: ni povezanosti, neznatna, šibka,, močna (funkcijska) glej naprej

Merjenje povezanosti Za merjenje povezanosti obstaja veliko koeficientov, ki so odvisni od nivoja merjenja (nominalni, ordinalni, številski) in tudi oblike povezanosti Nominalni tip spremenljivk (ena od spremenljivk je nominalna) χ, kontingenčni koeficienti, koeficienti asociacije Ordinalni tip para spremenljivk (ena spremenljivka je ordinalna, druga ordinalna ali boljša) koeficient korelacije rangov (Spearmanov koeficient korelacije) Številski (intervalne in/ali razmernostne) tip para spremenljivk (obe sta številski) Pearsonov koeficient korelacije (linearno povezani številski spremenljivki) Eta koeficient za nelinearno povezani številski spremenljivki (ali eno nominalno in eno številsko spremenljivko). Družbena geografija - χ, Spearmanov in Pearsonov koeficient Fizična geografija Pearsonov in Spearmanov koeficient, saj je večina spremenljivk kvantitativnih številskih in razmernostnih

HI kvadrat test (χ) Samo za računanje s frekvencami Kadar imamo opravka s podatki, ki niso normalno razporejeni Ko preverjamo, ali dejanske frekvence odstopajo od pričakovanih pri določeni hipotezi Včasih z njim ugotavljamo ali obstaja povezanost med spremenljivkama Pri korelaciji (ordinalne, razmernostne spremenljivke) stopnja povezanosti χ test verjetnost povezanosti (nominalne spremenljivke) Zanima nas, ali so razlike v porazdelitvi med spremenljivkami statistično značilne in le učinek vzorca χ test sloni na primerjavi empiričnih (dejanskih) frekvenc s teoretičnimi frekvencami, to so frekvence, ki bi bile v kontingenčni preglednici, če spremenljivki ne bi bili povezani med seboj χ =Σ (f 0 -f t ) f t dejanske frekvence pričakovane (teoretične)

HI kvadrat test (χ) Uporaba (ugotovitve) Frekvence enega vzorca ugotavljamo lahko, ali odstopajo od pričakovanih ob določeni hipotezi Frekvence dveh neodvisnih vzorcev ugotavljamo lahko, ali se razlikujeta v značilnostih Dva odvisna vzorca ugotavljamo lahko, ali je prišlo do spremembe, ali je razlika v različnih značilnostih χ =Σ (f 0 -f t ) f t dejanske frekvence pričakovane (teoretične)

HI kvadrat test (χ) 1. EN VZOREC ena spremenljivka Ničelna hipoteza npr.: H 0 : ni razlike v odgovorih DA NE VEM NE SKUPAJ stopnje svobode: število celic - 1= f 0 6 1 10 48 f t 16 16 16 48 Χ = (6 16) 16 + (1 16) 16 + (10 16) 16 = 9,5 Tabela mejnih vrednosti χ Naslednja stran! χ = 9,50 Če ne bi bilo razlik, bi bil x enak 0 Mejni χ pri 0,05 oz. 5 % stopnji tveganja pri stopnji svobode je (glej preglednico mejnih vrednosti) enak 5,991 s tem zavrnemo ničelno hipotezo Manjši χ pomeni večjo verjetnost, da je ničelna hipoteza resnična Če je χ manjši od stopnje svobode, je zanesljivo mogoče sprejeti ničelno hipotezo

Preglednica mejnih vrednosti Preglednica ima na levi stopnje svobode (SP) v glavi pa verjetnost, da razlik med dejansko in teoretično razporeditvijo ni (to je delež pod krivuljo, ki je pobarvan črno večji, ko je HIkvadrat, manjša je površina pod krivuljo od njegove vrednosti na desno). Če smo pripravljeni zavrniti ničelno hipotezo s tveganjem, ki je 5 % ali manj, potem je pri 3 stopinjah svobode (SP = 3) to mogoče storiti, če je izračunani HI-kvadrat 7,81 ali več, če pa zmanjšamo tveganje na 1 % mora biti izračunani HI-kvadrat najmanj 11,34. V MS Excelu vam funkcija CHIINV izračuna mejno vrednost HI-kvadrata pri določenem tveganju in stopnji svobode in vam zato ni treba gledati v preglednico npr. CHIINV (0.95;4). Probability verjetnost = vstavimo želeno stopnjo tveganja (0-1) Degrees freedom vstavimo stopnjo svobode (prostostne stopnje), ki je odvisna od št. vrstic in stolpcev; SP = (št. vrstic 1 ) x (št. stolpcev 1) V MS Excelu vam funkcija CHITEST izračuna, kolikšno je tveganje in vam zato ni treba gledati v preglednico npr. CHITEST(B4:D6;B11:D13). Izračuna vrednost tveganja pri izračunani vrednosti x CHIINV pa vam za to stopnjo tveganja (verjetnosti, da ničelna hipoteza drži) izračuna vrednost funkcije HI-kvadrat. Izračunan x bo enak šele pri tej stopnji tveganja Če je izračunan x pri večjih stopnjah tveganja večji od tistega v preglednici, zavrnemo ničelno hipotezo Običajno 1 % ali 5 % tveganje razlik med dejansko in teoretično razporeditvijo 9

HI kvadrat test (χ) DVA ALI VEČ NEODVISNIH VZORCEV - + skupaj moški 9 (a) 14 (b) 3 (a+b) ženske 17 (c) 9 (d) 6 (c+d) skupaj 6 (a+c) 3 (b+d) 49 izračun teoretičnih frekvenc: (a+c)(a+b)/skupaj: 9 3/49=1,. število stopenj svobode: (št. stolpcev - 1) x (št. vrstic - 1) 10

Preverjanje domnev pri HI-kvadrat testu H 0 (ničelna hipoteza) : χ = 0 spremenljivki nista povezani - dejanske frekvence so enake teoretičnim H 1 : χ > 0 spremenljivki sta povezani - iz preglednice porazdelitve χ razberemo kritično vrednost te statistike pri določeni stopnji značilnosti oz. tveganja (običajno 1 ali 5 %) Ničelno hipotezo lahko sprejmemo 1. Če je izračunani χ manjši od stopenj svobode. Če je izračunani χ večji od kritične vrednosti, pomeni, da pade v kritično območje ničelna domneva (hipoteza) je zavrnjena 1. Pri (običajno 1 ali 5 %) stopnji značilnosti sprejmemo osnovno domnevo spremenljivki sta statistično značilno povezani med seboj 3. Če smo pripravljeni sprejeti odločitev z višjo stopnjo tveganja, potem sprejmemo ničelno hipotezo, če je verjetnost, da razlik med dejansko in teoretično razporeditvijo frekvenc ni, med 1,00 in 0,05 ali izraženo v % med 100 in 5 %. 4. Če hočemo biti bolj prepričani o veljavnosti hipoteze, potem ničelno hipotezo sprejmemo, kadar je verjetnost, da razlik med teoretičnimi in dejanskimi frekvencami ni, večja od 0,01 oziroma 1 %.

Računanje z dvema ali več neodvisnima vzorcema Odgovor 1 Odgovor Odgovor 3 Vsota χ =Σ (f 0 -f t ) 1. skupina 7 15 39 81 f t. skupina 5 7 18 70 3. skupina 1 33 1 66 Vsota 64 75 78 17 Odgovor 1 Odgovor Odgovor 3 Vsota Χ (7 3,88) = 3,88 (1 3,7) + 3,7 (15 7,99) + 7,99 = 0,80 (39 9,11) + 9,11 +... 1. skupina 3,8894 7,99539 9,1151 81. skupina 0,64516 4,19355 5,1619 70 3. skupina 19,46544,81106 3,735 66 Vsota 64 75 78 17 Izračun po formuli:σ((f0-ft))/ft a) odgovor b) odgovor c) odgovor 1. skupina 0,40506 6,0349 3,355948. skupina 0,918599 0,35548,03813 3. skupina,863165 4,55106 0,31663 (81 x 64) / 17 = 3,88 (7 3,88) / 3,88 število stopenj svobode: (št. stolpcev - 1) x (št. vrstic - 1) H 0 - odgovori po skupinah niso med seboj povezani χ = 0,80 Mejni χ pri 0,05 oz. 5 % stopnji tveganja pri stopnji svobode 4 je (glej preglednico mejnih vrednosti) enak 9,488 Izračunani χ je večji od te vrednosti s tem zavrnemo ničelno hipotezo; torej so povezani spremenljivki sta statistično značilno povezani med seboj

HI kvadrat test (χ) Lahko se računa le s frekvencami Vsota pričakovanih frekvenc mora biti enaka vsoti dejanskih Kadar imamo opravka z značilnostjo, ki se pojavlja ali pa ne, je vedno treba upoštevati tudi število primerov, ko se značilnost ne pojavi Vsaka frekvenca v posameznem polju mora pripadati drugi enoti Nobena pričakovana frekvenca ne sme biti premajhna 0 % celic s f t < 5 združevanje celic Pri x preglednicah mora biti N > 40, sicer nobena celica ne sme imeti f t < 5 Preglednice s številom stopenj svobode > 1: nobena celica ne sme imeti f t < 1 Pri številu stopenj svobode = 1 je treba izvesti Yatesovo korekcijo Statistika χ je lahko le pozitivna

Yatesov popravek Kadar delamo s preglednico x ali kadar imamo celice s frekvencami manjšimi od 5 Pri številu stopenj svobode = 1 je treba izvesti Yatesov popravek Popravek za 0,5 se zmanjša vsaka f 0, kjer velja f t < f 0 za 0,5 se poveča vsaka f 0, kjer velja f t > f 0 Dejanska F Dejanska F -Yp Teoretična F 7 7,5 9 5 4,5 18 1 1,5 1 18 17,5 16

Literatura in viri Ferligoj, A., 1995: Osnove statistike na prosojnicah. Samozaložba z Batagelj. Statistika, 007: Electronic statistic textbook, StatSoft. Dostopno na medmrežju. Rogerson, P. A., 000: Statistical Methods for Geography. Sage Publications Inc. Kastelec. D. in K. Košmelj, 010: Osnove statistike z Excelom 007. Dostopno na medmrežju.