Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Podobni dokumenti
MERE SREDNJE VREDNOSTI

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

Osnove verjetnosti in statistika

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

Microsoft Word - SI_vaja5.doc

Microsoft Word - SI_vaja1.doc

Statistika, Prakticna matematika, , izrocki

Osnove statistike v fizični geografiji 2

glava.dvi

Microsoft Word - RAZISKAVA_II._del.doc

VST: 1. kviz

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

ENV2:

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

2. LINEARNA ALGEBRA

3. Preizkušanje domnev

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

1 Diskretni naklju ni vektorji 1 1 Diskretni naklju ni vektorji 1. Dopolni tabelo tako, da bosta X in Y neodvisni. X Y x x x x x

ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI Fakulteta za družbene vede Študentska anketa o študiju na III. stopnji Študijsko leto 2017/18 Pripombe, komenta

AAA

AAA

AAA

AAA

AAA

AAA

Slide 1

ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI EVALVACIJSKO POROČILO ZA PROGRAME I IN II STOPNJE Fakulteta za družbene vede Splošni vidiki študijskega procesa

2. Model multiple regresije

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

Povzetek analize anket za študijsko leto 2012/2013 Direktor Andrej Geršak Povzetek letnega poročila je objavljen na spletni strani Celje,

PRILOGA 2 Minimalni standardi kakovosti oskrbe za izbrane dimenzije kakovosti oskrbe in raven opazovanja posameznih parametrov kakovosti oskrbe 1. NEP

AAA

AAA

AAA

AAA

4.Racionalna števila Ulomek je zapis oblike. Sestavljen je iz števila a (a ), ki ga imenujemo števec, in iz števila b (b, b 0), ki ga imenujemo imenov

AAA

LaTeX slides

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

Microsoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode]

Microsoft Word - Objave citati RIF in patentne prijave za MP.doc

AAA

AAA

AAA

Jože Berk, Jana Draksler in Marjana Robič Skrivnosti števil in oblik Vsebinsko izpopolnjeno podpoglavje VERJETNOST 9

AAA

AAA

2

2

AAA

AAA

2

AAA

AAA

AAA

AAA

Postopek poracuna 2007 za JU

AAA

AAA

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod

Osnove matematicne analize 2018/19

Brownova kovariancna razdalja

AAA

AAA

AAA

v sodelovanju z S.BON-1 [-] S.BON AJPES za podjetje: Podjetje d.o.o. Ulica 1, 1000 Ljubljana Matična številka: ID za DDV / davčna številka:

AAA

REŠENE NALOGE IZ VERJETNOSTI IN STATISTIKE Martin Raič Datum zadnje spremembe: 11. junij 2019

Zapisnik 1

Slide 1

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

Mladi za napredek Maribora srečanje DOLŽINA»SPIRALE«Matematika Raziskovalna naloga Februar 2015

00main.dvi

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

IZVEDBENA UREDBA KOMISIJE (EU) 2018/ z dne 16. julija o spremembi Izvedbene uredbe (EU) 2017/ za razjasnitev in

PowerPointova predstavitev

Verjetnost in statistika

Sezana_porocilo okt2013

Microsoft Word - odnos-do-evra-december-2006.doc

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite

Microsoft Word - avd_vaje_ars1_1.doc

Učinkovitost nadzora nad varnostjo živil

2

Primer 1: Analiziramo produkcijske funkcije za podjetja industrijske dejavnosti v RS v podskupini DL Proizvodnja računalnikov in druge opreme za

MERJENJE GORIŠČNE RAZDALJE LEČE

V05 - Analiza nukleotidnih zaporedij in molekulsko kloniranje

ANALITIČNA GEOMETRIJA V RAVNINI

Microsoft Word - Visoko_citirane_3.doc

2

Ime in priimek

PowerPointova predstavitev

SPLOŠNA MATURA IZ PREDMETA MATEMATIKA V LETU 2017 Poročilo DPK SM za matematiko Vsebina 1 Struktura kandidatov Struktura kandidatov pri sploš

CY110 Sistem glavnega ključazmogljivost, ki presega standard

Microsoft PowerPoint - OVT_4_IzolacijskiMat_v1.pptx

SZGG_2012_Dolsak_Sraj

Model IEUBK za napoved vsebnosti svinca v krvi otrok in njegova uporaba na primeru Zgornje Mežiške doline

Delavnica Načrtovanje digitalnih vezij

Microsoft Word - PR18-HoceZrak-letno2018.docx

Transkripcija:

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

VERJETNOST osnovni pojmi Poskus: dejanje pri katerem je izid negotov met kovanca ali igralne kocke pravočasen prihod na predavanja psihoterapevtska obravnava Prostor vzorčenja: množica vseh možnih izidov za pravočasen prihod na predavanja: [da, ne] za met: 1 kovanca: [cifra (C), grb(g)] 2 kovancev: [CC, CG, GC, GG] 3 kovancev: [CCC, CCG, CGC, GCC, CGG, GCG, GGC, GGG]

VERJETNOST osnovni pojmi Dogodek: katerakoli podmnožica prostora vzorčenja Sestavljeni dogodek: dogodek, ki ga lahko razdelimo na več preprostejših dogodkov pri metu 3 kovancev dobimo 1 cifro trije zamudijo na predavanje psihoterapija pomaga vsem klientom ki so v obravnavi v danem obdobju Enostavni dogodek: dogodek, ki se ga ne da več razdeliti na bolj preproste dogodke pri metu kovanca dobimo cifro pri metu 3 kovancev dobimo [GCG] študent/ka zamudi na predavanje psihoterapija pomaga klientu

VERJETNOST osnovni pojmi Empirična verjetnost: delež pojavljanja danega dogodka med vsemi dogodki/izidi, ki smo jih opazili P dogodek = Št. dogodek Št. opaženidogodki Teoretična verjetnost: delež danega dogodka med vsemi možnimi dogodki verjetnost, da bomo v 4 metih dobili 3 cifre verjetnost, da študent/ka zamudi na predavanje verjetnost, da s psihoterapijo pomagamo klientu Ugotavljamo jo najlažje, če so enostavni dogodki, iz katerih je dogodek sestavljen vsi enako verjetni

VERJETNOST osnovni pojmi Pričakovana vrednost: povprečna vrednost, ki jo dobimo, ko izvedemo zelo veliko (vse možne) poskusov x vrednost vsakega od izidov p verjetnost vakega od izidiv M = x x p x Če dobimo za C = 1, G = 0, je pričakovana vrednost velikega števila metov 0,5 (pri poštenem kovancu) Aritmetična sredina je pričakovana vrednost podatkov, če imajo vsi enako verjetnost, da se pojavijo

Vzorec in populacija Populacija: množica enot z določenimi (zanimivimi) lastnostmi študentke v 3. letniku FSD prebivalci Slovenije starejši od 65 let državljani Republike Slovenije starejši od 65 let mape za vaje pri Metodologiji s statistiko II Vzorec: končni del populacije, ki ga proučujemo, da bi pridobili informacije o lastnostih celote (populacije) študentke na vajah Metodologije II 2. 12. 2008 50 ljudi starejših od 65 let, slučajno izbranih iz Registra prebivalstva RS mape tretje skupine, ki so bile oddane po vajah 4. 12. 2008

Empirična in porazdelitev teoretska porazdelitev Empirične vzorčne porazdelitve 4 od 12 9,00 8,00 7,00 6,00 Odstotek 5,00 4,00 1.vzorec 2.vzorec teoretično 3,00 2,00 1,00 0,00 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 5,75 6 6,25 6,5 6,75 7 7,25 7,5 7,75 8 8,25 8,5 8,75 9 9,25 9,5 9,75 10 10,3 10,5 Povprečje

Empirična in porazdelitev teoretska porazdelitev Kumulativni odstotek 0,00 20,00 40,00 60,00 80,00 100,00 120,00 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 5,75 6 6,25 6,5 6,75 7 7,25 7,5 7,75 8 8,25 8,5 8,75 9 9,25 9,5 9,75 10 10,25 10,5 Povprečja Odstotek 1.vzorec 2.vzorec teoretično

Teoretska porazdelitev različno velikih vzorcev Povprečja 4 in 8 iz 12 14,0 12,0 10,0 Procent 8,0 6,0 4,0 2,0 0,0 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 5,75 6 6,25 6,5 6,75 7 7,25 7,5 7,75 8 8,25 8,5 8,75 9 9,25 9,5 9,75 10 10,3 10,5 Vrednosti

NAPAKA VZORČENJA e= x e - napaka vzorčne ocene aritmetične sredine x - aritmetična sredina vzorca (statistika) µ - aritmetična sredina populacije (parameter).

NAPAKA VZORČENJA primer Raziskava o življenjskih razmerah starejših občanov Ljubljane (Mesec, Majcen 1982) 31.113 Ljubljančanov, starih 65 let ali več slučajnostni vzorec 730 oseb v populaciji je bilo 38,28 % starih 75 let in več v vzorcu je bilo v tej starosti 39,04 % oseb Napaka: ep =39,04 38,28 =0,76

PORAZDELITEV VZORČNIH OCEN Empirična porazdelitev: porazdelitev parametrov (npr. aritmetične sredine) iz VELIKEGA števila vzorcev Teoretična porazdelitev: porazdelitev parametrov izračunanih iz VSEH MOŽNIH kombinacij enot v vzorcih (vseh možnih vzorcev): N K n = N n = N! n! N! n! = 12! 4!8! =495

PORAZDELITEV VZORČNIH OCEN Empirična in teoretična porazdelitev 45 40 35 30 število 25 20 500 vzorcev teoretično 15 10 5 0 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 5,75 6 6,25 6,5 6,75 7 7,25 7,5 7,75 8 8,25 8,5 8,75 9 9,25 9,5 9,75 10 10,25 10,5 aritmetične sredine

Standardna napaka Standardna napaka je standardni odklon porazdelitve statistik izračunanih iz vseh možnih vzorcev standardni odklon populacije: populacija= 30,25 12 =3,452 standardni odklon vseh možnih vzorcev: vzorci= 1066,81 =1,468 495 vzorcev = populacije N n n N 1 = 3,352 4 12 4 12 1 =1,468

Gausova normalna porazdelitev Temeljna teoretska porazdelitev (vse empirične in teoretske porazdelitve se ji približujejo) Veliko (recimo neskončno) enot, na vrednost vpliva veliko (recimo neskončno) dejavnikov. Površina pod funkcijo gostote porazdelitve je 1. Je teoretična porazdelitev Dobro opisuje porazdelitev okoli pričakovane vrednosti, če so razlike posledica zgolj slučajnih napak.

Gausova normalna porazdelitev Njen položaj in oblika sta odvisna samo od dveh parametrov aritmetične sredine (μ) standardnega odklona (σ) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 Standardna M = 5 M = 5; s = 2 0,1 0,05 0-5 -4-3 -2-1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Izračun standardne napake Formula za izračun standardne napake aritmetične sredine s x = n N n N 1 Standardnega odklona populacije ne poznamo, zato uporabimo najboljšo oceno, ki nam je na voljo: oceno iz vzorca s = s x n N n N 1 je korekturni faktor pri vzorcih brez ponavljanja n in manjša standardno napako. N N 1 Smiselno ga je uporabiti, če je n > N/100

Aritmetična sredina Standardne napake različnih statistik s = s x n Mediana Standardni odklon Koeficient korelacije Razlika aritmetičnih sredin (neodvisni) s Me = 1,2535 s n s s = s 2 n s x = 1 r n 1 s x 1 x 2 = s x 1 2 2 s x 2 Razlika aritmetičnih sredin (odvisni) 2 s x 2 2 2 r s x 1 2 2 s x 2 s x 1 x 2 = s x 1

Ocenjevanje parametrov Ocene parametrov na podlagi vzorca praviloma: Niso enake vrednosti parametra (niso točne) So blizu vrednosti parametra Porazdeljujejo se po normalni porazdelitvi okoli parametra populacije Deleže pod normalno krivuljo poznamo

Ocenjevanje parametrov

Ocenjevanje parametrov

Logika intervala zaupanja Na podlagi statistike izračunane iz enega vzorca lahko sklepamo o vrednosti parametra

Logika intervala zaupanja 95% verjetnosti je, da je statistika za 1,96 standardne napake oddaljena od parametra

Logika intervala zaupanja V 95% primerov je torej parameter največ 1,96 standardne napake oddaljen od statistike

z-vrednosti za intervale zaupanja % zaupanja Tveganje (1 α) α z 99,9 0 3,3 99 0,01 2,58 95 0,05 1,96 90 0,1 1,64 80 0,2 1,28

Ocenjevanje parametrov Od 400 študentov VŠSD (N) so jih 120 (n) anketirali glede poučenosti o aidsu Rezultati: Povprečno število točk na testu = 43 točk s = 5,1 točke Določi meje intervala zaupanja v aritmetično sredino pri stopnji tveganja 0,05

Ocenjevanje parametrov N n = 400 120 =6,7 za izračun uporabimo korekturni faktor s x= s n N n N 1 = 5,1 120 400 120 400 1 =0,4656 0,8377=0,39 x z s 0,05 x =43 1,96 0,39=42,24 x z s 0,05 x =43 1,96 0,39=43,76 S 95% zaupanjem lahko trdimo, da je aritmetična sredina populacije med 42,24 in 43,76