2. LINEARNA ALGEBRA

Podobni dokumenti
Statistika, Prakticna matematika, , izrocki

Microsoft Word - SI_vaja1.doc

MERE SREDNJE VREDNOSTI

ENV2:

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

glava.dvi

STATISTIKA - zbiranje podatkov - obdelava podatkov - analiza in prikaz podatkov Z besedo statistika označujemo sistematično zbrane številske podatke.

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Poslovna informatika s statistiko - Gregorc, 16_11_09

2. Model multiple regresije

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Osnove statistike v fizični geografiji 2

Microsoft Word - RAZISKAVA_II._del.doc

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

3. Preizkušanje domnev

Osnove verjetnosti in statistika

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

Matematika Diferencialne enačbe prvega reda (1) Reši diferencialne enačbe z ločljivimi spremenljivkami: (a) y = 2xy, (b) y tg x = y, (c) y = 2x(1 + y

Vaje: Matrike 1. Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N 0 1 n ; n N Pokaži, da je množica x 0 y 0 x

STAVKI _5_

PREDMETNI KURIKULUM ZA RAZVOJ METEMATIČNIH KOMPETENC

NAVODILA AVTORJEM PRISPEVKOV

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx

Osnove matematicne analize 2018/19

Microsoft Word - vprasalnik_AZU2007.doc

IND/L Zakon o državni statistiki (Uradni list RS, št. 45/1995 in št. 9/2001) Letni program statističnih raziskovanj (Uradni list RS, št. 97/2013) Spor

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

VST: 1. kviz

Microsoft Word - SI_vaja5.doc

4.Racionalna števila Ulomek je zapis oblike. Sestavljen je iz števila a (a ), ki ga imenujemo števec, in iz števila b (b, b 0), ki ga imenujemo imenov

FGG13

Microsoft Word - Seštevamo stotice.doc

2

Vrste

IND-L Zakon o državni statistiki (Uradni list RS, št. 45/95 in št. 9/01) Letni program statističnih raziskovanj za leto 2011 (Uradni list RS, št. 92/1

Slide 1

Mladi za napredek Maribora srečanje DOLŽINA»SPIRALE«Matematika Raziskovalna naloga Februar 2015

DN5(Kor).dvi

Slide 1

LABORATORIJSKE VAJE IZ FIZIKE

Microsoft Word - 10-Selekcijski intervju _4.del_.docx

MERJENJE GORIŠČNE RAZDALJE LEČE

resitve.dvi

Microsoft PowerPoint - Mocnik.pptx

PRILOGA 2 Minimalni standardi kakovosti oskrbe za izbrane dimenzije kakovosti oskrbe in raven opazovanja posameznih parametrov kakovosti oskrbe 1. NEP

LaTeX slides

Zakon o državni statistiki (Uradni list RS, št. 45/1995 in št. 9/2001) Letni program statističnih raziskovanj (Uradni list RS, št. 89/2015) Sporočanje

1. izbirni test za MMO 2018 Ljubljana, 16. december Naj bo n naravno število. Na mizi imamo n 2 okraskov n različnih barv in ni nujno, da imam

7. VAJA A. ENAČBA ZBIRALNE LEČE

Microsoft PowerPoint - Standardi znanja in kriteriji ocenjevanja 2 r.ppt [Samo za branje] [Združljivostni način]

11. Navadne diferencialne enačbe Začetni problem prvega reda Iščemo funkcijo y(x), ki zadošča diferencialni enačbi y = f(x, y) in začetnemu pogo

2019 QA_Final SL

ACAD-BAU-Analiza-prostorov

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI Fakulteta za družbene vede Študentska anketa o študiju na III. stopnji Študijsko leto 2017/18 Pripombe, komenta

00main.dvi

Spremljanje in obvladovanje stroškov

M

Spletno raziskovanje

Microsoft Word - UP_Lekcija04_2014.docx

Biometrija 1 Poglavje 1 PORAZDELITVE NAKLJUČNIH SPREMENLJIVK Porazdelitve nam predstavljajo pogostnost posameznih vrednosti. Predstavimo jih lahko s š

PowerPointova predstavitev

Poslovilno predavanje

Brownova kovariancna razdalja

STATISTIČNA ANALIZA SIMPLIA»NOČI V STARI LJUBLJANI«

untitled

2

Geometrija v nacionalnih preverjanjih znanja

KONTINGENČNI PRISTOP K OBLIKOVANJU SISTEMA STRATEŠKEGA POSLOVODNEGA RAČUNOVODSTVA: EMPIRIČNA PREVERBA V SLOVENSKIH PODJETJIH

Evalvacijsko porocilo: Fakulteta za družbene vede

resitve.dvi

2

Sezana_porocilo okt2013

Microsoft Word - 25_LPK_E_PE_L2011.doc

10. Meritev šumnega števila ojačevalnika Vsako radijsko zvezo načrtujemo za zahtevano razmerje signal/šum. Šum ima vsaj dva izvora: naravni šum T A, k

Univerza na Primorskem FAMNIT, MFI Vrednotenje zavarovalnih produktov Seminarska naloga Naloge so sestavni del preverjanja znanja pri predmetu Vrednot

2

POSLOVNA MATEMATIKA S STATISTIKO JULIJA LAPUH BELE

PowerPointova predstavitev

Microsoft PowerPoint - UN_OM_G03_Marketinsko_raziskovanje

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra unalni²tvo Izobraºevalna matematika Pisni izpit pri predmetu K

Srednja šola za oblikovanje

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/TESTI-IZPITI-REZULTATI/ /Izpiti/FKKT-avgust-17.dvi

MATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje prir

4. tema pri predmetu Računalniška orodja v fiziki Ljubljana, Grafi II Jure Senčar

Matematika 2

Model IEUBK za napoved vsebnosti svinca v krvi otrok in njegova uporaba na primeru Zgornje Mežiške doline

Avtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri

SESTAVA VSEBINE MATEMATIKE V 6

ANALITIČNA GEOMETRIJA V RAVNINI

RAZLIKE MED MSRP 16 IN MRS 17 Izobraževalna hiša Cilj

Microsoft Word - IRDO doc

v sodelovanju z S.BON-1 [-] S.BON AJPES za podjetje: Podjetje d.o.o. Ulica 1, 1000 Ljubljana Matična številka: ID za DDV / davčna številka:

Planning and Control of Operations

3 Matematični dosežki v vsebinskih in kognitivnih področjih Kot je opisano v izhodiščih raziskave TIMSS 2007, smo s preizkusi znanja preverjali znanje

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

Transkripcija:

UPORABNA MATEMATIKA V LOGISTIKI za višješolsko strokovno izobraževanje (OPISNA ) 1

Cilj tega sklopa predavanja je predstaviti obvladovanje računskih spretnosti pri reševanju logističnih problemov in pri statistični analizi. Pravilen izračun iskane količine je seveda pomemben, mnogokrat pa je še pomembnejša interpretacija izračunanega rezultata. Na svoji poklicni poti boste morda morali sprejeti kako pomembno poslovno odločitev. Svoje sodelavce boste morali prepričati v pravilnost svoje odločitve. Argumente boste morali podpreti z izračuni in izračunano korektno interpretirati. Ali pa boste morda želeli analizirati povpraševanje potencialnih kupcev izdelka, s katerim želite prodreti na tržišče. V teh in podobnih primerih vam bo priskočilo na pomoč vaše znanje matematike in statistike. V uvodu je predstavljeno nekaj matematičnih zakonitosti, prikazanih nekaj računskih spretnosti in obdelana dva temeljna matematična modela soodvisnosti med dvema spremenljivima količinama. 2

Beseda statistika izvira iz latinske besede status, ki pomeni država. Statistika je kot metoda za zbiranje podatkov zelo stara, saj so že v starem veku. zbirali podatke o prebivalstvu, pridelkih itd. Pravi razvoj statistike se je začel v 17. stoletju, ko so znani matematiki tega obdobja postavili temelje verjetnostnega računa, na katerem temelji matematična statistika. V 20. stoletju je z razvojem računalništva postala statistika širše uporabljana. Osnovni namen statistike je razumevanje pojavov iste vrste, ki se pojavljajo v velikem številu, zato jih imenujemo množični pojavi. Množičen pojav je na primer serijska proizvodnja določenega izdelka. Med osnovne naloge statistike štejemo zbiranje, razvrščanje in urejanje podatkov ter sprejemanje zaključkov, kot so npr. odkrivanje lastnosti in zakonitosti populacije in napovedovanje vrednosti. 3

Statistika je veja matematike, ki proučuje metode zbiranja, urejanja, kvantitativne obdelave, prikazovanja in analiziranja številskih podatkov. Ko zberemo podatke, jih je potrebno»obdelati«. Metodološka obdelava je odvisna od namena in cilja statistične raziskave. V vsakem primeru, pa naj bi vsebovala: - ureditev podatkov, - grafični prikaz, - izračun parametrov, - interpretacijo. 4

Množica, ki jo statistično proučujemo, se imenuje populacija. Populacija je lahko končna ali neskončna množica enot, kot so predmeti, ljudje, dogodki ali kaj drugega. Populacijo moramo opredeliti stvarno, geografsko in časovno: - s stvarno opredelitvijo natančno določimo, kdo ali kaj spada vanjo in kdo ne, - z geografsko opredelitvijo povemo, kje je zajeta populacija, - s časovno opredelitvijo pa kdaj. Število statističnih enot, ki jih zajamemo v raziskavi, po navadi označujemo N (numerus). 5

Elementi populacije se imenujejo statistične enote. Pogosto ne moremo, ne želimo ali pa je predrago proučevati celotno populacijo, zato izberemo le podmnožico populacije, ki jo imenujemo vzorec, nato pa na podlagi lastnosti vzorca sklepamo o lastnostih populacije. Podmnožica je slučajno izbrana, če ima vsak element enako verjetnost, da bo izbran v vzorec. Lastnosti statistične enote, ki jih raziskujemo, imenujemo statistični podatek ali statistična spremenljivka. Pri tem poskušamo zagotoviti reprezentativnost vzorca. Vzorec je reprezentativen, če so rezultati raziskave na vzorcu enaki, kot bi bili rezultati raziskave na celotni populaciji. 6

Slučajni vzorec dobimo s slučajnim izborom enot populacije v vzorec. S tem dosežemo, da je struktura vzorca kar najbolj podobna strukturi populacije. Pogosto rečemo, da slučajni vzorec najbolje predstavlja (reprenzetira) celotno populacijo. Velikost vzorca bomo označili z n. Statistična spremenljivka opisuje lastnost enot. Primeri statističnih spremenljivk so spol oseb, število prometnih nesreč, število potnikov na vlaku, poraba goriva avtomobila na 100 km. V vseh opisanih primerih se izraz spremenljivka uporablja upravičeno, saj vsaka opazovana enota zavzame neko določeno vrednost. Te vrednosti so lahko med seboj različne, lahko pa ima nekaj enot enake vrednosti. Vrednosti spremenljivk bomo pogosto imenovali podatki. 7

Glede na način izražanja vrednosti spremenljivke delimo spremenljivke na: opisne, pri katerih vrednosti le opišemo z besedami in jih ne moremo ovrednotiti numerično (npr. spol, kraj bivanja, nacin transporta) in številske, pri katerih vrednosti izrazimo numerično. Številske spremenljivke delimo na diskretne in zvezne. Diskretne spremenljivke imajo za zalogo vrednosti končno ali neskončno zaporedje realnih števil. Ce vrednosti diskretne spremenljivke dobimo s stetjem, je njena zaloga vrednosti podmnožica naravnih števil (npr. število prometnih nesreč, število potnikov na avtobusu). Zvezne spremenljivke lahko zavzamejo vsako vrednost iz nekega intervala. Vrednosti zveznih spremenljivk dobimo z merjenjem (npr. čas, ki ga potrebuje voznik za določeno pot) ali z izračunavanjem (npr. poraba goriva vozila na 100 km). 8

Parameter je statistična karakteristika populacije, ki ga izračunamo iz podatkov celotne populacije in vzorčna statistika je statistična karakteristika vzorca, ki ga izračunamo iz podatkov vzorca Kot primer parametra lahko navedemo povprečje populacije ali pa delež populacije z določeno lastnostjo. Pri statističnem raziskovanju najprej zberemo podatke od posameznih enot vzorca, na podlagi teh podatkov izračunamo vzorčno statistiko, ki opisuje lastnost vzorca, nato pa s statističnem sklepanjem, ki temelji na matematični statistiki, sklepamo o parametru populacije. 9

Opisna statistika se ukvarja s predstavitvijo oz. povzemanjem pridobljenih podatkov. Množico informacij želimo obdelati in jih predstaviti na čim bolj nazoren način. Inferenčna statistika raziskuje medsebojno povezanost določenih statističnih parametrov. Ukvarja se tudi z ugotavljanjem zanesljivosti sklepov, ki smo jih dobili tako, da nismo raziskali celotne populacije, pač pa samo njen manjši del, vzorec. V nadaljevanju bomo spoznali osnove opisne statistike in osnove statističnega sklepanja. 10

Urejanje podatkov Podatke, ki smo jih pridobili od opazovanih statističnih enot populacije, moramo primerno urediti. Najprej si bomo ogledali urejanje številskih podatkov, nato pa se opisnih. Pri številskih podatkih imamo dve možnosti: če je podatkov malo, npr. do 30, jih uredimo po velikosti v ranžirno vrsto, če pa je podatkov veliko, jih grupiramo in prikažemo v tabeli, ki jo imenujemo frekvenčna porazdelitev. Število enot populacije smo označili z N. Ranžirna vrsta Po velikosti urejenim številskim podatkom v ranžirni vrsti določimo zaporedno številko, ki jo imenujemo rang. Rang nam pove, na katerem mestu v ranžirni vrsti se nahaja podatek. Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang. Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili različni med seboj. 11

Primer 1: Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolada) ter izmerimo težo. Vzorec X i (posamezni rezultat) RANŽIRNA VRSTA: 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 149,5 150,4 150,6 150,6 150,9 151,5 151,8 152,2 153,4 12

13

Običajno se podatke uredi v tabelah. Danes se za to uporablja računalniško orodje EXCEL, ki ga boste uporabljali tudi vi pri reševanju študijskih primerih. Če podatke vnesete v excelovo tabelo, ne boste imeli težav z grafično predstavitvijo, saj vam excel ponuja različne vrste grafikonov. Vi se le morate odločite, kateri je za prikaz podatkov, ki ste jih zbrali, najprimernejši. Primer 1: Linijski grafikon teže vzorcev mlečne čokolade 14

Sedaj pa sledi najtežji del obdelave, to je analitični del, ki mora vsebovati izračune in interpretacije statističnih parametrov. Kateri statistične parametre naj bi vsebovala posamezna poročila, je odvisno od namena in ciljev statističnega proučevanja. Na nacionalnem nivoju je to v pristojnosti Statističnega urada Republike Slovenije; na podjetniškem nivoju pa je to prepuščeno menedžmentu, razen na tistih področjih, ki jih določajo predpisi. Odločiti se boste morali za tiste parametre, ki po vašem mnenju najbolj odražajo lastnosti populacije. Pri izračunu statističnih parametrov (aritmetična sredina, mediana, modus) je treba upoštevati pravila in postopke, ki jih predpisuje stroka. Aritmetična sredina, mediana, modus kažejo osrednjo težnjo rezultatov, okrog njih se rezultati kopičijo: Statistične parametre izračunamo za negrupirane in grupirane podatke. 15

Aritmetična sredina 16

Aritmetična sredina Aritmetična sredina je povprečje rezultatov in je enaka kvocientu vsote vseh vrednosti statistične spremenljivke s številom teh vrednosti x Negrupirani/posamezni rezultati = n i i= 1 Nx = N x n i= 1 x i x = vsota št.vrednos ti 17

Aritmetična sredina Primer 2: Iz proizvodnje čokolad izračunajmo povprečno težo 9-ih izdelkov (150g lešnikove čokolada) Vzorec X i (posamezni rezultat) 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 18

Aritmetična sredina - tehtana aritmetična sredina Primer 3: Izračunajte povprečno število zaposlenih v posamezni trgovini za podane podatke o številu trgovin s številom zaposlenih nn xx = ii=1 ff ii xx ii nn = ff 1 xx 1 + ff 2 xx 2 + ff 3 xx 3 +.. + ff nn xx nn ff ii ff 1 + ff 2 +.. +ff nn ii=1 xx = 20 1 + 10 2 + 30 3 + 25 4 + 15 5 20 + 10 + 30 + 25 + 15 = 305 100 = 33, 0000 Odg: Povprečno število zaposlenih je 3,05 v posamezni trgovini. 19

Primer za pomanjkljivost aritmetične sredine Štiri osebe so pri testiranju dosegle naslednje rezultate: 21, 22, 23 in 36. xx = 25,50. Ta vrednost pade v praznino med prvimi tremi in četrtim rezultatom. Težko bi trdili, da posamezni rezultati težijo k temu povprečju in da jih to povprečje dobro zastopa. Skrajna vrednost 36 ga je namreč preveč»potegnila proti sebi«. V tem primeru bi mediana (Me) gotovo bolje opisovala osrednjo težnjo rezultatov kot aritmetična sredina ( xx) koliko znaša mediana Me? 20

Mediana (Me) Mediana ali središčnica je tista srednja vrednost statistične spremenljivke, pri kateri je polovica vrednosti večjih, druga polovica vrednosti pa manjših od dane vrednosti (50% je manjših vrednosti in 50% večjih vrednosti). Statistične podatke razvrstiti po velikosti: Neparno število enot: r = int Me = ( ) N x r + 1 2 Parno število enot: r = N Me = 2 x r + x r 2 +1 21

Mediana (Me) Je rezultat na sredini ranžirne vrste Najprej izračunamo medianski položaj: (N+1)/2 Mediana je ta rezultat v ranžirni vrsti (prešteješ). V našem primeru Če bi bilo sodo število, vzameš povprečje obeh rezultatov Pomanjkljivost: upošteva le vrednost na sredi (nenatančna mera) Prednost: neodvisnost od skrajnih vrednosti 22

Mediana (Me) 23

Primer za pomanjkljivost aritmetične sredine brez podatka o standardnem odklonu (δδ) Pri eni zelo odstopajoči vrednosti nam xx daje napačen vtis. Podatek o povprečni plači v tem podjetju bi bil 2875 evrov. Enako xx bi dobili npr. za podatke 2000, 2000, 2000 in 5.500 (direktor), le da bi bila razpršenost posameznih rezultatov okoli povprečja v tem primeru bistveno manjša. 24

Preverjanje razlik med aritmetičnimi sredinami Npr. razlika na vprašalniku učnih navad med fanti in dekleti je 2 točki (fantje 39, dekleta 41) Razlika je zelo majhna ali res obstaja ali je zgolj naključna posledica t.i. napake vzorčenja (pojavi se zaradi slučajnih dejavnikov, ker smo rezultate zbrali na vzorcu, ne na celi populaciji)? Preverimo s posebnimi stat. metodami, ki se jih ne bomo učili, pač pa bomo sklepali na oko. Razlika med dvema xx je statistično pomembna: z visoko stopnjo prepričanosti (običajno na nivoju 95%) lahko trdimo, da res obstaja v populaciji (le 5% tveganje, da je v resnici ni). 25

Razpršenost rezultatov K vsaki xx sodi podatek o tem, koliko so rezultati okoli nje: Zgoščeni (bolj reprezentativna) npr. xx=50 za rezultate 48, 49, 50, 51, 52 Razpršeni (manj reprezentativna) npr. xx=50 za rezultate 5, 5, 60, 130 Najpreprostejša mera je razpon: razlika med maksimalnim in minimalnim rezultatom Najpogosteje pa računamo standardni odklon ali standardno deviacijo: pove, kolikšna so odstopanja posameznih rezultatov od aritmetične sredine σσ = xx xx 2 nn 26

Primer 3: Iz proizvodnje čokolad izračunajmo standardni odklon vzorca 9-ih izdelkov (150g mlečna čokolada) 27

Razpršenost (nad.) Velika in mala razpršenost: sploščena in koničasta distribucija Primer za pomen mere razpršenosti: če se odpravljamo na počitnice, nam podatek o povprečni temperaturi pove, katerih oblačil naj vzamemo največ, podatek o razpršenosti pa, ali moramo vzeti tudi bistveno toplejša/lažja oblačila: xx = 20 (ali to pomeni od 18 do 22 ali od 10 do 30?) 28

MERA DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min 29

Modus (Mo) Modus ali gostiščnica se imenuje najpogostejša vrednost ali najpogostejši podatek v množici vseh vrednosti Je rezultat, ki se največkrat pojavlja v podatkih Prednosti: tudi pri kvalitativnih spremenljivkah (ločene kategorije, npr. spol, stan) Pomanjkljivosti: upošteva le najpogostejšo vrednost (nenatančna mera) 30

Modus (Mo) Primer 4: Iz proizvodnje čokolad izračunajmo modus (Mo) vzorca 9-ih izdelkov (150g lešnikove čokolada) Vzorec X i (posamezni rezultat) RANŽIRNA VRSTA: 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 149,5 150,4 150,6 150,6 150,9 151,5 151,8 152,2 153,4 31

KOEFICIENT VARIACIJE (V) Omogoča primerjavo različnih pojavov glede variabilnosti. Koeficient variacije pove kolikšen odstotek vrednosti aritmetične sredine zavzema standardni odklon. Večji kot je večja je razpršenost podatkov. Definiran je kot razmerje med standardnim odklonom in aritmetično sredino, od standardnega odklona, ki prav tako prikazuje razpršenost statističnih enot, pa se razlikuje po tem, da je merjen v odstotkih in ga je zato moč uporabiti za primerjavo razpršenosti enot različnih statističnih populacij. kjer je: σσ standardni odklon xx aritmetična sredina VV = 100 σσ xx 32

Primer 5: Iz proizvodnje čokolad izračunajmo varianco in koeficient variance V vzorca 9-ih izdelkov (150g lešnikove čokolada) VV = 100 δδ xx = 100 1,0867 151,21 = 108,67 151,21 = 0,71867 Interpretacija: Pri vzorcu 9-ih kosov mlečnih čokolad predstavlja standardni odklon 0,71867% vrednosti aritmetične sredine. 33

Mo 0 38 0 38 Q Q1 3 Me x Mo Me x Q1 Q3 0 38 Q 1 x Mo Me Q 3 x = M e M e Q = M = Q O M 1 3 e e 1 3 e M M o < M Q e < x < Q M x < M Q e M < M < M 3 e e Q 1 o 34

MERA DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min 35

36

Določanje vrednosti spremenljivke, da bi se razporedila na opredeljeno mesto v množici imenujemo ga kvantil. Vrednosti za dano spremenljivko v grafikonu kumulative frekvenc, lahko izračunamo. Prav tako lahko izračunamo položaj določene vrednosti, če poznamo podatek o tem, kolikšen delež vrednosti je manjših oziroma večjih od dane vrednosti. Pri statističnem preučevanju nas pogosto zanima položaj posamezne enote med ostalimi enotami v populaciji. Za opredeljevanje položaja posamezne enote uporabljamo naslednja parametra: rang R (določa, na katerem mestu v urejeni vrsti je posamezna enota) pove, koliko enot ima manjše in koliko večje vrednosti od izbrane enote. Ima vse vrednosti od 1 do N in zato lastnost diskretne spremenljivke; kvantilni rang P (položaj posamezne enote določa relativno) pove, koliko odstotkov enot ima manjše in koliko večje vrednosti od izbrane enote. Ima vse vrednosti na razmiku od 0 do 1 in lastnost zvezne spremenljivke. kvantilnemu rangu P = 0 ustreza rang R = 0,5 in kvantilnemu rangu P = 1 ustreza rang R = N + 0,5 37

Vrednosti, ki ustrezajo določenemu kvantilnemu rangu, so kvantili. Med njimi največkrat računamo: kvartile: prvi kvartil Q 1 s kvantilnim rangom P = 0,25 je vrednost, od katere ima 25 % enot manjše ali kvečjemu enake vrednost, 75 % enot pa večje vrednosti; drugi kvartil Q 2 s kvantilnim rangom P = 0,50 je vrednost, od katere ima 50 % enot manjše ali kvečjemu enake vrednosti, 50 % pa večje vrednosti; tretji kvartil Q 3 s kvantilnim rangom P = 0,75 je vrednost, od katere ima 75 % enot manjše ali kvečjemu enake vrednosti, 25 % pa večje vrednosti. decile: prvi decil D 1 P(D 1 ) = 0,10; Q2 = D5 = mediana drugi decil D 2 P(D 2 ) = 0,20; peti decil D 5 P(D 5 ) = 0,50 do deveti decil D 9 P(D 9 ) = 0,90 je vrednost, od katere ima 90 % enot manjše ali kvečjemu enake vrednosti, 10 % pa večje. 38

KVANTILI IN KVANTILNI RANGI IZ RANŽIRNE VRSTE Brskanje po podatkih in iskanje pravih podatkov je lahko zelo zamudno opravilo. V statistiki so razvili številne metode, kako lahko podatke predstavimo zelo pregledano, kar nam olajša delo. Najprej bomo spoznali razvrščanje po velikosti. Po velikosti urejenim številskim ali vrstim podatkom pravimo ranžirna vrsta. Podatke v ranžirni vrsti lahko uredimo od najmanjšega do največjega ali obratno. Podatkom v ranžirni dodelimo tudi zaporedno številko, ki jo imenujemo rang. Če je več podatkov enakih, jim dodelimo enak rang, ki ga izračunamo kot povprečje rangov, ki bi jih podatki imeli, če bi bili med seboj različni. Zastavimo si lahko dve nalogi: 1) danemu kvantilu y poiščemo pripadajoči kvantilni rang P in 2) danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y. 39

KVANTILI IN KVANTILNI RANGI IZ RANŽIRNE VRSTE 40

Primer 6: danemu kvantilu y poiščemo pripadajoči kvantilni rang P Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolade) ter izmerimo težo. Podatke uredimo po velikosti in izračunajmo odstotek teže lešnikove čokolade, ki je večja od 152,1 gr! Rešitev: 1. Podatke uredimo v ranžirno vrsto 41

Primer 6 nad.: 42

Primer 7: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolade) ter izmerimo težo. Izračunajmo prvi kvartil (QQ 1 ) in tretji decil (DD 3 ) Rešitev: Ad a) 1. Podatke uredimo v ranžirno vrsto 43

Primer 7a nad.: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y Kvantilni rang prvega kvartila QQ 1 je PP(QQ 1 ) = 0,25 Pripadajoči rang R je 2,5 RR = PP NN + 0,5 = 0,25 9 + 0,5 = 2,75 Zato je RR 0 = 2 < RR < RR 1 = 3,5 in yy 0 = 150,4 < yy < yy 1 = 150,6 QQ 11 = yy = yy 0 + RR RR 0 yy RR 1 RR 1 yy 0 = 150,4 + 2,75 2 0 3,5 2 = 150,4 + 0,5 0,2 = 150,4 + 0,1 = 111111, 55 150,6 150,4 = 150,4 + 0,75 1,5 0,2 Interpretacija rezultata: ocenjujemo, da je med devetimi vzorci 150gr lešnikove čokolade 25 % takih, katerih teža je manjša ali enaka 150,5 gr oziroma 75% vzorcev je takih, katerih teža je večja kot 150,5 gr. 44

Primer 7b nad.: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y 45

Rešitev: Ad 7b) 46

47

Grupiranje podatkov in frekvenčna porazdelitev Kadar je opazovanih enot veliko, jih združimo oziroma grupiramo v skupine, ki jih imenujemo razredi. Pri grupiranju najprej določimo skupne lastnosti enot v posameznih razredih, nato pa enote razdelimo po razredih. Lastnosti razredov morajo biti izbrane tako, da je vsaka enota v natanko enem razredu. Ne sme se zgoditi, da bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno enoto ne bi obstajal razred, v katerega bi jo uvrstili. Postavlja se vprašanje, koliko razredov je smiselno oblikovati. Če jih je premalo, izgubimo določene informacije o podatkih, če pa jih je preveč, zopet nimamo pregleda. V praksi se je izkazalo, da je ustrezno izbrati od 6 do 20 razredov oziroma uporabimo naslednje pravilo za določanje število razredov: Pri tem naj bo r število razredov in N število enot preučevane množice. 48

Grupiranje podatkov in frekvenčna porazdelitev Sedaj pa je potrebno enote populacije razvrstiti v posamezne razrede. Odločiti se morate za najmanjšo in največjo vrednost spremenljivke, ki spada v posamezni razred. Ti vrednosti se imenujeta meji razreda, razlika med mejama pa širina razreda. V nadaljevanju bomo prešteli enote, ki jih bomo uvrstili v posamezne razrede. To število se imenuje frekvenca razreda, ki se običajno označuje z fj, kjer f pomeni število enot v razredu, j pa zaporedno številko razreda. Tako urejeni podatki predstavljajo frekvenčno porazdelitev, ki je prikazana v frekvenčni tabeli. Frekvenčna tabela je primerna za nadaljnjo obdelavo in interpretacijo lastnosti populacije. Običajno se pri interpretaciji uporabljajo naslednji pojmi: relativna frekvenca, komulativna frekvenca, komulativna relativna frekvenca. 49

Grupiranje podatkov in frekvenčna porazdelitev Relativna frekvenca je delež enot posameznega razreda, zato se tudi običajno izraža v odstotkih. Delež izračunamo tako, da frekvenco razreda delite s številom enot populacije N. Relativna frekvenca: Komulativne frekvenca posameznega razreda predstavlja vsoto absolutnih frekvenc v predhodnih razredih. V prvem razredu je ta enaka frekvenci razreda, v naslednjih razredih pa jih izračunamo tako, da komulativni frekvenci predhodnega razreda prištejemo frekvenco tega razreda. Tudi komulativne frekvence lahko izrazite kot deleže oziroma z odstotki, ki se imenujejo komulativne relativne frekvence. 50

Primer 8: Frekvenčna tabela starosti ponesrečencev 51

Interpretacija: Relativna frekvenca: V starosti med 30 in 40 let je bilo 9 ponesrečencev (kolona 3), kar predstavlja 11% vseh ponesrečenih (kolona 4). Komulativna frekvenca: Mlajših od 20 let je bilo 34 ponesrečencev (kolona 5), kar predstavlja 41% vseh ponesrečenih (kolona 6). Grafični prikaz: Histogram frekvenčne porazdelitve starosti ponesrečencev Frekvenčni poligon starosti ponesrečencev 52

Za grafični prikaz relativnih frekvenc je primeren strukturni krog, kjer izseki pomenijo delež enot v posameznem razredu, torej relativno frekvenco. 53

Grupiranje podatkov in frekvenčna porazdelitev Primer 9: V proizvodnji čokolad smo v času ene ure izbrali naključno 25 kosov (150g lešnikove čokolade) ter izmerili njihovo težo. Podatki o teži so zbrani v tabeli. Uredite podatke tako, da dobite predstavo o tem kako uspešen je proizvodni proces! Postopek: 1. Podatke uredimo v ranžirno vrsto 2. Iz podatka o številu populacije N izračunamo po Stugersov pravilu število razredov r, 3. Poiščemo minimalno in maksimalno vrednost podatkov in izračunamo širino razreda i 4. Izdelamo frekvenčno tabelo meritev teže, 5. Interpretacija dobljenih podatkov. 54

r - št. razredov Število razredov je odvisno od enot (N) v množici podatkov - več kot je podatkov, več razredov bomo opredelili. Če jih je: - preveč dobimo preveliko razdrobljenost podatkov (manjšo preglednost), - premalo dobimo zelo lepo preglednost, zabrišemo pa osnovne značilnosti proučevanega pojava (spremenljivke). Velja, da uporabimo Stugersov princip: r = 1 + 3,32*log N širina razreda: 55

Grupiranje podatkov in frekvenčna porazdelitev 56

Frekvenčni poligon teže čokolade 16 14 12 10 8 6 4 2 0 nad 138 do 141,88 nad 141,88 do 145,76 nad 145,76 do 149,65 nad 149,65 do 153,53 nad 153,53 do- 157,41 nad 157,41 do 161,29 1 2 3 4 5 6 abs. frekv. fj Relativna frekvenca teže čokolade 4,00% 4,00% 8,00% 16,00% 12,00% 56,00% 1 nad 138 do 141,88 2 nad 141,88 do 145,76 3 nad 145,76 do 149,65 4 nad 149,65 do 153,53 5 nad 153,53 do- 157,41 6 nad 157,41 do 161,29 57

Aritmetična sredina Aritmetično sredino grupiranih podatkov, katere smo uredili v frekvenčno porazdelitev izračunamo po naslednji formuli: nn xx = ii=1 ff ii xx ii NN = ff 1 xx 1 + ff 2 xx 2 + ff 3 xx 3 +.. + ff nn xx nn NN kjer predstavlja xx ii sredino razreda. xx ii = xx iiii + xx iiii 2 58

Mediana ali središčnica je tista srednja vrednost statistične spremenljivke, pri kateri je polovica vrednosti večjih, druga polovica vrednosti pa manjših od dane vrednosti (50% je manjših vrednosti in 50% večjih vrednosti). Najprej izračunamo medianski položaj: (N+1)/2 Medialni (kvartilni) razred je tisti, ki ima kumulativno frekvenco neposredno večjo od N/2 LL 1 spodnja meja medialnega (kvartilnega) razreda ff - kumulativna frekvenca pred medialnim (kvartilnim) razredom ff mmmmmm - originalna frekvenca medialnega (kvartilnega) razreda i - velikost medialnega (kvartilnega) razreda 59

Modus ali gostiščnica se imenuje najpogostejša vrednost ali najpogostejši podatek v množici vseh vrednosti Modalni razred je razred z največjo absolutno frekvenco (ff jj ) LL 1 -spodnja meja modalnega razreda b - največja frekvenca a - frekvenca pred modalnim razredom c - frekvenca za modalnim razredom i - velikost modalnega razreda (b a) Mo = L1 + i (b a) + (b c) Prednost modusa pred aritmetično sredino je v tem, da samo absolutna frekvenca. Zato zelo dobro predstavlja podatke. 60

Povprečni absolutni odklon (PPPP MM ) nam pove, za koliko se v povprečju vrednosti spremenljivke razlikujejo od aritmetične sredine. kjer so: PPPP MM = NN ii=11 xx ii sredine razredov ff ii xx ii xx NN ff absolutne frekvence razredov xx aritmetična sredina NN skupno število podatkov 61

Varianca (σσ 2 ) nam pove kolikšno je povprečno odstopanje posameznih vrednosti od aritmetične sredine. σσ 2 = ii=1 NN ff ii xx ii xx 2 NN kjer so: xx ii sredine razredov ff absolutne frekvence razredov xx aritmetična sredina NN skupno število podatkov Standardni odklon ali standardna deviacija ( σσ ) nam pove kolikšna so odstopanja posameznih rezultatov od aritmetične sredine oziroma koliko je "vredna aritmetična sredina" (kako dobro nam predstavlja podatke). Večja je vrednost večja je variabilnost podatkov. σσ = ii=1 NN ff ii xx ii xx 2 NN 62

Kvartili Q 1 (spodnji kvartil) Q 1 = L 1 N + 4 f q f i Spodnji kvartil je srednja vrednost ki niz deli tako da 25% enot ima vrednost manjšo ali enako Q 1 a 75% večjo ali enako Q 3 (zgornji kvartil) Q 3 = L 1 3N + 4 f q f i Gornji kvartil kvartil je srednja vrednost ki niz deli tako da 75% enot ima vrednost manjšo ali enako Q 3 a 25% večjo ali enako 63

MERE DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min INTERKVARTIL (Razpon srednjih 50% členov niza) I Q = Q 3 Q 1 KOEFICIENT KVARTILNE DEVIACIJE (Relativna mera za interkvartil) V Q = Q Q 3 Q + Q 1 0 VQ 3 1 1 64

Simetrična Desnostranska Levostranska Mo Q1 Q3 0 38 x = M e M e Q = Me x M = Q O M Mo Me x Q1 Q3 0 38 1 3 e e 1 3 e M M o < M Q e < x < Q M 0 38 Q 1 x < M Q e M x Mo Me < M Q 3 3 e e Q 1 o < M 3 Koeficient α 3 = 2 < α < 3 2 3 α 3 M δ Pearsonova mera asimetrije S k = x M δ o S k 3( x M e) δ = 3 < S < 3 k Bowleyeva mera asimetrije S kq Q3 + Q1 2me = 1 < Skq < 1 Q 3 Q 1 65

Bowleyeva mera asimetrije Bowleyeva mera asimetrije temelji na razmerju kvantilov in mediane. v simetričnih porazdelitvah je Bowleyeva mera asimetrije enaka 0 v pozitivno asimetričnih mera je pozitivna, a v negativno asimetričnih je negativna. Bowleyeva in Pearsonova mera asimetrije so nepopolne mere in dajo informacije kot so koeficienti asimetrije, ter se izračunajo enostavno in hitreje. 66

α M δ 4 α 4 4 4 SPLOŠČENOST 0 = Ostra α 4 >3 Normalna α 4 =3 Položna 1,8<α 4 <3 Pravokotna α 4 =1,8 U porazdelitev 0<α 4 <1,8 67

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 68

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke L1 = 150 69

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 70

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 71

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 72

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 73

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke Najpogosteje se uporablja relativna mera variabilnosti, ki jo imenujemo koeficient variabilnosti (V) in jo izračunamo kot kvocient med standardnim odklonom in aritmetično sredino: 100 σσ KKKK = xx 74

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke M 3 Koeficient α 3 α3 = 2 < α 2 3 3 < δ α SPLOŠČENOST = M δ 4 4 α 4 4 0 75

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke Σf vsota kumulativnih frekvenc pred medialnim razredom N št. podatkov L1 spodnja meja medialnega razreda fq absolutna frekvenca medialnega razreda i širina razreda 76

Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 77

Primer 10: Za podatke v primeru 9 naredimo izračun statistične parametre za grupirane podatke 78

RAČUNANJE KVANTILOV IN KVANTILNIH RANGOV IZ FREKVENČNE PORAZDELITVE Pri frekvenčni porazdelitvi so enote populacije zbrane v razrede. Rang posamezne enote nadomestimo s kumulativo razreda, v katerega sodi ta enota. Rešimo naslednjo nalogo: Danemu kvantilu y izračunajmo pripadajoči kvantilni rang P. Poiščimo razred, v katerega sodi vrednost y. Naj bo to j-ti razred, imenujemo ga kvantilni razred. Tedaj velja naslednja ocena (denimo, da so razredi definirani tako, da vsebujejo svojo zgornjo mejo). Rang R, ki pripada kvantilu y, je tedaj umeščen med kumulativo kvantilnega razreda in kumulativo razreda pred njim. 79

80

Primer 11: Danemu kvantilu y izračunajmo pripadajoči kvantilni rang P. Tabela 1 prikazuje grupirane podatke o neto mesečnih plačah zaposlenih v podjetju ABC. Tabela 1: Neto mesečne plače zaposlenih v podjetju ABC Izračunaj, kolikšen delež zaposlenih zasluži mesečno največ 850 EUR. 81

Rešitev: 82

Primer 12: Danemu kvantilnemu rangu P poiščimo pripadajoči kvantil y. Tabela 1 prikazuje grupirane podatke o neto mesečnih plačah zaposlenih v podjetju ABC. Tabela 1: Neto mesečne plače zaposlenih v podjetju ABC 83

Slike trenutno ni mogoče prikazati. Slike trenutno ni mogoče prikazati. Rešitev: Ad a) 84

Rešitev: Ad b) 85

Rešitev: Ad c) 86