UPORABNA MATEMATIKA V LOGISTIKI za višješolsko strokovno izobraževanje (OPISNA ) 1
Cilj tega sklopa predavanja je predstaviti obvladovanje računskih spretnosti pri reševanju logističnih problemov in pri statistični analizi. Pravilen izračun iskane količine je seveda pomemben, mnogokrat pa je še pomembnejša interpretacija izračunanega rezultata. Na svoji poklicni poti boste morda morali sprejeti kako pomembno poslovno odločitev. Svoje sodelavce boste morali prepričati v pravilnost svoje odločitve. Argumente boste morali podpreti z izračuni in izračunano korektno interpretirati. Ali pa boste morda želeli analizirati povpraševanje potencialnih kupcev izdelka, s katerim želite prodreti na tržišče. V teh in podobnih primerih vam bo priskočilo na pomoč vaše znanje matematike in statistike. V uvodu je predstavljeno nekaj matematičnih zakonitosti, prikazanih nekaj računskih spretnosti in obdelana dva temeljna matematična modela soodvisnosti med dvema spremenljivima količinama. 2
Beseda statistika izvira iz latinske besede status, ki pomeni država. Statistika je kot metoda za zbiranje podatkov zelo stara, saj so že v starem veku. zbirali podatke o prebivalstvu, pridelkih itd. Pravi razvoj statistike se je začel v 17. stoletju, ko so znani matematiki tega obdobja postavili temelje verjetnostnega računa, na katerem temelji matematična statistika. V 20. stoletju je z razvojem računalništva postala statistika širše uporabljana. Osnovni namen statistike je razumevanje pojavov iste vrste, ki se pojavljajo v velikem številu, zato jih imenujemo množični pojavi. Množičen pojav je na primer serijska proizvodnja določenega izdelka. Med osnovne naloge statistike štejemo zbiranje, razvrščanje in urejanje podatkov ter sprejemanje zaključkov, kot so npr. odkrivanje lastnosti in zakonitosti populacije in napovedovanje vrednosti. 3
Statistika je veja matematike, ki proučuje metode zbiranja, urejanja, kvantitativne obdelave, prikazovanja in analiziranja številskih podatkov. Ko zberemo podatke, jih je potrebno»obdelati«. Metodološka obdelava je odvisna od namena in cilja statistične raziskave. V vsakem primeru, pa naj bi vsebovala: - ureditev podatkov, - grafični prikaz, - izračun parametrov, - interpretacijo. 4
Množica, ki jo statistično proučujemo, se imenuje populacija. Populacija je lahko končna ali neskončna množica enot, kot so predmeti, ljudje, dogodki ali kaj drugega. Populacijo moramo opredeliti stvarno, geografsko in časovno: - s stvarno opredelitvijo natančno določimo, kdo ali kaj spada vanjo in kdo ne, - z geografsko opredelitvijo povemo, kje je zajeta populacija, - s časovno opredelitvijo pa kdaj. Število statističnih enot, ki jih zajamemo v raziskavi, po navadi označujemo N (numerus). 5
Elementi populacije se imenujejo statistične enote. Pogosto ne moremo, ne želimo ali pa je predrago proučevati celotno populacijo, zato izberemo le podmnožico populacije, ki jo imenujemo vzorec, nato pa na podlagi lastnosti vzorca sklepamo o lastnostih populacije. Podmnožica je slučajno izbrana, če ima vsak element enako verjetnost, da bo izbran v vzorec. Lastnosti statistične enote, ki jih raziskujemo, imenujemo statistični podatek ali statistična spremenljivka. Pri tem poskušamo zagotoviti reprezentativnost vzorca. Vzorec je reprezentativen, če so rezultati raziskave na vzorcu enaki, kot bi bili rezultati raziskave na celotni populaciji. 6
Slučajni vzorec dobimo s slučajnim izborom enot populacije v vzorec. S tem dosežemo, da je struktura vzorca kar najbolj podobna strukturi populacije. Pogosto rečemo, da slučajni vzorec najbolje predstavlja (reprenzetira) celotno populacijo. Velikost vzorca bomo označili z n. Statistična spremenljivka opisuje lastnost enot. Primeri statističnih spremenljivk so spol oseb, število prometnih nesreč, število potnikov na vlaku, poraba goriva avtomobila na 100 km. V vseh opisanih primerih se izraz spremenljivka uporablja upravičeno, saj vsaka opazovana enota zavzame neko določeno vrednost. Te vrednosti so lahko med seboj različne, lahko pa ima nekaj enot enake vrednosti. Vrednosti spremenljivk bomo pogosto imenovali podatki. 7
Glede na način izražanja vrednosti spremenljivke delimo spremenljivke na: opisne, pri katerih vrednosti le opišemo z besedami in jih ne moremo ovrednotiti numerično (npr. spol, kraj bivanja, nacin transporta) in številske, pri katerih vrednosti izrazimo numerično. Številske spremenljivke delimo na diskretne in zvezne. Diskretne spremenljivke imajo za zalogo vrednosti končno ali neskončno zaporedje realnih števil. Ce vrednosti diskretne spremenljivke dobimo s stetjem, je njena zaloga vrednosti podmnožica naravnih števil (npr. število prometnih nesreč, število potnikov na avtobusu). Zvezne spremenljivke lahko zavzamejo vsako vrednost iz nekega intervala. Vrednosti zveznih spremenljivk dobimo z merjenjem (npr. čas, ki ga potrebuje voznik za določeno pot) ali z izračunavanjem (npr. poraba goriva vozila na 100 km). 8
Parameter je statistična karakteristika populacije, ki ga izračunamo iz podatkov celotne populacije in vzorčna statistika je statistična karakteristika vzorca, ki ga izračunamo iz podatkov vzorca Kot primer parametra lahko navedemo povprečje populacije ali pa delež populacije z določeno lastnostjo. Pri statističnem raziskovanju najprej zberemo podatke od posameznih enot vzorca, na podlagi teh podatkov izračunamo vzorčno statistiko, ki opisuje lastnost vzorca, nato pa s statističnem sklepanjem, ki temelji na matematični statistiki, sklepamo o parametru populacije. 9
Opisna statistika se ukvarja s predstavitvijo oz. povzemanjem pridobljenih podatkov. Množico informacij želimo obdelati in jih predstaviti na čim bolj nazoren način. Inferenčna statistika raziskuje medsebojno povezanost določenih statističnih parametrov. Ukvarja se tudi z ugotavljanjem zanesljivosti sklepov, ki smo jih dobili tako, da nismo raziskali celotne populacije, pač pa samo njen manjši del, vzorec. V nadaljevanju bomo spoznali osnove opisne statistike in osnove statističnega sklepanja. 10
Urejanje podatkov Podatke, ki smo jih pridobili od opazovanih statističnih enot populacije, moramo primerno urediti. Najprej si bomo ogledali urejanje številskih podatkov, nato pa se opisnih. Pri številskih podatkih imamo dve možnosti: če je podatkov malo, npr. do 30, jih uredimo po velikosti v ranžirno vrsto, če pa je podatkov veliko, jih grupiramo in prikažemo v tabeli, ki jo imenujemo frekvenčna porazdelitev. Število enot populacije smo označili z N. Ranžirna vrsta Po velikosti urejenim številskim podatkom v ranžirni vrsti določimo zaporedno številko, ki jo imenujemo rang. Rang nam pove, na katerem mestu v ranžirni vrsti se nahaja podatek. Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang. Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili različni med seboj. 11
Primer 1: Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolada) ter izmerimo težo. Vzorec X i (posamezni rezultat) RANŽIRNA VRSTA: 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 149,5 150,4 150,6 150,6 150,9 151,5 151,8 152,2 153,4 12
13
Običajno se podatke uredi v tabelah. Danes se za to uporablja računalniško orodje EXCEL, ki ga boste uporabljali tudi vi pri reševanju študijskih primerih. Če podatke vnesete v excelovo tabelo, ne boste imeli težav z grafično predstavitvijo, saj vam excel ponuja različne vrste grafikonov. Vi se le morate odločite, kateri je za prikaz podatkov, ki ste jih zbrali, najprimernejši. Primer 1: Linijski grafikon teže vzorcev mlečne čokolade 14
Sedaj pa sledi najtežji del obdelave, to je analitični del, ki mora vsebovati izračune in interpretacije statističnih parametrov. Kateri statistične parametre naj bi vsebovala posamezna poročila, je odvisno od namena in ciljev statističnega proučevanja. Na nacionalnem nivoju je to v pristojnosti Statističnega urada Republike Slovenije; na podjetniškem nivoju pa je to prepuščeno menedžmentu, razen na tistih področjih, ki jih določajo predpisi. Odločiti se boste morali za tiste parametre, ki po vašem mnenju najbolj odražajo lastnosti populacije. Pri izračunu statističnih parametrov (aritmetična sredina, mediana, modus) je treba upoštevati pravila in postopke, ki jih predpisuje stroka. Aritmetična sredina, mediana, modus kažejo osrednjo težnjo rezultatov, okrog njih se rezultati kopičijo: Statistične parametre izračunamo za negrupirane in grupirane podatke. 15
Aritmetična sredina 16
Aritmetična sredina Aritmetična sredina je povprečje rezultatov in je enaka kvocientu vsote vseh vrednosti statistične spremenljivke s številom teh vrednosti x Negrupirani/posamezni rezultati = n i i= 1 Nx = N x n i= 1 x i x = vsota št.vrednos ti 17
Aritmetična sredina Primer 2: Iz proizvodnje čokolad izračunajmo povprečno težo 9-ih izdelkov (150g lešnikove čokolada) Vzorec X i (posamezni rezultat) 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 18
Aritmetična sredina - tehtana aritmetična sredina Primer 3: Izračunajte povprečno število zaposlenih v posamezni trgovini za podane podatke o številu trgovin s številom zaposlenih nn xx = ii=1 ff ii xx ii nn = ff 1 xx 1 + ff 2 xx 2 + ff 3 xx 3 +.. + ff nn xx nn ff ii ff 1 + ff 2 +.. +ff nn ii=1 xx = 20 1 + 10 2 + 30 3 + 25 4 + 15 5 20 + 10 + 30 + 25 + 15 = 305 100 = 33, 0000 Odg: Povprečno število zaposlenih je 3,05 v posamezni trgovini. 19
Primer za pomanjkljivost aritmetične sredine Štiri osebe so pri testiranju dosegle naslednje rezultate: 21, 22, 23 in 36. xx = 25,50. Ta vrednost pade v praznino med prvimi tremi in četrtim rezultatom. Težko bi trdili, da posamezni rezultati težijo k temu povprečju in da jih to povprečje dobro zastopa. Skrajna vrednost 36 ga je namreč preveč»potegnila proti sebi«. V tem primeru bi mediana (Me) gotovo bolje opisovala osrednjo težnjo rezultatov kot aritmetična sredina ( xx) koliko znaša mediana Me? 20
Mediana (Me) Mediana ali središčnica je tista srednja vrednost statistične spremenljivke, pri kateri je polovica vrednosti večjih, druga polovica vrednosti pa manjših od dane vrednosti (50% je manjših vrednosti in 50% večjih vrednosti). Statistične podatke razvrstiti po velikosti: Neparno število enot: r = int Me = ( ) N x r + 1 2 Parno število enot: r = N Me = 2 x r + x r 2 +1 21
Mediana (Me) Je rezultat na sredini ranžirne vrste Najprej izračunamo medianski položaj: (N+1)/2 Mediana je ta rezultat v ranžirni vrsti (prešteješ). V našem primeru Če bi bilo sodo število, vzameš povprečje obeh rezultatov Pomanjkljivost: upošteva le vrednost na sredi (nenatančna mera) Prednost: neodvisnost od skrajnih vrednosti 22
Mediana (Me) 23
Primer za pomanjkljivost aritmetične sredine brez podatka o standardnem odklonu (δδ) Pri eni zelo odstopajoči vrednosti nam xx daje napačen vtis. Podatek o povprečni plači v tem podjetju bi bil 2875 evrov. Enako xx bi dobili npr. za podatke 2000, 2000, 2000 in 5.500 (direktor), le da bi bila razpršenost posameznih rezultatov okoli povprečja v tem primeru bistveno manjša. 24
Preverjanje razlik med aritmetičnimi sredinami Npr. razlika na vprašalniku učnih navad med fanti in dekleti je 2 točki (fantje 39, dekleta 41) Razlika je zelo majhna ali res obstaja ali je zgolj naključna posledica t.i. napake vzorčenja (pojavi se zaradi slučajnih dejavnikov, ker smo rezultate zbrali na vzorcu, ne na celi populaciji)? Preverimo s posebnimi stat. metodami, ki se jih ne bomo učili, pač pa bomo sklepali na oko. Razlika med dvema xx je statistično pomembna: z visoko stopnjo prepričanosti (običajno na nivoju 95%) lahko trdimo, da res obstaja v populaciji (le 5% tveganje, da je v resnici ni). 25
Razpršenost rezultatov K vsaki xx sodi podatek o tem, koliko so rezultati okoli nje: Zgoščeni (bolj reprezentativna) npr. xx=50 za rezultate 48, 49, 50, 51, 52 Razpršeni (manj reprezentativna) npr. xx=50 za rezultate 5, 5, 60, 130 Najpreprostejša mera je razpon: razlika med maksimalnim in minimalnim rezultatom Najpogosteje pa računamo standardni odklon ali standardno deviacijo: pove, kolikšna so odstopanja posameznih rezultatov od aritmetične sredine σσ = xx xx 2 nn 26
Primer 3: Iz proizvodnje čokolad izračunajmo standardni odklon vzorca 9-ih izdelkov (150g mlečna čokolada) 27
Razpršenost (nad.) Velika in mala razpršenost: sploščena in koničasta distribucija Primer za pomen mere razpršenosti: če se odpravljamo na počitnice, nam podatek o povprečni temperaturi pove, katerih oblačil naj vzamemo največ, podatek o razpršenosti pa, ali moramo vzeti tudi bistveno toplejša/lažja oblačila: xx = 20 (ali to pomeni od 18 do 22 ali od 10 do 30?) 28
MERA DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min 29
Modus (Mo) Modus ali gostiščnica se imenuje najpogostejša vrednost ali najpogostejši podatek v množici vseh vrednosti Je rezultat, ki se največkrat pojavlja v podatkih Prednosti: tudi pri kvalitativnih spremenljivkah (ločene kategorije, npr. spol, stan) Pomanjkljivosti: upošteva le najpogostejšo vrednost (nenatančna mera) 30
Modus (Mo) Primer 4: Iz proizvodnje čokolad izračunajmo modus (Mo) vzorca 9-ih izdelkov (150g lešnikove čokolada) Vzorec X i (posamezni rezultat) RANŽIRNA VRSTA: 1 150,6 2 151,8 3 151,5 4 153,4 5 150,6 6 152,2 7 149,5 8 150,4 9 150,9 149,5 150,4 150,6 150,6 150,9 151,5 151,8 152,2 153,4 31
KOEFICIENT VARIACIJE (V) Omogoča primerjavo različnih pojavov glede variabilnosti. Koeficient variacije pove kolikšen odstotek vrednosti aritmetične sredine zavzema standardni odklon. Večji kot je večja je razpršenost podatkov. Definiran je kot razmerje med standardnim odklonom in aritmetično sredino, od standardnega odklona, ki prav tako prikazuje razpršenost statističnih enot, pa se razlikuje po tem, da je merjen v odstotkih in ga je zato moč uporabiti za primerjavo razpršenosti enot različnih statističnih populacij. kjer je: σσ standardni odklon xx aritmetična sredina VV = 100 σσ xx 32
Primer 5: Iz proizvodnje čokolad izračunajmo varianco in koeficient variance V vzorca 9-ih izdelkov (150g lešnikove čokolada) VV = 100 δδ xx = 100 1,0867 151,21 = 108,67 151,21 = 0,71867 Interpretacija: Pri vzorcu 9-ih kosov mlečnih čokolad predstavlja standardni odklon 0,71867% vrednosti aritmetične sredine. 33
Mo 0 38 0 38 Q Q1 3 Me x Mo Me x Q1 Q3 0 38 Q 1 x Mo Me Q 3 x = M e M e Q = M = Q O M 1 3 e e 1 3 e M M o < M Q e < x < Q M x < M Q e M < M < M 3 e e Q 1 o 34
MERA DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min 35
36
Določanje vrednosti spremenljivke, da bi se razporedila na opredeljeno mesto v množici imenujemo ga kvantil. Vrednosti za dano spremenljivko v grafikonu kumulative frekvenc, lahko izračunamo. Prav tako lahko izračunamo položaj določene vrednosti, če poznamo podatek o tem, kolikšen delež vrednosti je manjših oziroma večjih od dane vrednosti. Pri statističnem preučevanju nas pogosto zanima položaj posamezne enote med ostalimi enotami v populaciji. Za opredeljevanje položaja posamezne enote uporabljamo naslednja parametra: rang R (določa, na katerem mestu v urejeni vrsti je posamezna enota) pove, koliko enot ima manjše in koliko večje vrednosti od izbrane enote. Ima vse vrednosti od 1 do N in zato lastnost diskretne spremenljivke; kvantilni rang P (položaj posamezne enote določa relativno) pove, koliko odstotkov enot ima manjše in koliko večje vrednosti od izbrane enote. Ima vse vrednosti na razmiku od 0 do 1 in lastnost zvezne spremenljivke. kvantilnemu rangu P = 0 ustreza rang R = 0,5 in kvantilnemu rangu P = 1 ustreza rang R = N + 0,5 37
Vrednosti, ki ustrezajo določenemu kvantilnemu rangu, so kvantili. Med njimi največkrat računamo: kvartile: prvi kvartil Q 1 s kvantilnim rangom P = 0,25 je vrednost, od katere ima 25 % enot manjše ali kvečjemu enake vrednost, 75 % enot pa večje vrednosti; drugi kvartil Q 2 s kvantilnim rangom P = 0,50 je vrednost, od katere ima 50 % enot manjše ali kvečjemu enake vrednosti, 50 % pa večje vrednosti; tretji kvartil Q 3 s kvantilnim rangom P = 0,75 je vrednost, od katere ima 75 % enot manjše ali kvečjemu enake vrednosti, 25 % pa večje vrednosti. decile: prvi decil D 1 P(D 1 ) = 0,10; Q2 = D5 = mediana drugi decil D 2 P(D 2 ) = 0,20; peti decil D 5 P(D 5 ) = 0,50 do deveti decil D 9 P(D 9 ) = 0,90 je vrednost, od katere ima 90 % enot manjše ali kvečjemu enake vrednosti, 10 % pa večje. 38
KVANTILI IN KVANTILNI RANGI IZ RANŽIRNE VRSTE Brskanje po podatkih in iskanje pravih podatkov je lahko zelo zamudno opravilo. V statistiki so razvili številne metode, kako lahko podatke predstavimo zelo pregledano, kar nam olajša delo. Najprej bomo spoznali razvrščanje po velikosti. Po velikosti urejenim številskim ali vrstim podatkom pravimo ranžirna vrsta. Podatke v ranžirni vrsti lahko uredimo od najmanjšega do največjega ali obratno. Podatkom v ranžirni dodelimo tudi zaporedno številko, ki jo imenujemo rang. Če je več podatkov enakih, jim dodelimo enak rang, ki ga izračunamo kot povprečje rangov, ki bi jih podatki imeli, če bi bili med seboj različni. Zastavimo si lahko dve nalogi: 1) danemu kvantilu y poiščemo pripadajoči kvantilni rang P in 2) danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y. 39
KVANTILI IN KVANTILNI RANGI IZ RANŽIRNE VRSTE 40
Primer 6: danemu kvantilu y poiščemo pripadajoči kvantilni rang P Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolade) ter izmerimo težo. Podatke uredimo po velikosti in izračunajmo odstotek teže lešnikove čokolade, ki je večja od 152,1 gr! Rešitev: 1. Podatke uredimo v ranžirno vrsto 41
Primer 6 nad.: 42
Primer 7: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y Iz proizvodnje čokolad vzamemo vzorec 9-ih izdelkov (150g lešnikove čokolade) ter izmerimo težo. Izračunajmo prvi kvartil (QQ 1 ) in tretji decil (DD 3 ) Rešitev: Ad a) 1. Podatke uredimo v ranžirno vrsto 43
Primer 7a nad.: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y Kvantilni rang prvega kvartila QQ 1 je PP(QQ 1 ) = 0,25 Pripadajoči rang R je 2,5 RR = PP NN + 0,5 = 0,25 9 + 0,5 = 2,75 Zato je RR 0 = 2 < RR < RR 1 = 3,5 in yy 0 = 150,4 < yy < yy 1 = 150,6 QQ 11 = yy = yy 0 + RR RR 0 yy RR 1 RR 1 yy 0 = 150,4 + 2,75 2 0 3,5 2 = 150,4 + 0,5 0,2 = 150,4 + 0,1 = 111111, 55 150,6 150,4 = 150,4 + 0,75 1,5 0,2 Interpretacija rezultata: ocenjujemo, da je med devetimi vzorci 150gr lešnikove čokolade 25 % takih, katerih teža je manjša ali enaka 150,5 gr oziroma 75% vzorcev je takih, katerih teža je večja kot 150,5 gr. 44
Primer 7b nad.: danemu kvantilnemu rangu P poiščemo pripadajoči kvantil y 45
Rešitev: Ad 7b) 46
47
Grupiranje podatkov in frekvenčna porazdelitev Kadar je opazovanih enot veliko, jih združimo oziroma grupiramo v skupine, ki jih imenujemo razredi. Pri grupiranju najprej določimo skupne lastnosti enot v posameznih razredih, nato pa enote razdelimo po razredih. Lastnosti razredov morajo biti izbrane tako, da je vsaka enota v natanko enem razredu. Ne sme se zgoditi, da bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno enoto ne bi obstajal razred, v katerega bi jo uvrstili. Postavlja se vprašanje, koliko razredov je smiselno oblikovati. Če jih je premalo, izgubimo določene informacije o podatkih, če pa jih je preveč, zopet nimamo pregleda. V praksi se je izkazalo, da je ustrezno izbrati od 6 do 20 razredov oziroma uporabimo naslednje pravilo za določanje število razredov: Pri tem naj bo r število razredov in N število enot preučevane množice. 48
Grupiranje podatkov in frekvenčna porazdelitev Sedaj pa je potrebno enote populacije razvrstiti v posamezne razrede. Odločiti se morate za najmanjšo in največjo vrednost spremenljivke, ki spada v posamezni razred. Ti vrednosti se imenujeta meji razreda, razlika med mejama pa širina razreda. V nadaljevanju bomo prešteli enote, ki jih bomo uvrstili v posamezne razrede. To število se imenuje frekvenca razreda, ki se običajno označuje z fj, kjer f pomeni število enot v razredu, j pa zaporedno številko razreda. Tako urejeni podatki predstavljajo frekvenčno porazdelitev, ki je prikazana v frekvenčni tabeli. Frekvenčna tabela je primerna za nadaljnjo obdelavo in interpretacijo lastnosti populacije. Običajno se pri interpretaciji uporabljajo naslednji pojmi: relativna frekvenca, komulativna frekvenca, komulativna relativna frekvenca. 49
Grupiranje podatkov in frekvenčna porazdelitev Relativna frekvenca je delež enot posameznega razreda, zato se tudi običajno izraža v odstotkih. Delež izračunamo tako, da frekvenco razreda delite s številom enot populacije N. Relativna frekvenca: Komulativne frekvenca posameznega razreda predstavlja vsoto absolutnih frekvenc v predhodnih razredih. V prvem razredu je ta enaka frekvenci razreda, v naslednjih razredih pa jih izračunamo tako, da komulativni frekvenci predhodnega razreda prištejemo frekvenco tega razreda. Tudi komulativne frekvence lahko izrazite kot deleže oziroma z odstotki, ki se imenujejo komulativne relativne frekvence. 50
Primer 8: Frekvenčna tabela starosti ponesrečencev 51
Interpretacija: Relativna frekvenca: V starosti med 30 in 40 let je bilo 9 ponesrečencev (kolona 3), kar predstavlja 11% vseh ponesrečenih (kolona 4). Komulativna frekvenca: Mlajših od 20 let je bilo 34 ponesrečencev (kolona 5), kar predstavlja 41% vseh ponesrečenih (kolona 6). Grafični prikaz: Histogram frekvenčne porazdelitve starosti ponesrečencev Frekvenčni poligon starosti ponesrečencev 52
Za grafični prikaz relativnih frekvenc je primeren strukturni krog, kjer izseki pomenijo delež enot v posameznem razredu, torej relativno frekvenco. 53
Grupiranje podatkov in frekvenčna porazdelitev Primer 9: V proizvodnji čokolad smo v času ene ure izbrali naključno 25 kosov (150g lešnikove čokolade) ter izmerili njihovo težo. Podatki o teži so zbrani v tabeli. Uredite podatke tako, da dobite predstavo o tem kako uspešen je proizvodni proces! Postopek: 1. Podatke uredimo v ranžirno vrsto 2. Iz podatka o številu populacije N izračunamo po Stugersov pravilu število razredov r, 3. Poiščemo minimalno in maksimalno vrednost podatkov in izračunamo širino razreda i 4. Izdelamo frekvenčno tabelo meritev teže, 5. Interpretacija dobljenih podatkov. 54
r - št. razredov Število razredov je odvisno od enot (N) v množici podatkov - več kot je podatkov, več razredov bomo opredelili. Če jih je: - preveč dobimo preveliko razdrobljenost podatkov (manjšo preglednost), - premalo dobimo zelo lepo preglednost, zabrišemo pa osnovne značilnosti proučevanega pojava (spremenljivke). Velja, da uporabimo Stugersov princip: r = 1 + 3,32*log N širina razreda: 55
Grupiranje podatkov in frekvenčna porazdelitev 56
Frekvenčni poligon teže čokolade 16 14 12 10 8 6 4 2 0 nad 138 do 141,88 nad 141,88 do 145,76 nad 145,76 do 149,65 nad 149,65 do 153,53 nad 153,53 do- 157,41 nad 157,41 do 161,29 1 2 3 4 5 6 abs. frekv. fj Relativna frekvenca teže čokolade 4,00% 4,00% 8,00% 16,00% 12,00% 56,00% 1 nad 138 do 141,88 2 nad 141,88 do 145,76 3 nad 145,76 do 149,65 4 nad 149,65 do 153,53 5 nad 153,53 do- 157,41 6 nad 157,41 do 161,29 57
Aritmetična sredina Aritmetično sredino grupiranih podatkov, katere smo uredili v frekvenčno porazdelitev izračunamo po naslednji formuli: nn xx = ii=1 ff ii xx ii NN = ff 1 xx 1 + ff 2 xx 2 + ff 3 xx 3 +.. + ff nn xx nn NN kjer predstavlja xx ii sredino razreda. xx ii = xx iiii + xx iiii 2 58
Mediana ali središčnica je tista srednja vrednost statistične spremenljivke, pri kateri je polovica vrednosti večjih, druga polovica vrednosti pa manjših od dane vrednosti (50% je manjših vrednosti in 50% večjih vrednosti). Najprej izračunamo medianski položaj: (N+1)/2 Medialni (kvartilni) razred je tisti, ki ima kumulativno frekvenco neposredno večjo od N/2 LL 1 spodnja meja medialnega (kvartilnega) razreda ff - kumulativna frekvenca pred medialnim (kvartilnim) razredom ff mmmmmm - originalna frekvenca medialnega (kvartilnega) razreda i - velikost medialnega (kvartilnega) razreda 59
Modus ali gostiščnica se imenuje najpogostejša vrednost ali najpogostejši podatek v množici vseh vrednosti Modalni razred je razred z največjo absolutno frekvenco (ff jj ) LL 1 -spodnja meja modalnega razreda b - največja frekvenca a - frekvenca pred modalnim razredom c - frekvenca za modalnim razredom i - velikost modalnega razreda (b a) Mo = L1 + i (b a) + (b c) Prednost modusa pred aritmetično sredino je v tem, da samo absolutna frekvenca. Zato zelo dobro predstavlja podatke. 60
Povprečni absolutni odklon (PPPP MM ) nam pove, za koliko se v povprečju vrednosti spremenljivke razlikujejo od aritmetične sredine. kjer so: PPPP MM = NN ii=11 xx ii sredine razredov ff ii xx ii xx NN ff absolutne frekvence razredov xx aritmetična sredina NN skupno število podatkov 61
Varianca (σσ 2 ) nam pove kolikšno je povprečno odstopanje posameznih vrednosti od aritmetične sredine. σσ 2 = ii=1 NN ff ii xx ii xx 2 NN kjer so: xx ii sredine razredov ff absolutne frekvence razredov xx aritmetična sredina NN skupno število podatkov Standardni odklon ali standardna deviacija ( σσ ) nam pove kolikšna so odstopanja posameznih rezultatov od aritmetične sredine oziroma koliko je "vredna aritmetična sredina" (kako dobro nam predstavlja podatke). Večja je vrednost večja je variabilnost podatkov. σσ = ii=1 NN ff ii xx ii xx 2 NN 62
Kvartili Q 1 (spodnji kvartil) Q 1 = L 1 N + 4 f q f i Spodnji kvartil je srednja vrednost ki niz deli tako da 25% enot ima vrednost manjšo ali enako Q 1 a 75% večjo ali enako Q 3 (zgornji kvartil) Q 3 = L 1 3N + 4 f q f i Gornji kvartil kvartil je srednja vrednost ki niz deli tako da 75% enot ima vrednost manjšo ali enako Q 3 a 25% večjo ali enako 63
MERE DISPERZIJE RAZPON VARIACIJE: (Razpon med največjo in najmanjšo vrednostjo podatkov) R = X max X min INTERKVARTIL (Razpon srednjih 50% členov niza) I Q = Q 3 Q 1 KOEFICIENT KVARTILNE DEVIACIJE (Relativna mera za interkvartil) V Q = Q Q 3 Q + Q 1 0 VQ 3 1 1 64
Simetrična Desnostranska Levostranska Mo Q1 Q3 0 38 x = M e M e Q = Me x M = Q O M Mo Me x Q1 Q3 0 38 1 3 e e 1 3 e M M o < M Q e < x < Q M 0 38 Q 1 x < M Q e M x Mo Me < M Q 3 3 e e Q 1 o < M 3 Koeficient α 3 = 2 < α < 3 2 3 α 3 M δ Pearsonova mera asimetrije S k = x M δ o S k 3( x M e) δ = 3 < S < 3 k Bowleyeva mera asimetrije S kq Q3 + Q1 2me = 1 < Skq < 1 Q 3 Q 1 65
Bowleyeva mera asimetrije Bowleyeva mera asimetrije temelji na razmerju kvantilov in mediane. v simetričnih porazdelitvah je Bowleyeva mera asimetrije enaka 0 v pozitivno asimetričnih mera je pozitivna, a v negativno asimetričnih je negativna. Bowleyeva in Pearsonova mera asimetrije so nepopolne mere in dajo informacije kot so koeficienti asimetrije, ter se izračunajo enostavno in hitreje. 66
α M δ 4 α 4 4 4 SPLOŠČENOST 0 = Ostra α 4 >3 Normalna α 4 =3 Položna 1,8<α 4 <3 Pravokotna α 4 =1,8 U porazdelitev 0<α 4 <1,8 67
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 68
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke L1 = 150 69
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 70
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 71
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 72
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 73
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke Najpogosteje se uporablja relativna mera variabilnosti, ki jo imenujemo koeficient variabilnosti (V) in jo izračunamo kot kvocient med standardnim odklonom in aritmetično sredino: 100 σσ KKKK = xx 74
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke M 3 Koeficient α 3 α3 = 2 < α 2 3 3 < δ α SPLOŠČENOST = M δ 4 4 α 4 4 0 75
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke Σf vsota kumulativnih frekvenc pred medialnim razredom N št. podatkov L1 spodnja meja medialnega razreda fq absolutna frekvenca medialnega razreda i širina razreda 76
Primer 10: Za podatke v primeru 9 naredimo izračun statističnih parametrov za grupirane podatke 77
Primer 10: Za podatke v primeru 9 naredimo izračun statistične parametre za grupirane podatke 78
RAČUNANJE KVANTILOV IN KVANTILNIH RANGOV IZ FREKVENČNE PORAZDELITVE Pri frekvenčni porazdelitvi so enote populacije zbrane v razrede. Rang posamezne enote nadomestimo s kumulativo razreda, v katerega sodi ta enota. Rešimo naslednjo nalogo: Danemu kvantilu y izračunajmo pripadajoči kvantilni rang P. Poiščimo razred, v katerega sodi vrednost y. Naj bo to j-ti razred, imenujemo ga kvantilni razred. Tedaj velja naslednja ocena (denimo, da so razredi definirani tako, da vsebujejo svojo zgornjo mejo). Rang R, ki pripada kvantilu y, je tedaj umeščen med kumulativo kvantilnega razreda in kumulativo razreda pred njim. 79
80
Primer 11: Danemu kvantilu y izračunajmo pripadajoči kvantilni rang P. Tabela 1 prikazuje grupirane podatke o neto mesečnih plačah zaposlenih v podjetju ABC. Tabela 1: Neto mesečne plače zaposlenih v podjetju ABC Izračunaj, kolikšen delež zaposlenih zasluži mesečno največ 850 EUR. 81
Rešitev: 82
Primer 12: Danemu kvantilnemu rangu P poiščimo pripadajoči kvantil y. Tabela 1 prikazuje grupirane podatke o neto mesečnih plačah zaposlenih v podjetju ABC. Tabela 1: Neto mesečne plače zaposlenih v podjetju ABC 83
Slike trenutno ni mogoče prikazati. Slike trenutno ni mogoče prikazati. Rešitev: Ad a) 84
Rešitev: Ad b) 85
Rešitev: Ad c) 86