IZLETI V MATEMATIČNO VESOLJE Ali so fantje bolj nadarjeni za matematiko kot dekleta? Arjana Brezigar Masten UP FAMNIT in UMAR 1
Culture, Gender, and Math L.Guiso, F.Monte, P. Sapienza, L.Zingales Science 2008 Razlike v matematičnih dosežkih med spoloma: obstoj, velikost in izvor. Dve razlagi: Biološka razlaga: moški se odrežejo bolje pri prostorskih nalogah, ženske pa pri verbalnih zelo majhne in posledično tudi povezava z matematično uspešnostjo neizrazita (1). Socialno okolje naj bi imelo velik vpliv (2). razlike 2
Culture, Gender, and Math (2) Test: analiza razlik v matematiki in branju med spoloma med različnimi državami velike kulturne razlike PISA rezultati (2003) za 15-letne študente iz 40. držav teste je pripravila OECD (ni kulturne pristranosti) Povprečni rezultati deklet v matematiki so nižji za 10.5 (2 % nižji od povprečja fantov). Povprečni rezultati deklet v branju so višji za 32.7 (6.6% višji od povprečja fantov). V državah, kjer je razlika med spoloma v branju največja, je razlika v matematiki najmanjša. 3
Test score differences between girls and boys GGI index 70 60 50 40 30 20 10 0-10 -20-30 0.8 0.75 0.7 0.65 0.6 0.55 Culture, Gender, and Math (3) Gender gap, math Gender gap, reading TUR KOR ITA USA PRT FRA POL NOR SWE ISL Women s emancipation (GGI) 0.5 ath and reading gender gaps. In more gender-equal cultures, the math gender gap 4 disppears and the reading gender gap becomes larger. (Top) Gender gaps in mathematics yellow) and reading (gray) are calculated as the difference between the average girls score
Culture, Gender, and Math (4) Vpliv kulturnih razlik med spoloma kontroliran s štirimi merami: GGI (World Economic Forum s Gender Gap Index) odraža ekonomske in politične možnosti, izobrazbo in splošen status žensk. WVS (World Values Survey): indeks vloge žensk v družbi. Delež žensk v ponudbi delovne sile. PEI (Political empowerment index) meri udeležbo žensk na političnih funkcijah. Vse štiri mere so močno korelirane. 5
Culture, Gender, and Math (5) Differences in Test Scores Correlated with Indicators of Gender Equality LHS: Gender difference in math LHS: Gender difference in reading Women s emancipation (GGI) Avg. WVS indicators Female economic activity rate Women s political empowerment Log GDP per capita, 2003 Constant Observations (no.) R 2 105.49± 83.56± 26.92** 30.43** 13.21± 16.39± 7.06 8.46 0.45± 0.34± 0.14** 0.15* 29.10± 24.35± 10.05** 10.86* -6.56± 1.09± -3.12± -4.95± -2.23± 0.52± -0.56± -1.06± 2.40** 2.26 1.93 2.52 2.71 2.71 2.15 2.73-19.62± -57.16± -2.75± 32.43± -3.02± -16.09± 21.49± 39.03± 20.01 23.27* 17.72 23.72 22.62 27.90 19.80 25.63 37 32 39 36 37 32 39 36 0.32 0.15 0.23 0.21 0.20 0.14 0.12 0.15 6
Culture, Gender, and Math (6) Pozitivna povezanost med kulturnimi razlikami in ralikami v matematiki. Statistični model ocenjuje, da v kolikor bi v Turčiji imeli takšno enakost med spoloma kot na Švedskem (sprememba GGI iz 0.59 na 0.81), bi se povprečni relativni matematični dosežki deklet glede na fante povečali za 23 točk, kar bi dejansko izničilo razliko med spoloma. V državah z večjo enakostjo med spoloma (Švedska in Norveška) razlika v matematiki med spoloma izgine. Podobni rezultati tudi za druge mere kulturnih razlik med spoloma. 7
Culture, Gender, and Math (7) Ali zmanjšanje razlik v matematiki med spoloma pomeni izboljšanje dosežkov deklet na vseh področjih ali samo na matematičnem področju? Korelacija med bralnimi sposobnostmi in kulturnimi razlikami: V državah z večjo enakostjo med spoloma je razlika v branju med spoloma večja. V kolikor bi bil GGI v Turčiji na ravni Švedske, bi se razlike v branju med dekleti in fanti v povprečju povečala za 18 točk. 8
Culture, Gender, and Math (9) Razlika v matematičnih dosežkih med spoloma se s povečevanjem enakosti med spoloma zmanjšuje. Podobne ne drži za povezavo med dosežki fantov v matematiki in branju. Fantje so vedno boljši v matematiki kot v branju in kljub variranju rezultatov med državami, enakost med spoloma na to ne vpliva. V državah z višjim GGI razlika med spoloma izginja, dekleta postajajo boljša tako v matematiki kot branju. 9
Ekonometrija, rudarjenje podatkov, ali 10
Ekonometrija Ekonometrija je veda o uporabi ekonomskih teorij in statističnih metod za analizo ekonomskih podatkov. Ekonomska teorija predlaga določene povezave, ki se aplicirajo na ekonomsko politiko, vendar pa skoraj nikoli ne podaja količinskega ovrednotenja vzročnega učinka. Statistika je veda o zbiranju, analiziranju, interpretaciji, analizi in organizaciji podatkov. Ločimo dve metodi statistične analize: deskriptivno, ki opisuje podatke s pomočjo različnih mer ter metode, ki temeljijo na teoriji verjetnosti, ki povzema sklepe na osnovi slučajnosti podatkov. 11
Ekonomska vprašanja in podatki Ali večja trošarina za cigarete zmanjšuje kajenje? Ali zmanjšanje števila učencov na učitelja izboljša učni uspeh? vzročnost Kakšna bo rast BDP v prihodnjem letu? Kakšna je verjetnost, da bo šlo podjetje v stečaj? napovedovanje 12
Podatki VIR Eksperimentalni podatki Visoki stroški, vprašanje etičnosti, redki Opazovani podatki Telefonske ankete, razne administrativne baze, TIP Presečni podatki Časovne serije Panelni podatki 13
Ocenjevanje vzročnosti Naključen kontroliran eksperiment (randomized controlled experiment) Kontrolna skupina (control group) obravnavana skupina (treatment group) Učinek vzročnosti (causal effect): je učinek na rezultat določene obravnave merjen v naključnem kontroliranem eksperimentu. Obravnava (treatment) je edini sistematičen razlog za razlike med kontrolno in obravnavano skupino. Težka izvedljivost. 14
Ali so večji in boljši paradižniki dejansko posledica novega gnojila? 15
Ali manjše število učencev na učitelja vodi v boljši učni uspeh? Naravni eksperiment zelo težko izvedljiv. Pomagamo si z linearno regresijo. Z linearno regresijo ocenjujemo in statistično sklepamo o populacijskem naklonu koeficientov. Končni cilj je oceniti vzročni učinek spremembe ene enote X na Y. Razmišljajmo o problemu kot o prilagajanju premice podatkom za 2 spremenljivki, Y in X: Kako naj potegnemo premico skozi podatke, da ocenimo naklon? (odgovor: metoda najmanjših kvadratov). 16
Katere podatke potrebujemo? Imamo podatke za vsa kalifornijska šolska okrožja (n = 420). Spremenljivke: 1. Standardizirani testni rezultati petošolcev, povprečje posameznega okrožja. 2. Število učencev na učitelja (STR) = št. učencev v posameznem okožju deljeno s št. polno-zaposlenih učiteljev. 3. Še kaj? 17
Linearna regresija: zapis in terminologija Kakšen je učinek zmanšanja št. učencev na učitelja (STR) za 2 učenca na testne rezultate (TR)? Populacijski regresijski model: Testni rezultat = β 0 + β 1 STR β 1 = naklon populacijskega regresijskega modela = Δtestnega rezultata / ΔSTR = sprememba v TR glede na enoto spremembe STR Zanima nas populacijska vrednost β 1. Vrednosti β 1 ne poznamo, zato jo moramo oceniti. 18
Zapis regresijskega modela X je pojasnjevalna spremenljivka Y je odvisna spremenljivka β 0 = regresijska konstanta β 1 = regresijski koeficient Y i = β 0 + β 1 X i + u i, i = 1,, n u i = regresijska napaka (naključna=slučajna=stohastična spremenljivka) Regresijska napaka vsebuje vse tiste spremenljivke, ki vplivajo na Y in niso vključene v X-izpuščeni dejavniki: pomankljiva ali nederočena ekonomska teorija ni podatkov (splošno počutje posameznika) napake pri merjenju 19
Opazovane enote za Y in X; populacijska regresijska funkcija in regresijska napaka 20
Metoda najmanjših kvadratov Kako iz podatkov ocenimo β 0 in β 1? Cenilka neznanih parametrov β 0 in β 1,ki minimizira napako: n min [ Y ( b + b X )] b0, b1 i 0 1 i i= 1 MNKV minimizira povprečen kvadrat razlike med dejanskimi vrednostmi Y i in vrednostmi, ki so ocenjene na osnovi regresijske premice. 2 21
Aplikacija na kalifornijske podatke Ocenjen naklon = = 2.28 Ocenjena konstanta = 698.9 Ocenjena regresijska premica: Testni rezultat= 698.9 2.28*STR 22
Interpretacija regresijskih koeficientov Testni rezultat= 698.9 2.28*STR Okrožja z enim študentom več na učitelja imajo v povprečju testni rezultat za 2.28 točk nižji. Konstanta (dobesedno) pomeni, da glede na ocenjeno premico bi imela okrožja z 0 študenti (napovedan) testni rezultat 698.9. Interpretacija konstante v tem primeru nima nobenega ekonomskega smisla. 23
Ocenjena vrednost & napaka Y Za eno izmed okrožij (Antelope, CA) velja: STR = 19.33 in Testni rezultat = 657.8 ocenjena vrednost Y = 698.9 2.28*19.33 = 654.8 napaka= 657.8 654.8 = 3.0 24
Vzročnost in regresijska analiza Kaj želimo oceniti? Vzročnost zmanjšanja števila učencev na učitelja na testne rezultate učencev. Učinek, ki je merjen z idealnim slučajnim kontroliranim eksperimentom. 25
Idealen slučajen kontroliran eksperiment (1) Idealen: subjekti sledijo obravnavanemu protokolu ni nobenih napak poročanja, zapisa,... Slučajen-naključen: objekti so naključno določeni obravnavani ali kontrolni skupini. Kontroliran: obstoj kontrolne skupine omogoča merjenje učinka razlike, ki je posledica obravnave. Eksperiment: obravnava je določena, je del eksperimenta: subjekti nimajo izbire, ni obratne vzročnosti pri kateri subjekti izberejo obravnavo za katero menijo, da je zanje boljša. 26
Idealen slučajen eksperiment (2) Zamislimo si idealen slučajen kontroliran eksperiment za merjenje učinka zmanjšanja STR na Testni rezultat V čem se opazovani podatki razlikujejo od idealnega? Obravnava ni naključna V kolikor obstaja še kakšen dejavnik, ki vpliva na testni rezultat in je povezan s STR (delež priseljencev, delež subvencionirane šolske prehrane, ), pomeni, da se kontrolna in obravnavana skupina razlikujeta zaradi sistematičnega razloga. 27
Idealen slučajen eksperiment (3) naključnost + kontrolna skupina pomeni, da je kakršnakoli razlika med obravnavano in kontrolno skupino slučajna ni sistematično povezana z obravnavo. Razliko v deležu priseljencev (DP) ali v deležu subvencionirane šolske prehrane (DSŠP) med kontrolno in obravnavano skupino lahko izničimo z analizo učinka STR na testni rezultat med okrožji z enakimi DP ali DSŠP. To je eden izmed načinov kontrole za učinek DP ali DSŠP pri ocenjevanju vpliva STR. Lahko pa ti dve spremenljivki preprosto vključimo v regresijski model. 28
Kako bi prej opisan primer testirali za Slovenijo? Vse srednje šole v Sloveniji Spremenljivke: 1. Rezultati na maturi 2. Število učiteljev na učenca 3. Kaj še vpliva na testne rezultate mature in je korelirano s številom učenca na učitelja? 29
Ne pozabimo na statistično sklepanje! 30
Uporaba ekonometrije Makroekonomija Kakšna bo gospodarska rast prihodnje leto? Ali dvig minimalne plače vpliva na zaposlenost? Ali bo dokapitalizacija bank vplivala na večjo rast kreditov? Finance Ali se bo cena delnice X povečala? Kakšna je verjetnost, da bo podjetje odplačalo dani kredit? Kakšen vpliv ima sprememba deviznega tečaja na prodajo podjetja X? Zdravstvo Ali kajenje povzroča raka? Ali ima določen poseg pozitiven vpliv na potek bolezni? Razno Ali je boljša gospodarsko rast zasluga finančnega ministra X? Ali kvaliteta šole vpliva na boljše dosežke učencev? 31
Rudarjenje podatkov (Data mining) 32
Literatura 1. E.S. Spelke, Am. Psychol.60, 950 (2005) 2. D.Halpem, J.Wai, A.Saw, in Gender Differences in Mathematics, A.M. Gallagher, and J.C. Kaufman, Eds., Cambridge University Press, NW, pp.48-72 (2005) 3. J.H. Stock and M.W. Watson: Introduction to Econometrics, Addison-Wesley, 2003. 4. L.Guiso, F.Monte, P. Sapienza, L.Zingales, Culture, Gender, and Math, Science, vol. 320 no. 5880 pp. 1164-1165 (2008) http://www.sciencemag.org/content/320/5880/1164.summary 33
Zanimivo branje Freakonomics, S.D.Levitt in S.J.Dubner Econometrics for Dummies, R. Pedace 34
HVALA ZA POZORNOST! 35