Geografski vestnik 72-1, 2000, Metode METODE ANALIZA POSELITVE GLEDE NA GEOMORFOLO[KE ZNA^ILNOSTI Z METODO MONTE CARLO AVTOR Toma` Podobnikar N

Podobni dokumenti
Osnove statistike v fizični geografiji 2

Microsoft Word - SI_vaja5.doc

2. Model multiple regresije

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

Microsoft Word - MD_1_IJS_Mrovlje.doc

Izvozna in uvozna funkcija slovenskega gospodarstva

3. Preizkušanje domnev

Avtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

1. IDENTIFIKACIJA PODATKOVNEGA NIZA 1.1 Naslov Strukturno-tektonska karta Slovenije 1: Alternativni naslov Strukturno-tektonska karta Slove

Microsoft Word - RAZISKAVA_II._del.doc

PRESENT SIMPLE TENSE The sun gives us light. The sun does not give us light. Does It give us light? Raba: Za splošno znane resnice. I watch TV sometim

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

glava.dvi

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

60-77.qxd

Microsoft Word - ARRS-MS-BR-07-A-2009.doc

Microsoft Word - SI_vaja1.doc

Microsoft Word - A-3-Dezelak-SLO.doc

Brownova kovariancna razdalja

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Microsoft Word - SevnoIII.doc

ARRS-BI-FR-PROTEUS-JR-Prijava/2011 Stran 1 od 7 Oznaka prijave: Javni razpis za sofinanciranje znanstvenoraziskovalnega sodelovanja med Republiko Slov

p65

Srednja poklicna in strokovna šola Bežigrad - Ljubljana Ptujska ulica 6, 1000 Ljubljana STATISTIKA REGISTRIRANIH VOZIL V REPUBLIKI SLOVENIJI PROJEKTNA

PREDLOG ZA AKREDITACIJO

Matematika 2

resitve.dvi

PowerPoint Presentation

Untitled-7

Slide 1

FOTOVOLTAIKA

naslov 73_1.qxd

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

PowerPoint Presentation

Microsoft Word - Met_postaja_Jelendol1.doc

Microsoft Word - Salamon.doc

Predmet: Course title: UČNI NAČRT PREDMETA/COURSE SYLLABUS Matematična fizika II Mathematical Physics II Študijski programi in stopnja Študijska smer

ZALOGE PODZEMNIH VODA V SEPTEMBRU 2011 Groundwater reserves in September 2011 Urška Pavlič V septembru se je nadaljevalo sušno in vroče vreme, zaradi

SZGG_2012_Dolsak_Sraj

PowerPointova predstavitev

Osnove matematicne analize 2018/19

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Ekonometrija Econometrics Študijski program in stopnja Study programme and level Magistrs

Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar Prirejeno po: Brcar, F. (2016). Pi

Diapozitiv 1

ENV2:

MERE SREDNJE VREDNOSTI

Delavnica Načrtovanje digitalnih vezij

Društvo za elektronske športe - spid.si Vaneča 69a 9201 Puconci Pravila tekmovanja na EPICENTER LAN 12 Hearthstone Na dogodku izvaja: Blaž Oršoš Datum

Priloga 1: Konservatorski načrt za prenovo 1 Naslovna stran konservatorskega načrta za prenovo KONSERVATORSKI NAČRT ZA PRENOVO naročnik: ime in priime

UDK 911.3:371.3:502.7=863 Tatjana Ferjan i UREDHOTEHJE OKOLJA - POTREBA SEDANJEGA ČASA Ob naraščajočih problemih v našem okolju se odpirajo tudi novi

predstavitev fakultete za matematiko 2017 A

MODEL PRIMERNOSTI OBMOČIJ ZA POVEZOVANJE

Športno društvo Jesenice, Ledarska 4, 4270 Jesenice, Tel.: (04) , Fax: (04) , Drsalni klub Jesenice in Zv

moski-zenske-2007-za 3-korekturo.pmd

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/testi in izpiti/ /IZPITI/FKKT-februar-14.dvi

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra unalni²tvo Izobraºevalna matematika Pisni izpit pri predmetu K

PAST CONTINUOUS Past continuous uporabljamo, ko želimo opisati dogodke, ki so se dogajali v preteklosti. Dogodki so se zaključili v preteklosti in nič

(Microsoft Word - Kanalizacija MUHABER-OBRAZLO\216ITEVzaOSMONM.docx)

OSNOVE UMETNE INTELIGENCE

EVROPSKA KOMISIJA Bruselj, C(2018) 7597 final IZVEDBENA UREDBA KOMISIJE (EU) / z dne o vzpostavitvi začasnega neposrednega stati

UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Matematična fizika II Course title: Mathematical Physics II Študijski program in stopnja Study programm

untitled

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Matematično modeliranje Mathematical modelling Študijski program in stopnja Study program

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Matematično modeliranje Mathematical modelling Študijski program in

REŠEVANJE DIFERENCIALNIH ENAČB Z MEHANSKIMI RAČUNSKIMI STROJI Pino Koc Seminar za učitelje matematike FMF, Ljubljana, 25. september 2015 Vir: [1] 1

Microsoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode]

Microsoft Word - ARRS-MS-CEA-03-A-2009.doc

untitled

Microsoft Word - Delovni list.doc

VSEBINSKI NASLOV SEMINARSKE NALOGE

Sinopsis

geologija 265 do konca.indd

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Modeliranje računalniških omrežij Computer networks modelling Študi

1 Diskretni naklju ni vektorji 1 1 Diskretni naklju ni vektorji 1. Dopolni tabelo tako, da bosta X in Y neodvisni. X Y x x x x x

Microsoft Word - M docx

Knjiga 1 crna.qxd

Matematika Diferencialne enačbe prvega reda (1) Reši diferencialne enačbe z ločljivimi spremenljivkami: (a) y = 2xy, (b) y tg x = y, (c) y = 2x(1 + y

I.5 ANALIZA UPORABE ZDRAVSTVENIH STORITEV PRI STAREJ IH SLOVENCIH: PRVI REZULTATI 4. VALA RAZISKAVE SHARE Rok Hren, Inštitut za matematiko, fiziko in

Požarna odpornost konstrukcij

Slide 1

STAVKI _5_

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

Poslovilno predavanje

(Microsoft PowerPoint _IZS_izobraevanje ZK_1_del.ppt [Zdru\236ljivostni na\350in])

Drago Perko PROGRAM DEGAS Drago Perko* Priprava in risanje kart, kartogramov, diagramov in podobnega zahtevata veliko dragocenega časa, računalniški g

1

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

KLIMATSKE ZNAČILNOSTI LETA 1993 Aleška Bernot-lvančič* Leto 1993 je bilo glede na podatke 30-letnega klimatološkega niza nadpovprečno toplo, s

IKT-ovitek-publikacije.cdr

Reducing disparities Strengthening relations

Transkripcija:

Geografski vestnik 72-1, 2000, 87 100 Metode METODE ANALIZA POSELITVE GLEDE NA GEOMORFOLO[KE ZNA^ILNOSTI Z METODO MONTE CARLO AVTOR Naziv: mag., univerzitetni diplomirani in`enir geodezije, asistent z magisterijem Naslov: Prostorskoinformacijska enota ZRC SAZU, Gosposka ulica 13, SI 1000 Ljubljana, Slovenija E-po{ta: tomaz@zrc-sazu.si Telefon: 01 470 64 93 Faks: 01 425 77 95 UDK: 528:681.3:551.4 COBISS: 1.02 IZVLE^EK Za prostorske analize v geografskih informacijskih sistemih se vedno bolj uporabljajo prilagojene neprostorske statisti~ne metode in tehnike. Ena od njih je tudi metoda Monte Carlo, ki je v ~lanku predstavljena na primeru testiranja statisti~ne zna~ilnosti vzorcev to~k v prostoru glede na geomorfolo{ke lastnosti povr{- ja. Na testnem obmo~ju Polhograjskega hribovja je testirana prostorska porazdelitev hi{ in prebivalstva glede na oddaljenost od vodnih izvirov in vodotokov ter glede na nadmorsko vi{ino, naklon, ekspozicijo, oson- ~enost in zakraselost povr{ja. Rezultati empiri~nih testiranj z metodo Monte Carlo so primerjani s tradicionalnimi statisti~nimi testi. KLJU^NE BESEDE metoda Monte Carlo, simulacija, analiza to~kovnih vzorcev v prostoru, statisti~na zna~ilnost, geografski informacijski sistem, Polhograjsko hribovje, Slovenija ABSTRACT Settlement analysis regarding to geomorphological significances with Monte Carlo method New approaches include more and more non-spatial statistical techniques adapted for solving the spatial analyses tasks in geographic information systems. An example of such techniques is the Monte Carlo method. In the article it is represented with the case of testing statistical significance of the spatial point patterns regarding to geomorphological characteristic In the case study area of Polhograjsko hribovje (Polhov Gradec hills) spatial distribution of houses and population with regard to the distance from water springs and streams, height above sea level, relief slope, relief incline, relief aspect, relief insolation and karst is tested. Results of the empirical Monte Carlo tests are compared with traditional statistical tests. KEY WORDS Monte Carlo method, simulation, spatial point pattern analysis, statistical significance, geographic information system, Polhograjsko hribovje, Slovenia Uredni{tvo je prispevek prejelo 10. februarja 2000. 87

1. Uvod Pri regionalnih {tudijah pogosto vrednotimo razli~ne prostorske porazdelitve z ugotavljanjem razli~nih statisti~nih povezav in raziskav vzorcev. Kadar se ne moremo zanesti na tradicionalne statisti~ne teste, nam lahko pomagajo metode, ki temeljijo na naklju~nih {tevilih in so znane pod imenom metode Monte Carlo. Uporabljamo jih predvem takrat, ko ugotavljamo, ali obstaja dolo~ena prostorska porazdelitev to~kovnih objektov tudi na nezna~ilnih vzorcih, pri katerih na prvi pogled ni opaziti korelacije. Metode Monte Carlo so {e posebej primerne za testiranje statisti~ne zna~ilnosti prostorskih vzorcev, ki niso porazdeljeni normalno ali pa so majhni in nezna~ilni (Kvamme 1997). V ~lanku so metode Monte Carlo predstavljene na primeru regionalne prostorske analize sorazmerno majhnega in homogenega obmo~ja Polhograjskega hribovja. Preu~ili smo razmerja med naravo in dru`bo, ki jih znanost {e razmeroma slabo pozna. Pri tem gre za integriranje podatkov fizi~ne, dru`bene in predvsem regionalne geografije. Ugotavljali smo, ali je razmestitev hi{ in prebivalstva povezana z geomorfolo{kimi zna~ilnosti obmo~ja. 2. Metode Monte Carlo Matemati~ne, natan~neje statisti~ne numeri~ne metode Monte Carlo so se na najrazli~nej{ih podro~jih znanosti mo~no razmahnile {ele v zadnjem desetletju. Slu~ajnega pojava pri teh metodah ne opisujemo z analiti~nimi zvezami, ampak s simulacijami (Vukadinovi} in Popovi} 1989). Na{tejmo nekaj tipi~nih podro~ij uporabe omenjenih metod, ki se razvijajo na raznih podro~jih aplikativne znanosti: metode v statisti~ni fiziki, naklju~na hoja, konstruiranje jedrskih reaktorjev, kvantna barvna dinamika, obsevanje pri terapiji rakastih obolenj, pretok prometa, nastanek in razvoj zvezd, ekonometrija, napovedovanje borznega indeksa, raziskovanje naftnih vrelcev, ugotavljanje natan~nosti geodetskih mre`, simulacija napak prostorskih podatkov (Podobnikar 1999) in podobno. Pri tem uporabljamo najrazli~nej{e tehnike, na primer: integriranje Monte Carlo, re{evanje sistemov linearnih ena~b, ocenjevanje napak, tehnike redukcije variance, paraleliziranje in vektorizacija. Ute`ne (tehtane) metode Monte Carlo uporabljamo za zmanj{anje napak in za izbolj{anje neodvisnosti funkcij (Mikhailov 1992), in sicer pri: optimizaciji postopkov ustvarjanja naklju~nih {tevil za oceno verjetnostnih karakteristik z naklju~nimi parametri, ra~unalni{kih modelih naklju~nih polj in nume- Slika 1: Monte Carlo simulacija z metodo»zadeni ali zgre{i«za izra~un povr{ine nepravilnega {tirikotnika (potemnjeno obmo~je). 88

Geografski vestnik 72-1, 2000 Metode ri~nih simulacij, vektorskih postopkih za re{evanje integralskih ena~b, posebnih pristopih uporabe teorije perturbacij in podobno. Enostaven primer tehnike integriranja z metodami Monte Carlo prikazuje izra~un integrala s kon~nim {tevilom dimenzij na primeru enostavne simulacije z metodo»zadeni ali zgre{i«. Ra~unali smo dvodimenzionalno povr{ino nepravilnega {tirikotnika. Z ustvarjanjem 1000 naklju~nih {tevil na obmo~ju s povr{ino 1,000 enote smo dobili kot rezultat povr{ino 0,708 enote, z analiti~no metodo pa povr{ino 0,718 enote (slika 1). 2.1. Definiranje metod Monte Carlo Metode Monte Carlo lahko zelo poenostavljeno predstavimo kot metode za ra~unanje z naklju~nimi {tevili. Primernej{o definicijo metod Monte Carlo povzemamo po Kalosu in Whitlockovi (1986, 2):» Metode Monte Carlo vsebujejo premi{ljeno uporabo naklju~nih {tevil pri izvrednotenju strukture stohasti~nega procesa «. S stohasti~nim procesom mislimo na zaporedje polo`ajev, katerih razvoj je dolo~en z naklju~nimi dogodki. V ra~unalniku jih ustvarjamo z naklju~nimi {tevili. Pri metodah Monte Carlo gre torej za re{evanje problemov, ki niso povezani z verjetnostjo (na primer izra~un vrednosti π), z verjetnostnimi metodami. Glede na definicijo metod velja poudariti, da je treba razlikovati med naklju~nimi vrednostmi in metodami Monte Carlo. Z naklju~nimi {tevili le ustvarjamo sinteti~ne podatke za testiranje, medtem ko pri~akujemo od metod Monte Carlo tudi numeri~en rezultat. V nasprotju z metodami ~iste oziroma teoreti~ne matematike spadajo metode Monte Carlo med metode uporabne oziroma eksperimentalne matematike, ki se ukvarja s poskusi z naklju~nimi {tevili (Hammersley in Handscomb 1965). Glede na to, ali se pristopi do problemov neposredno nana{ajo na vedenje ali rezultate naklju~nih procesov, jih delimo na dva tipa: verjetnostni pristop in deterministi~ni pristop. Enostaven verjetnostni problem je na~in opazovanja naklju~nih {tevil, ki omogo~a neposredno simulacijo fizikalnega naklju~nega procesa originalnega problema. Glede na obna{anje naklju~nih {tevil v procesu lahko pridemo do `elene re{itve. Po tem postopku lahko raziskujemo na primer nara{~anje populacije insektov glede na dolo~eno privzeto vitalno statistiko pre`ivetja in razmno`evanja. Pri takih analizah lahko napravimo model zgodovine `ivljenja in razmno`evanja posameznih insektov. Za vsak posamezen insekt lahko ustvarimo naklju~na {tevila za starost in rojstvo potomca ter njegov pogin. Nato z naklju~nim procesom sledimo njegovim potomcem. Naklju~na {tevila pri tovrstni statistiki uporabimo za primerjavo dolo~ene koli~ine naklju~nega vzorca glede na resni~ne rezultate, ki jih dobi entomolog v laboratoriju oziroma na terenu. Deterministi~ni pristop izkori{~a mo~ teoreti~ne matematike, na primer abstrakcijo in splo{nost. Pri tem se izogiba {ibkosti teoreti~ne matematike, ki odpoveduje pri zamenjavi teorije s poskusi. Primer deterministi~nega pristopa je uporaba Laplaceove ena~be pri re{evanju nekaterih problemov v elektromagnetni teoriji, kjer v dolo~enih primerih odpove standardna analiti~na re{itev. Deterministi~nega pristopa se dr`imo tudi pri obravnavi na{ega primera uporabe metod v prostorskih analizah. 2.2. Zgodovinsko ozadje metod Monte Carlo Ime za matemati~ne metode Monte Carlo je nastalo okoli leta 1944, ko so jih za~eli sistemati~no razvijati znanstveniki, ki so razvijali jedrsko oro`je v projektu Manhattan v Los Alamosu (Kalos in Whitlock 1986; Computational Science Education Project 1995). Najprej se je metoda imenovala Monaco, in sicer po ruleti kot enostavnem generatorju naklju~ij. Povod za izum metod je bila uporaba iger na sre~o, ob katerih so za~eli znanstveniki (in zasvojenci z igrami) {tudirati zanimive pojave in izide naklju- ~ij. Ve~ji razmah so metode Monte Carlo do`ivele po letu 1970 z razmahom digitalnih ra~unalnikov (Pllana 1997), ki so se izkazali kot idealno sredstvo za njihovo izvajanje. 89

Poglejmo nekaj znanih del, ki so pripeljale do metod Monte Carlo. Prvo dokumentirano naklju~no vzor~enje najdemo v zvezi z re{itvijo integrala za izra~un vrednosti π z naklju~nim spu{~anjem `eblji~ka na pravilno mre`o, ki jo je opisal francoski matematik Comte de Buffon leta 1768 v knjigi Esai d arithmétique morale (Kalos in Whitlock 1986, 4; Pllana 1997). Leta 1886 je Laplace predlagal uporabo te ideje za izra~un π in pri tem poudaril, da je konvergenca k rezultatu zelo po~asna. Kasneje so se z naklju~nimi vzor~enji ukvarjali {e Kelvin, Gosset, znan pod psevdonimom Student, in drugi. V tridesetih letih tega stoletja je fizik Fermi naredil nekaj numeri~nih poizkusov z nevtronsko difuzijo, za katere bi `e lahko rekli, da so prave simulacije Monte Carlo. 3. Teoreti~ne osnove testov zna~ilnosti pri metodah Monte Carlo Pri testih zna~ilnosti nas zanima odvisnost porazdelitve dolo~ene populacije v prostoru od zna~ilnosti dru`benega ali naravnega okolja. Populacija je lahko definirana z ekonomskimi ali obrednimi sredi{~i. Zna~ilnosti dru`benega okolja, kot so na primer vidnost, kognitivna pokrajina ploskev evklidske oddaljenosti, stro{kovna ploskev, lahko modeliramo z orodji geografskega informacijskega sistema. Na podoben na~in lahko analiziramo prvine naravnega okolja, kot so na primer topografski podatki, zna~ilnosti prsti, lastnosti kamnin in oson~enost (Kvamme 1997). Poznamo ve~ tradicionalnih statisti~nih pristopov za testiranje zna~ilnosti dolo~ene populacije, na primer testa χ 2 in t. V praksi testiramo statisti~no zna~ilnost s primerjavo indeksa dolo~enega prostorskega vzorca (na primer indeksa aritmeti~ne sredine, indeksa najbli`jega soseda ali koeficienta avtokorelacije) in skupine indeksov n-krat simuliranih naklju~nih porazdelitev pri uporabi populacije iste velikosti. V na{em primeru smo se za obravnavanje statisti~ne zna~ilnosti omejili predvsem na indeks aritmeti~ne sredine. Privzemimo, da le`i obravnavani prostorski vzorec populacije velikosti k na podobmo~ju S (Kvamme 1997). Z ustvarjanjem k naklju~nih {tevil, kar je velikost populacije, ustvarimo n novih naklju~nih populacij: S 1, S 2, S 3, S n. Nato za vsak vzorec, skupaj z originalnim, izra~unamo dolo~en indeks, ki ga imenujemo u, na primer srednjo vrednost. Tako statistiko torej izra~unamo za n + 1 vrednosti: u, u 1, u 2, u 3, u n. ^e predpostavimo, da je glede na obravnavano populacijo vsak vzorec enako verjeten, potem je statisti~na zna~ilnost glede na originalni vzorec ter niz (rang) simuliranih vrednosti u naslednja: p=r(u ) : (n + 1). ^e je na primer {tevilo naklju~nih populacij n = 999 (n + 1 = 1000 obravnavanih vrednosti, kjer 1 predstavlja vrednost za resni~ne podatke), je rang u -ja (pri upo{tevanju stopnje zna~ilnosti testa α) pri obojestranski stopnji tveganja za obravnavani vzorec naslednji: R(u ) 50 (α 5%) in R(u ) 950 (α 95 %). V tem primeru smo torej privzeli kot mero za zna~ilnost obojestransko tveganje 0,05 ali 0,95. Centralni limitni izrek (poenostavljeno) pravi, da se porazdelitev pri dovolj velikem vzorcu pribli`uje normalni porazdelitvi (Jamnik 1979, 509). Opazovana slu~ajna koli~ina je namre~ pogosto vsota neodvisnih in slu~ajnih prispevkov in s tem pribli`no normalno porazdeljena. Razpr{enost aritmeti~nih sredin vzorcev, za katero mera je standardni odklon, se z ve~anjem vzorca manj{a. Pri testiranju z metodami Monte Carlo, in tudi pri tradicionalnih testih zna~ilnosti, izkori{~amo prednosti {ibkega zakona velikih {tevil, ki pravi, da gre z nara{~ajo~o velikostjo vzorca razlika odstopanja vzor~nega povpre~ja od povpre~ja populacije proti ni~ (Jamnik 1979, 502). Na splo{no dose`emo z metodami Monte Carlo precej bolj{e rezultate kot s tradicionalnimi statisti~nimi testi predvsem pri majhnih in nezna~ilnih vzorcih. 3.1. Na~in vzor~enja za obravnavani primer Rastrski pristop omogo~a predstavitev populacije rastrskih celic obravnavanega obmo~ja kot celotno populacijo (K). Hi{e (k), ki pripadajo le omejenemu {tevilu rastrskih celic, obravnavamo kot vzorec 90

Geografski vestnik 72-1, 2000 Metode populacije K. Pri testiranju statisti~ne zna~ilnosti torej privzamemo celotno obravnavno populacijo hi{ (k) na danem obmo~ju za vzorec. Nato napravimo veliko {tevilo (n) naklju~nih vzorcev enakomerno porazdeljene diskretne slu~ajne spremenljivke enake velikosti kot je {tevilo hi{ (k) na obmo~ju celotne populacije (K). Za vsakega izmed n vzorcev izra~unamo aritmeti~no sredino. Ker gre za veliko {tevilo vzorcev, se rezultati posameznih aritmeti~nih sredin po centralnem limitnem izreku zbirajo okoli prave aritmeti~ne sredine po normalni porazdelitvi (Petz 1985, 107), primerni za testiranje zna~ilnosti. Normalnost porazdelitve aritmeti~nih sredin, izra~unanih iz n simulacij, lahko preverimo s testom Kolmogorov-Smirnov (Ambro`i~ in Lesko{ek 1998) ali kakim drugim testom. 4. Metodologija testiranja zna~ilnosti z metodo Monte Carlo Za testiranje statisti~ne zna~ilnosti to~kovnih vzorcev smo uporabili lasten AML-jev program, ki te~e pod orodjem Arc/Info z uporabo modulov Arc in Grid. Program poganja podprogram, napisan v jeziku C, ki omogo~a predvsem u~inkovito generiranje naklju~nih {tevil. Uporabili smo generator psevdonaklju~nih {tevil, ki deluje na osnovi algoritma Park-Miller z Bays-Durhamovim me{anjem. Omenjeni algoritem prestane vse zahtevane statisti~ne teste, razen testa ponovitve (periode), ki je sicer ve~ja od 10 8 {tevil (Press, Teukolsky, Vetterling, Flannery 1995), vendar ni neskon~na. Testiranje zna~ilnosti z metodo Monte Carlo smo izvajali za vektorsko podan to~kovni sloj centroidov hi{nih {tevilk (RPE) na rastrsko podanih slojih nadmorskih vi{in, naklonov in oson~enosti povr{ja. Algoritem za testiranje je v osnovnih korakih naslednji: definiranje vhodnih parametrov: to~kovne datoteke, ki predstavlja obravnavan vzorec, rastrske datoteke, na kateri preu~ujemo vzorec, in {tevila simulacij; ponavljanje spodaj navedenih korakov n-krat (n = 999): ustvarjanje naklju~nih {tevil, linearno transformiranje (k=frekvenca obravnavanega vzorca) naklju~nih {tevil v dvorazse`nostni prostor obravnavanega obmo~ja, prekrivanje k to~kovnih vzorcev z atributi pripadajo~ih rastrskih celic obravnavanih slojev, ra~unanje aritmeti~ne sredine m atributov rastrskih celic ob pogoju, da se prekrivajo s pripadajo~imi to~kami; izvajanje tretjega in ~etrtegakoraka tudi za vhodne podatke to~kovne datoteke glede na rastrske podatke; izdelava histograma vseh aritmeti~nih sredin (n+1); dolo~itev meje ocene zna~ilnosti z obojestranskim testiranjem (α 5 % in α 95 %), ki se pri skupnem {tevilu populacij n+1 = 1000 nana{a na manj kot 50 populacij z leve ali pa desne strani dobljene porazdelitve; v na{em primeru je vrednost aritmeti~ne sredine izvornih podatkov padla v obmo~je zna~ilnosti glede na simulirane podatke. 5. Prakti~ni primer testiranja zna~ilnosti za obmo~je Polhograjskega hribovja Cilj statisti~nega testiranja z metodo Monte Carlo je ugotavljanje statisti~ne povezave med razporeditvijo hi{ in prebivalstva z zna~ilnostmi pokrajine. Simulacijo izvajamo z naklju~nim vzorcem hi{ v prostoru. Hi{e so podane kot to~ke, sloji, ki predstavljajo zna~ilnosti pokrajine, pa rastrsko. Rezultati testiranj so vizualno (opazovanje vzorcev hi{ in histogramov) in statisti~no ovrednoteni. Testiranje zna~ilnosti prostorskih vzorcev z metodo Monte Carlo smo preizkusili na majhnem preprostem pravokotnem obmo~ju Polhograjskega hribovja zahodno od Ljubljane in ju`no od [kofje Loke, podanim z naslednjimi Gauss-Krügerjevimi koordinatami v metrih: jugozahodno ogli{~e 442.100 in 104.000, severovzhodno ogli{~e 450.100 in 110.000), kar zna{a 8 krat 6 km. Izbrano testno obmo~je 91

Slika 2: [ir{e obmo~je Polhograjskega hribovja s testnim obmo~jem (8 krat 6 km). S kri`ci so ozna~ene lege hi{, s krogci pa naselja. obsega osrednji, zahodni in severni del Polhograjskega hribovja (Gabrovec 1989). Za obmo~je so zna- ~ilni zaobljeni vrhovi, {iroka slemena in ozke doline. Obmo~je je zgrajeno predvsem iz dolomita in drugih karbonatnih kamnin, v katerih ve~inoma niso razviti povr{inski kra{ki pojavi, manj pa je nekarbonatnih kamnin. Vsi sloji geografskega informacijskega sistema, na katerih ugotavljamo prostorsko razporeditev hi{, so podani z 1 ha velikimi rastrskimi celicami. Skupno {tevilo celic K je 4800 celic (48 km 2 ), kolikor je teoreti~no mo`nih leg hi{. Iz RPE-ja Geodetske uprave Republike Slovenije iz leta 1993 ugotovimo, da je na omenjenem obmo~ju registriranih 171 hi{, kar pomeni 3,56 hi{e na km 2. Celotno populacijo hi{ {tejemo pri testiranju kot predstavnike vseh mo`nih leg. V hi{ah je po popisu iz leta 1991 `ivelo 542 prebivalcev (od 0 do 14 registriranih prebivalcev na posamezno hi{o), kar pomeni 3,17 prebivalca na hi{o in 12,9 prebivalca na km 2, kar je ve~ kot sedemkrat manj od slovenskega povpre~ja. Obmo~je je brez ve~jih naselij, vizualno pa tudi ocenimo, da je obmo~je zelo enakomerno poseljeno (slika 2). Testna porazdelitev obravnavanega vzorca hi{ in geomorfolo{kih zna~ilnosti je torej na pogled izrazito nezna~ilna. Pri~akovati je torej, da v ve~ini primerov ne moremo dobiti dobrih rezultatov statisti~nega testiranja, torej zna~ilnega odstopanja od naklju~nih vzorcev. 92

Geografski vestnik 72-1, 2000 Metode 5.1. Opis testiranih podatkov Kot osnovo smo za testiranje statisti~nih zna~ilnosti z metodo Monte Carlo uporabili vektorsko podan to~kovni sloj centroidov hi{nih {tevilk. Testirali smo ga glede na rastrsko podane sloje z lo~ljivostjo 100 m. Uporabili smo pet podatkovnih slojev. To so: centroidi hi{nih {tevilk (RPE), ki so bili zajeti s TTN-5, TTN-10, ortofoto na~rta ali odmere objekta, objekti pa so opredeljeni kot to~ke (Geodetska uprava Republike Slovenije), digitalni model vi{in (DMR 100), ki je bil izdelan iz temeljnih topografskih na~rtov v merilu 1 : 5000 in 1 : 10.000 (Geodetska uprava Republike Slovenije), objekti pa so opredeljeni kot rastrske celice (slika 3), oson~enost Slovenije (Gabrovec 1996), pri kateri so objekti prav tako podani kot rastrske celice (Geografski in{titut Antona Melika ZRC SAZU), generalizirana kartografska baza za vodotoke in izvire v merilu 1 : 25.000 (GKB 25-H), pri kateri so izviri opredeljeni kot to~ke in vodotoki kot linije (Geodetska uprava Republike Slovenije, in metalogenetska karta SRS v merilu 1 : 220.000, ki je bila digitalizirana in rastrirana z lo~ljivostjo 100 krat 100 m (Geolo{ki zavod Ljubljana in Raziskovalna skupnost Slovenije 1980). Za testiranje smo iz digitalnega modela vi{in izdelali {e tri rastrske sloje z lo~ljivostjo 100 m: sloj naklonov povr{ja v kotnih stopinjah od 0 do 90, sloj ekspozicij povr{ja v kotnih stopinjah med 0 in 360 ), sloj evklidske oddaljenosti od vodnih izvirov in vodotokov v metrih. 5.2. Izra~un osnovnih statisti~nih parametrov razporeditve hi{ Odlo~imo se za enostavno testiranje dejanske porazdelitve hi{ (k =171), (slika 4a) glede na dvorazse`nostno enakomerno porazdelitev slu~ajne spremenljivke (slika 4b, 4c in 4~). S simulacijo Slika 3: Perspektivni prikaz testnega obmo~ja Polhograjskega hribovja z ozna~enimi legami hi{ in re~no mre`o. Faktor pove~ave vi{in glede na polo`ajne mere je 2. 93

a) lege hi{ (k = 171) b) simulacija 1 (k = 171) c) simulacija 2 (k = 171) ~) simulacija 3 (k = 171) Slika 4: Primerjava prostorske razporeditve 171 hi{ (a) glede na tri simulirane primere z enakim {tevilom hi{ na testnem obmo~ju. ustvarjamo naklju~ne vzorce enakomerno po vsem obravnavanem obmo~ju, neodvisno od geografskega polo`aja. Omenjeno (poenostavljeno) metodo testiranja seveda ni smiselno prenesti na tista obmo~ja Slovenije, kjer lahko v ve~ini primerov `e na prvi pogled opazomo, da porazdelitve hi{ nikakor niso naklju~ne. Na sliki vidimo, da na prvi pogled te`ko opazimo razliko med dejansko porazdelitvijo in simuliranimi porazdelitvami. Rezultati testiranja so naslednji: geometri~no sredi{~e leg hi{ je glede na geometri~no sredi{~e obmo~ja premaknjeno za 490 m proti zahodu in 285 m proti jugu, geometri~no sredi{~e porazdelitve prebivalstva pa za 816 m proti zahodu in 358 m proti jugu. To lahko pomeni, da je ve~ stalnih prebivalcev dlje od Ljubljane in [kofje Loke, lastniki po~itni{kih hi{ pa so bli`je obeh mest. Zanimivej{e je testiranje statisti~ne zna~ilnosti pri ni~elni domnevi, da so hi{e porazdeljene naklju~no po obravnavanem obmo~ju. Za testiranje lahko primerjamo avtokorelacijski Moranov koeficient I med izvornim in simuliranim slojem leg hi{. Z I = 0,0705 smo dobili majhno stopnjo pozitivne avtokorelacije med legami. To pomeni, da imajo hi{e dolo~eno tendenco zbiranja v skupine (zaselke in vasi). Histogram ka`e, da se porazdelitev hi{ bistveno razlikuje od naklju~ne, saj jo najdemo kot najmanj{i podatek (aritmeti~nih sredin) z desne. S tem lahko z manj kot 0,1 % tveganjem sprejmemo alternativno domnevo, da se hi{e zbirajo v gru~e (slika 5). 94

Geografski vestnik 72-1, 2000 Metode 120 100 80 60 40 20 0 0,026 0,016 0,007 0,003 Moran hi{e 0,013 0,023 0,033 0,043 0,053 0,063 STD = 0,01 AS = 0,000 n = 1000 Slika 5: Histogram porazdelitve Moranovega koeficienta za naklju~no porazdeljene to~ke na testnem obmo~ju glede na vrednost tega koeficienta za izvorne podatke hi{ (potemnjen stolpec na skrajni desni). 5.3. Testiranje razporeditve hi{ glede na geomorfolo{ke zna~ilnosti Za testiranje smo uporabili: nadmorsko vi{ino povr{ja, oddaljenost od vodnih izvirov in potokov, naklon povr{ja, ekspozicijo povr{ja, oson~enost povr{ja in zakraselost povr{ja. Zanimajo nas rezultati statisti~nih testov, ki odgovorijo na vpra{anje, ali obstaja povezava med razporeditvijo hi{ in prebivalstva ter geomorfolo{kimi zna~ilnostmi povr{ja. Vsaki hi{i, ki pripada posamezni rastrski celici, na katerih izvajamo simulacije, pripi{emo odgovarjajo~o vrednost celice. Nato izra~unamo srednjo vrednost takega sloja tako za {est izvornih in vse simulirane sloje. Pripomniti velja, da kljub temu da smo pred tem ugotovili zna~ilno zbiranje dejanskega vzorca hi{ v gru~e, pri testiranju zna~ilnosti v ~lanku ne simuliramo do dejanske stopnje avtokoreliranih vzorcev, ampak ostajamo pri naklju~nih vzorcih s stopnjo avtokorelacijskega koeficienta I =0, kar poenostavi izvedbo naloge. Kon~no ugotavljamo, ali se aritmeti~na sredina podatkov za izvorni sloj statisti~no zna~ilno razlikuje od simuliranih. S tem potrdimo ali pa zavrnemo ni~elno domnevo, da je se aritmeti~na sredina testirane izvorne porazdelitve, v na{em primeru populacije 171 hi{, zna~ilno ne razlikuje od aritmeti~ne sredine celotnega obmo~ja 48.000 rastrskih celic oziroma aritmeti~ne sredine, ki jo dobimo iz n = 999 vzorcev simulacije, pri obojestranski stopnji tveganja α 5 % oziroma α 95 %. Predvidevamo torej, da so simulirani podatki porazdeljeni normalno in naklju~no. Pri testiranju se moramo zavedati, da je varianca povpre~ne lege hi{ z ve~anjem vzorca k vedno manj{a. 5.3.1. Testiranje razporeditve hi{ in prebivalstva glede na nadmorsko vi{ino Podrobneje obravnavamo prvega izmed {estih primerov testiranja porazdelitve hi{ glede na geomorfolo{ke zna~ilnosti obravnavanega obmo~ja. Nadmorska vi{ina obravnavanega obmo~ja se giblje med 403 in 984 m, s srednjo vrednostjo 678 m, kar je 25 m pod vrednostjo aritmeti~ne sredine obeh skrajnih vrednosti intervala. Sklepamo, da nekoliko prevladajo ni`ji predeli (slika 6a). Histogram nadmorskih vi{in obmo~ja ka`e na manj{e odstopanje od normalne porazdelitve. Hi{e so postavljene na nadmorskih vi{inah med 419 in 904 m (slika 6b), z aritmeti~no sredino nadmorske vi{ine 677 m, medtem ko je povpre~na vrednost nadmorske vi{ine bivanja prebivalcev 689 m. Opazimo pa, da ima 95

200 14 12 150 10 100 50 0 400 DMV STD = 112 AS =678 n = 4800 500 600 700 800 900 1000 8 6 4 2 0 400 hi{e STD = 126 AS =677 n = 171 500 600 700 800 900 1000 a) DMV: aritmeti~na sredina je 678 m b) hi{e: aritmeti~na sredina je 677 m Slika 6: Histogram porazdelitve vseh nadmorskih vi{in z ozna~eno povpre~no nadmorsko vi{ino (a) ter histogram porazdelitve nadmorskih vi{in hi{ z ozna~eno povpre~no nadmorsko vi{ino (b). razporeditev hi{ dva neizrazita maksimuma, in sicer na nadmorskih vi{inah med 500 in 550 m, kjer prevladujejo doline, ter med 650 in 850 m, kjer so zgornja pobo~ja in slemena hribov. Z metodo Monte Carlo testiramo zna~ilnosti z ni~elno domnevo, da je povpre~na hi{a postavljena zna~ilno na povpre~ni nadmorski vi{ini testnega obmo~ja, in prav tako, da povpre~ni prebivalec `ivi na povpre~ni nadmorski vi{ini. Za hi{e se izka`e, da postavljeno domnevo lahko potrdimo. Referen~na srednja vrednost je {ele na 439. mestu z leve (slika 7a). Nekoliko druga~ne rezultate dobimo, ~e analiziramo prebivalstvo glede na nadmorsko vi{ino. Izka`e pa se, da nekoliko ve~ji del prebivalstva (a ne statisti~no zna~ilen) `ivi v hribih, saj se normirana referen~na vrednost pojavi na 118. mestu z desne (slika 7b). Kljub nezna~ilnim odstopanjem rezultatov od ni~elne domneve pa lahko sklepamo, da je obstaja tendenca, da velike dru`ine `ivijo v hribih, v dolinah pa najdemo opu{~ene hi{e ali pa po~itni{ke hi{e. 70 70 60 60 50 50 40 40 30 30 20 20 10 0 655 660 665 670 675 680 685 690 695 700 STD = 8,36 AS = 679 n = 1000 10 0 655 660 665 670 675 680 685 690 695 700 STD = 8,37 AS = 679 n = 1000 DMV hi{e DMV prebivalci a) simulacija: hi{e je 677 m b) simulacija: prebivalci je 689 m Slika 7: Na histogramih povpre~nih vrednosti nadmorskih vi{in na simuliranih vzorcih je ozna~ena povpre~na vrednost nadmorskih vi{in izvornih podatkov hi{ (a) in povpre~na nadmorska vi{ina bivanja prebivalcev (b). 96

Geografski vestnik 72-1, 2000 Metode 5.3.2. Geografska interpretacija rezultatov testiranja Glede na izvedene simulacije in druge analize, ki smo jih izvedli za hi{e in prebivalstvo na vseh {estih podatkovnih slojev, lahko sklepamo, da so od obravnavanih naslednje spremenljivke za poselitev najpomembnej{e: naklon povr{ja, oson~enost povr{ja, ekspozicija povr{ja, manj pa zakraselost in oddaljenost od potokov in izvirov, medtem ko je povpre~na nadmorska vi{ina hi{ nepomembna. Zna- ~ilna oziroma tipi~na hi{a stoji torej na rahlo nagnjenem svetu, obrnjenem proti jugu, predvsem na nekarbonatni kamnini ter prej na hribu kot v dolini. Mimogrede, analize poka`ejo tudi to, da na hribih ni potokov in je malo izvirov. 5.4. Primerjava metode Monte Carlo s tradicionalnimi metodami Rezultate empiri~nega testiranja zna~ilnosti z metodo Monte Carlo smo ocenili prek primerjave s tradicionalnimi testi, ki smo jih izvedli za neparametri~ne (kategori~ne) vrednosti, kot je na primer kamninska zgradba povr{ja, in za parametri~ne (zvezne) vrednosti, kot je na primer oson~enost. Pri tem smo `eleli potrditi domnevo, da so empiri~ni testi, izvedeni s simulacijami metode Monte Carlo, bolj{i od testov pri tradicionalnih metodah. Med tradicionalnimi testi smo izbirali med testom χ 2, ki je primeren za neparametri~ne statisti~ne teste domnev, ter test t, ki je primeren za parametri~ne teste razlik med dvema populacijama. Glede na relativno velik vzorec populacije hi{ (k = 171), ki ga lahko pri{tevamo `e kar med velike vzorce, smo uporabili tudi test z, ki ga namesto testa t uporabljamo za ve~je vzorce pri predpostavki, da se populacija porazdeljuje normalno, kar pa za obravnavane porazdelitve ve~inoma ne dr`i. Pokazalo se je da pri konkretnem primeru uporabe testov zna~ilnosti χ 2 in z za neparametri~ne vrednosti, ka`eta na precej manj{o mo`nost, da postavljeno hipotezo zavrnemo kot pa z metodo Monte Carlo. Z drugimi besedami to pomeni, da se v tem primeru testiranje z metodo Monte Carlo precej bolj{e odziva na dano porazdelitev vzorca. Nekoliko obrnjen rezultat smo dobili pri primerjavi testov zna~ilnosti χ 2, z in t za parametri~ne vrednosti. V tem primeru smo z s tradicionalnimi testi nekoliko prej zavrgli postavljeno hipotezo, vendar ne bistveno. [e najprej smo jo zavrgli s testom t. Najve~ja napaka se pojavi na mejah intervala zaupanja (v na{ih primerih α = 5 %), ki so najzanimivej{e za testiranje. Metodo Monte Carlo, ki smo jo uporabili v prakazanih primerih, je pri vsakdanjem delu namesto tradicionalnih testov smiselno uporabiti {ele takrat, ko ti ka`ejo na dvoumno re{itev problema. V obravnavanem testnem primeru se je na ve~ini morfolo{kih zna~ilnosti povr{ja izkazala kot zelo koristna. 6. Sklep Slaba stran tradicionalnih statisti~nih testov je, da ne glede na resni~no porazdelitev najpogosteje privzemajo, da je porazdelitev normalna. Vzor~na porazdelitev aritmeti~ne sredine m, ki smo jo uporabljali pri testiranju z metodo Monte Carlo, je vedno pribli`no normalno porazdeljena, ~e je le velikost populacije n dovolj velika, na primer nad 30 ali 50 (Petz 1985, 110). Prednost rastrskih geografskih informacijskih sistemov pri na{ih testiranjih je, da vsebuje obravnavano obmo~je kon~no {tevilo populacije (K rastrskih celic), kar omogo~a la`ji izra~un populacijskih parametrov celotnega obmo~ja. Poglavitne zna~ilnosti in prednosti testov zna~ilnosti z metodo Monte Carlo navajamo glede na oceno rezultatov na{ega testiranja, deloma pa jih povzemamo po Kvammeju (1997): V osnovi lahko testiranje z ustvarjanjem naklju~nih {tevil uporabljamo tudi z naklju~nim vzorcem populacije iz obravnavanega obmo~ja. Pri tem za testiranje ni treba privzeti normalne porazdelitve vhodnih podatkov kot pri tradicionalnih testih zna~ilnosti. 97

V testiranje lahko vklju~imo tudi zapleteno spremenljivko, kot je na primer vidnost. Pri tem lahko populacija vsebuje vse mo`ne vidnosti (vrstica krat stolpec), ki povzro~ijo dolo~itev populacijskih parametrov ra~unsko te`ke tudi za srednje velika obmo~ja. Pristop naklju~nega spreminjanja n+1 vidnosti predstavlja bolj obvladljiv problem. Na podoben na~in bi lahko simulirali tudi naklju~ni digitalni model vi{in in potem ocenjevali dolo~ene spremenljivke na njem. Metodo Monte Carlo za testiranje zna~ilnosti, ki je omejena le na simulacijo naklju~nih to~k pri poznavanju problema, bi lahko raz{irili tudi na simulacijo linij in obmo~ij ter celo ploskev. Bistvena potencialna prednost simulacijskih postopkov Monte Carlo pri testiranju zna~ilnosti je, da lahko ob dobrem poznavanju geografskih zna~ilnosti obravnavanega obmo~ja oziroma vzorca uporabimo druge modele vzor~enja. Kot primer navajamo, da v~asih ne moremo privzeti, da je obravnavana populacija v prostoru razporejena neodvisno. Mnogo ve~ja mo`nost je, da obstaja med elementi populacije, najve~krat to~kami, neka soodvisnost. Z drugimi besedami; lega posamezne to~ke je delno odvisna od lege drugih to~k. ^e znamo podrobno opisati pravila odvisnosti, lahko dani vzorec primerjamo s simuliranimi vzorci, ki jih dobimo po primerljivih pravilih vzor~enja. Eden izmed mo`nih na~inov vzor~enja je upo{tevanje koeficienta avtokorelacije vzorca. Lahko pa iz postopka testa zna~ilnosti vzorca enostavno izlo~imo tista obmo~ja, ki ne zado{~ajo predpisanim pogojem. Primer je testiranje porazdelitve hi{ glede na naklon povr{ja, pri ~emer izlo~imo naklone, ve~je od 30. Nadalje lahko pri simulaciji upo{tevamo tudi to, da je na razli~nih naklonih povr{ja razli~na verjetnost pojavljanja hi{. Eno od smiselnih nadaljevanj opisanega primera bi bilo modeliranje, na primer obmo~ij, najprimernej{ih za poselitev. Metode ugotavljanja zna~ilnosti vzorca se v postopku modeliranja nana{ajo na opisni model. Pri tem bi morali ugotoviti {e, ~e je posamezno spremenljivko smiselno uporabiti za model, na primer z izra~unom ve~kratne regresije. 7. Viri in literatura Ambro`i~, F., Lesko{ek, B. 1998: Uvod v SPSS (verzija 7.5 za Windows 95/NT). Ljubljana. Computational Science Education Project, 1995: Introduction to Monte Carlo Methods. Medmre`je: http://csep1.phy.ornl.gov/csep/mc/mc.html (8. 2. 2000). Gabrovec, M. 1989: Vpliv reliefa za geografsko podobo Polhograjskega hribovja. Magistrska naloga. Oddelek za geografijo Filozofske fakultete Univerze v Ljubljani. Ljubljana. Gabrovec, M. 1996: Solar Radiation and the Diverse Relief in Slovenia. Geografski zbornik 36. Ljubljana. Hammersley J. M., Handscomb, D. C. 1965: Monte Carlo methods. New York. Jamnik, R. 1979: Verjetnostni ra~un in statistika, Vi{ja matematika II. Ljubljana. Kalos, M. H., Whitlock, P. A. 1986: Monte Carlo methods, Volume I: Basics. New York. Kvamme, K. L. 1997: GIS and Statistical Inference in Arizona: Monte Carlo Significance Tests. Archaeological Applications of GIS, Proceedings of Colloquium II, UISPP 13 th Congress, Forli, Italy, September 1996. Sydney. (zgo{~enka) Mikhailov, G. A. 1992: Optimization of Weighted Monte Carlo Methods. Berlin. Petz, B. 1985: Osnovne statisti~ke metode za nematemati~are. Zagreb. Pllana S. 1997: History of Monte Carlo method. Medmre`je: http://stud2.tuwien.ac.at/~e9527412 (8. 2. 2000). Podobnikar, T. 1999: Monte Carlo Simulations in Slovenia. Modelling and Visualisation of Spatial Data Error. GIM International, 13 7. Lemmer. Press, H. W., Teukolsky, S. A., Vetterling, W. T., Flannery, B. P. 1995: Numerical Recipes in C, The Art of Scientific Computing, Cambridge University Press. Medmre`je: http://www.ulib.org/web- Root/Books/Numerical_Recipes/ (9. 2. 2000). Vukadinovi}, S., Popovi}, J. 1989: Metoda Monte-Karlo. Beograd. 98

Geografski vestnik 72-1, 2000 Metode 8. Summary: Settlement analysis regarding to geomorphological significances with Monte Carlo method (translated by ) Monte Carlo methods were rapidly developing in the last two decades. Mostly they are implying in cases when analytical methods are failed. Monte Carlo Methods comprise branch of experimental mathematics which is concerned with experiments on random numbers. Similar situations are occurring when performing spatial analyses in geographical information system, but we mostly ignore or simplify such problems. For example Monte Carlo methods are effective tools for error estimation and visualisation of geographical information system data for vector data, as well as for grid data. Problems handled by Monte Carlo methods are of two types called probabilistic or deterministic according to whether or not they are directly concerned with behaviour and outcome of random processes. In case of a probabilistic problem the simplest Monte Carlo approach is to observe random numbers, chosen in such a way that they directly simulate the physical random processes of the original problem, and to infer the desired solution from the behaviour of these random numbers. The idea behind the Monte Carlo approach to deterministic problems is to exploit the strength of theoretical mathematic, its concern with abstraction and generality, while avoiding its associated weakness by replacing theory by experiment whenever the former falters. Being deterministic, this problem has no direct association with random process, but we can solve the deterministic problem numerically by a Monte Carlo simulation. In this paper we describe deterministic approach of a Monte Carlo simulation for evaluation of statistical significance of population spatial distribution with regard to social or natural environment. Social environment may be reflected as viewsheds, cognitive landscapes, cost surfaces etc., while natural (physical) environment may be reflected as topographical data, soil or geological characteristics, sun exposition etc. Practically statistical significance is tested with comparison index of appointed spatial sample (for example index of mean value, index of the nearest neighbour, coefficient of autocorrelation etc.) with n additional randomly simulated indexes using the same statistical population. In our case the index of the mean value is mostly employed. Let spatial sample with k cases from population lie on subset S. Additional n samples of size k may be selected at random from the same population (S 1, S 2, S 3, S n ). For each sample, including the sample of interest particularly statistic index u (in our case mean value), is computed yielding n+1 values (u, u 1, u 2, u 3, u n ). Assuming that each sample is realizable and equally probable outcome from population, the statistical significance of differences in the sample of interest relative to population may be estimated by ranking the values of u and computing p=r(u ):(n+1). If n=999 (n+1 = 1000 samples and a sample of real distribution) and rank of u for the sample of interest is R(u ) 50 (α 5%) and R(u ) 50 (α 95 %), the significance of this outcome is either less than or equal to 0.5 or greater or equal to 0.95. Practical case study of Monte Carlo simulation has been implied to the very regularly hilly region of»polhograjsko hribovje«, about 25 km west of the capital of Slovenia, Ljubljana, measuring 8 by 6 km, encoded within raster composed of 100 by 100 m grid cells, for a finite population of K =4800 locations (48 km 2 ). Raster data layers have been chose as following: height above sea level, distance from water springs and streams, relief slope and aspect, sun exposition, and karst or non-karst ground. Those geomorphological characteristics are visually very inexpressive. Within this region are registered k=171 houses. There are not perceived any larger settlements and population distribution seems to be insignificant. First of all, we applied simple Monte Carlo simulation to test the distribution of the houses only. Geometrical centre of distribution has been computed. It is significantly shifted 490 m to the west and 285 m to the south with regard to geometrical centre of the area of interest. With Monte Carlo meth- 99

ods we evaluated also autocorrelation coefficient I (Moran s) of the distribution of houses. It has been significantly different than randomly set, so it is significantly that houses unite to clusters (villages). After initial stages, we applied Monte Carlo simulation for evaluation of statistical significance of settlement analysis with regard to geomorphological characteristics. The main question was: Does relation between distribution of houses and geomorphological characteristis exist? We implied previously described method of Monte Carlo significance test with index of mean value for all six available raster data. In the article, we are describing test of houses distribution with regard to height above sea level only. Mean value of height of the tested area is 678 m. Histogram of the heights is almost normal distributed. Mean value of heights of the houses is 677 m. There are noticed two inexpressive maximums, between 500 and 550 m (referring to the valleys), between and 650 and 850 m (referring to upper slopes and ridges of the hills). With Monte Carlo simulation (n =999) it has been evaluated that the references mean value is on the position 439 from the left (insignificant deviation from the mean height level of surface) what confirms assumption that average house is placed on the average height above sea level. The results of all six data sets testing shows that the most important variables (data layers) which influence to the settlement distribution are: relief slope, aspect and sun exposition, partially also karst or non-karst ground and distance from water springs and streams, while height above sea level is less important. A recapitulation of the analyses could be a geographical interpretation: average (typical) house lies on a little slope relief, faces to the south, mainly on the non-karst ground and mostly on the hills. Another ascertainment (which not include settlements) is that on the hills there are not water streams and not many springs. There are many traditional statistical approaches for significance tests, as well known χ 2 and t. What we gained with Monte Carlo methods are much better results compared to traditional, especially in cases when samples are small and insignificant or when complex population distributions are simulated. We applied comparative testing for described case study also with traditional approaches. Data layers were divided to parametrical (e. g. continuous sun exposition) and non-parametrical (e. g. categorically classified relief aspect). Results of the tested cases show that Monte Carlo method is much more reliable for such tests, mainly because it is not so sensitive to the size and the distribution of the sample. In such cases, we can much easier accept uncertain value at the boundary of decision as significant with traditional tests than with Monte Carlo Method, what could not lead to good solution of the problems. In general, the Monte Carlo method is mostly recommended when we find out that results of previously applied traditional tests are ambiguous. In our case, the method proved oneself as to be very useful in most cases. It could be even more useful when some improvements are applied in simulation, especially if there are a priori known geographical characteristics. 100