Mere kompleksnih mrež (angl. Network Statistics) - Seminarska naloga pri predmetu Izbrana poglavja iz diskretne matematike

Podobni dokumenti
Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Bellman-Fordov algoritem za iskanje najkraj²ih poti Alenka Frim 19. februar 2009 Popravek 25. februar 2009 Imamo usmerjen graf G z uteºmi na povezavah

Brownova kovariancna razdalja

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

Univerza v Ljubljani Fakulteta za računalništvo in informatiko Nejc Ramovš Problem izomorfnega podgrafa DIPLOMSKO DELO NA UNIVERZITETNEM ŠTUDIJU Mento

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

FGG14

C:/AndrejT/vestnik/76_1/Rotovnik/main.dvi

Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se

Microsoft PowerPoint _12_15-11_predavanje(1_00)-IR-pdf

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/testi in izpiti/ /IZPITI/FKKT-februar-14.dvi

EKVITABILNE PARTICIJE IN TOEPLITZOVE MATRIKE Aleksandar Jurišić Politehnika Nova Gorica in IMFM Vipavska 13, p.p. 301, Nova Gorica Slovenija Štefko Mi

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Segmentacija slik z uporabo najvecjega pretoka

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

Teorija kodiranja in kriptografija 2013/ AES

DS2.dvi

UNIVERZA V MARIBORU FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO Oddelek za matematiko in računalništvo DIPLOMSKO DELO Denis Kolarič Maribor, 2010

FAKULTETA ZA STROJNIŠTVO Matematika 2 Pisni izpit 9. junij 2005 Ime in priimek: Vpisna št: Zaporedna številka izpita: Navodila Pazljivo preberite bese

3. Preizkušanje domnev

(Microsoft PowerPoint - vorsic ET 9.2 OES matri\350ne metode 2011.ppt [Compatibility Mode])

resitve.dvi

Vrste

'Kombinatoricna optimizacija / Lokalna optimizacija'

3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja

glava.dvi

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

ANALITIČNA GEOMETRIJA V RAVNINI

GeomInterp.dvi

Strojna oprema

Matematika 2

Mladi za napredek Maribora srečanje DOLŽINA»SPIRALE«Matematika Raziskovalna naloga Februar 2015

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij

Lehmerjev algoritem za racunanje najvecjega skupnega delitelja

Osnove statistike v fizični geografiji 2

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/TESTI-IZPITI-REZULTATI/ /Izpiti/FKKT-avgust-17.dvi

OSNOVE UMETNE INTELIGENCE

Microsoft Word - UP_Lekcija04_2014.docx

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

Slide 1

1. izbirni test za MMO 2018 Ljubljana, 16. december Naj bo n naravno število. Na mizi imamo n 2 okraskov n različnih barv in ni nujno, da imam

H-Razcvet

PREDMETNI KURIKULUM ZA RAZVOJ METEMATIČNIH KOMPETENC

predstavitev fakultete za matematiko 2017 A

Vaje: Matrike 1. Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N 0 1 n ; n N Pokaži, da je množica x 0 y 0 x

Dolocanje najkrajših poti med vozlišci telekomunikacijskega omrežja

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Microsoft Word - SI_vaja5.doc

2. Model multiple regresije

4. tema pri predmetu Računalniška orodja v fiziki Ljubljana, Grafi II Jure Senčar

Mrežni modeli polimernih verig Boštjan Jenčič 22. maj 2013 Eden preprostejših opisov polimerne verige je mrežni model, kjer lahko posamezni segmenti p

Diapozitiv 1

Microsoft Word - SI_vaja1.doc

MATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje prir

UNIVERZA V MARIBORU FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO Oddelek za matematiko in računalništvo DIPLOMSKO DELO Vika Koban Maribor, 2012

Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij.

Osnove verjetnostne metode doc. dr. R. Škrekovski Oddelek za Matematiko Fakulteta za Matematiko in Fiziko Univerza v Ljubljani

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

FGG13

Osnove teorije kopul in maksmin kopule

Povzporejanje metahevristik za NP-polne probleme

Statistika, Prakticna matematika, , izrocki

2. LINEARNA ALGEBRA

E-nepremična inženirska zakladnica

Diapozitiv 1

Datum in kraj

Matematika II (UN) 1. kolokvij (13. april 2012) RE ITVE Naloga 1 (25 to k) Dana je linearna preslikava s predpisom τ( x) = A x A 1 x, kjer je A

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/TESTI-IZPITI-REZULTATI/ /Izpiti/FKKT-junij-17.dvi

Diapozitiv 1

Wienerjevemu indeksu podobni indeksi na grafih

Microsoft Word - Astronomija-Projekt19fin

PowerPoint Presentation

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA NEŽKA RUGELJ SHOROV ALGORITEM DIPLOMSKO DELO LJUBLJANA, 2017

FGG02

Srednja šola za oblikovanje

resitve.dvi

PowerPointova predstavitev

MERJENJE GORIŠČNE RAZDALJE LEČE

Delavnica Načrtovanje digitalnih vezij

7. VAJA A. ENAČBA ZBIRALNE LEČE

Microsoft Word - avd_vaje_ars1_1.doc

Sestavljanje in re\unhbox \bgroup \let \unhbox \setbox \hbox {s\global \mathchardef \spacefactor }\ac

Slide 1

PRIPRAVA NA 1. Š. N.: KVADRATNA FUNKCIJA IN KVADRATNA ENAČBA 1. Izračunaj presečišča parabole y=5 x x 8 s koordinatnima osema. R: 2 0, 8, 4,0,,0

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

CpE & ME 519

Geometrija v nacionalnih preverjanjih znanja

Poglavje 3 Reševanje nelinearnih enačb Na iskanje rešitve enačbe oblike f(x) = 0 (3.1) zelo pogosto naletimo pri reševanju tehničnih problemov. Pri te

LABORATORIJSKE VAJE IZ FIZIKE

Microsoft Word - A-3-Dezelak-SLO.doc

Matematika II (UNI) Izpit (23. avgust 2011) RE ITVE Naloga 1 (20 to k) Vektorja a = (0, 1, 1) in b = (1, 0, 1) oklepata trikotnik v prostoru. Izra una

Microsoft Word - Seštevamo stotice.doc

MergedFile

Microsoft PowerPoint - Mocnik.pptx

Poskusi s kondenzatorji

SESTAVA VSEBINE MATEMATIKE V 6

Ravninski grafi Tina Malec 6. februar 2007 Predstavili bomo nekaj osnovnih dejstev o ravninskih grafih, pojem dualnega grafa (k danemu grafu) ter kako

resitve.dvi

Transkripcija:

Mere kompleksnih mrež (angl. Network Statistics) Seminarska naloga pri predmetu Izbrana poglavja iz diskretne matematike Ajda Pirnat, Julia Cafnik in Živa Mitar Fakulteta za matematiko in fiziko April 2012

Uvod Zakaj potrebujemo mere za omrežja? Kakšne naj bodo bistvene lastnosti omrežnih mer? Opisujejo naj bistvene značilnosti omrežja. Razlikujejo naj med različnimi razredi omrežij. Uporabna naj bodo v algoritmih in aplikacijah.

Porazdelitev stopenj vozlišč To je najpogostejša in računsko nezahtevna mera. V naključnem grafu G n,p je stopnja vozlišča porazdeljena: Binomsko - za majhno število vozlišč: ( ) n 1 p k (1 p) (n 1 k) Poissonovo - za veliko število vozlišč: k (np) k k! e np V realnosti so vozlišča pogosto porazdeljena po potenčnem zakonu, tj. ck γ za γ > 0 in c > 0.

Primeri grafov in omrežij, kjer je stopnja vozlišča porazdeljena po potenčnem zakonu: Graf sodelovanja med igralci (hollywood graf),γ 2.3 Slika : Graf sodelovanj med igralci z 10000 vozlišči.

Graf sodelovanj med matematiki: Ima približno 401 000 vozlišč.ta graf ima γ 2.4. Slika : Graf sodelovanj med matematiki.

Grafi socialnih omrežij kot so Facebook, MySpace, Twitter, Yahoo! Instant messaging, MSN etc., imajo praviloma 2 < γ < 3 : Slika : Graf Yahoo! Instant messaging grafa. To je primer grafa socialnega omrežja, ki ima 29000 vozlišč in 39000 povezav.

Razdalja Računsko bolj kompleksna mera Razdalja med dvema vozliščema grafa: d(u, v) = min{p Pje najkrajša pot med u in v} Če razdalje zložimo v matriko dobimo matriko velikosti V V, indeksirano z vozlišči grafa, tj. D = (d(u, v)) u,v V Matrika razdalje. Povprečna oz. karakteristična razdalja To je aritmetrična sredina vseh razdalj v grafu: 1 d = V 2 V i v V d(u, v). Če poznamo matriko razdalje D, potem lahko izračunamo povprečno razdaljo v O(n 2 ) času.

Razdalja (nadaljevanje) Ekscentričnost: ɛ(u) := max{d(u, v) v V } Radij: rad(g) = min{ɛ(u) u V }. Diameter: diam(g) = max{d(u, v) u, v V }. Okolice: h-okolica: Neigh h (v) := {u V d(u, v) h}. Velikost h-okolice onačimo z: N(v, h) = Neigh h (v). Hop plot: P(h) = {(u, v) V 2 d(u, v h)} = v V N(v, h). Povprečno velikost h-okolice: Neigh(h) = 1 P(h) n v V N(v, h) = n.

Algoritmi za iskanje najkrajše poti Iskanje najkrajše poti med dvema vozliščema v omrežju s poljubnimi utežmi ω : E R na povezavah je NP-težak problem. Če se omejimo na omrežja brez negativnih ciklov, lahko problem rešimo v polinomskem času. SSSP problem (angl. Single source shortest path) Če rešimo SSSP problem, lahko izračunamo matriko razdalje za vsak izvor posebej - za vsako vozlišče. Glede na vrsto utežne funkcije poznamo različne algoritme:

Algoritmi za iskanje najkrajše poti (nadaljevanje) Če imamo neuteženo omrežje, potem rešimo SSSP preko iskanja v širino (angl. Breadth-first-search) v O(n+m) času. Če imamo omrežje, ki ima samo nenegativne uteži, potem rešimo SSSP preko Dijkstra algoritma v O(m+nlogn) času. Če imamo omrežje brez negativnih ciklov pa uporabimo Bellman-Ford algoritem v O(mn) času.

Algoritmi za iskanje najkrajše poti (nadaljevanje) APSP problem (angl. All pairs shortest paths): Preko Floyd-Warshall algoritma, v času O(n 3.) Preko SSSP algoritmov, za vsako vozlišče posebej: Neutežen graf: O(nm) Nenegativne uteži na grafu: O(nm + n 2 logn) Graf brez negativnih ciklov: O(n 2 m)

O številu najkrajših poti Število različnih najkrajših poti med vozliščema u in v c(u, v) := {P; P je najkrajša pot od u do v} Floyd - Warshall algoritem

Algorithm 1 Štetje različnih najkrajših pot Require: Z utežmi w utežen graf G = (V, E), kateri je brez ciklov negativne in ničelne dolžine. Ensure: Razdalja d(u, v) in število različnih najkrajših poti med vsakim parom vozlišč u, v. for all v V do for all u V do 0 če u = v d(u, v) = w(u, v) če uv E sicer { 1 če uv E c(u, v) = 0 sicer end for end for for all v V do for all u V do for all v V do if d(u,v ) + d(v,v) = d(u,v) then c(u, v) = c(u,v) + c(u,v )c(v,v) (Najdemo pot enake dolžine.) else if d(u, v ) + d(v, v) < d(u, v) then d(u,v) = d(u,v ) + d(v,v) c(u,v) = c(u,v )c(v,v) (Najdemo krajšo pot.) end if end if end for end for end for

O številu najkrajših poti Število različnih najkrajših poti med vozliščema u in v c(u, v) := {P; P je najkrajša pot od u do v} Floyd - Warshall algoritem Število različnih najkrajših poti s povezavo e c(e) := {P; P je najkrajša pot, ki vsebuje povezavo e} e ima vozlišči u, v c(e) = d(u,v )=d(u,u)+1+d(v,v ) c(u, u)c(v, v )

Koeficient popačenja Graf G(V, E), vpeto drevo T Popačenje (distortion): D(T ) := 1 E (u,v) E d T (u, v) Koeficient popačenja nam pove, kolikšna je povprečna najkrajša pot med dvema sosednjima vozliščema grafa G v drevesu T. Globalno popačenje: D(G) = min{d(t ); T je vpeto drevo grafa G}

Koeficient gručavosti in tranzitivnost Cikel dolžine tri = (V, E ) λ(g)... število ciklov dolžine tri v grafu G λ(v) = { ; v V } λ(g) = 1 3 v V λ(v) Triada Triada v vozlišču Število triad v vozlišču v: τ(v) = ( d(v) 2 Število triad v grafu G: τ(g) = v V τ(v) ) = d(v) 2 d(v) 2

Koeficient gručavosti Koeficient gručavosti za vozlišče v (τ(v) 0) V = {v V ; d(v) > 1} c(v) = λ(v) τ(v) Koeficient gručavosti za cel graf C(G) = 1 V v V c(v) Tranzitivnost T (G) = 3λ(G) τ(g) 0 T (G) 1

Odnos med tranzitivnostjo in koeficientom gručavosti v V T (G) = τ(v)c(v) v V τ(v) Pri tranzitivnosti so vsi cikli dolžine tri medsebojno enakovredni, pri koeficientu gručavosti pa so enakovredna vozlišča.

Izračun Node-iterator (Hitro) matrično množenje AYZ Algoritem Alon, Yuster, Zwick (1997) Algoritem poteka tako, da najprej loči vozlišča na dva tipa. Taka z nizko stopnjo in taka z višjo stopnjo. Na vozliščih z nižjo stopnjo išče trikotnike z node-iteratorjem, na podgrafu induciranem z vozlišči višje stopnje pa s hitrim matričnim množenjem. V low = {v V ; d(v) β}; β = m y 1 y+1 V high = V V low

LEMA: Algoritem AYZ za vsako vozlišče v v grafu G izračuna število ciklov dolžine tri λ(v) in ga lahko implementiramo tako, da je njegova časovna zahtevnost reda O(m 2γ γ+1 ) oz. O(m 1.41 ).

Aproksimacija c(u, v) Slučajno vzorčenje X i... omejena slučajna spremenljivka, 0 X i M k... število vzorcev Hoeffdingova neenakost ( 1 P k ( k 1 X i E k i=1 ) ) k X i ɛ i=1 2e 2kɛ2 M 2

Hoeffdingova meja Fiksirajmo ɛ in p. Dobimo k. Ocenjujemo c(v) za vsako vozlišče v k je število sosednjih parov, za katere nas zanima, ali so povezani ali ne. Ocenjujemo c(g) k je število vozlišč, ki jih vključimo v izračun (moramo poznati c(v) oz. ga oceniti). k je število vozlišč, ki jih vključimo v izračun (moramo poznati c(v) oz. ga oceniti) Podobno za tranzitivnost.

LEMA: Za vsak konstanten ɛ in konstantno pravilnost p obstaja algoritem, ki oceni koeficient gručavosti c(v) za vsako vozlišče in koeficient tranzitivnosti T (G) za celoten graf v času O(n). Koeficient gručavosti C(G) lahko ocenimo v O(1).

Mrežni motivi Kakšne podgrafe lahko najdemo v omrežju? Ali se kakšni podgrafi pojavljajo pogosteje, kot bi bilo to statistično pričakovati? Štetje enakih podgrafov v grafu Testiranje statistične značilnosti

Štetje podgrafov: Iskanje podgrafa s k vozlišči Iskanje ciklov dolžine tri (AYZ algoritem) Iskanje podgrafov s tremi vozlišči (modificiran AYZ) Iskanje K 4 podgrafov (Kloks, Kratsch, Müller) Iskanje podgrafov z največ štirimi vozlišči (na neusmerjenih grafih)

Vrste omrežnih mer Globalna mera γ označuje (eno samo) vrednost γ G Y za vsak graf G G. število vozlišč/povezav, diameter, koeficient gručavosti Globalna porazdelitev Γ označuje preslikavo Γ G : P Y za vsak graf G G. če P = N, dobimo zaporedje (Γ G (0), Γ G (1),...) porazdelitve vhodnih/izhodnih stopenj, hop plot

Lokalna mera λ G označuje (eno samo) vrednost λ G (x) Y za vsak graf G G, kjer je x določen element grafa G. Bolj natančno, gre za preslikavo λ G : X G Y. vhodna in izhodna stopnja vozlišča, utež/kapaciteta povezave, razdalja Lokalna porazdelitev Λ označuje preslikavo Λ G : X G P Y za vsak graf G G. velikost okolice, eksentričnost, diameter

Transformacije omrežnih mer Slika: Transformacije vrst omrežnih mer

Globalizacija: odstranitev odvisnosti lokalne mere ali porazdelitve od elementov grafa (računanje, izbiranje, konstrukcija) maksimum γ G := max{γ G (x) x X G } povprečje γ G := 1 X G x X G γ G (x) diameter in radij, globalno popačenje

Štetje (lokalna mera globalna porazdelitev): preštejemo število elementov grafa tako, da λ G (x) leži v določeni množici vrednosti Γ G (t) := {x X G λ G (x) = t} porazdelitve stopnje vozlišča

Odstranitev parametra (porazdelitev mera): izračunamo vrednost λ G iz zaporedja vrednosti, danega s porazdelitvijo Λ G (spremenljivka je parameter) maksimum λ G (x) := max{λ G (x, t) t P} povprečje λ G := 1 P t P Λ G (x, t) ekscentričnost

Lokalizacija Globalna mera γ lokalna porazdelitev Λ: izberemo podgraf H(x, t) G za vsak x X G, t P in nastavimo Λ G (x, t) := γ H(x,t) Globalna mera γ lokalna mera λ: izberemo podgraf H(x) G za vsak x X G in nastavimo λ G (x) := γ H(x)

Lokalizacija Globalna porazdelitev Γ lokalna porazdelitev Λ: izberemo podgraf H(x) G za vsak x X G in nastavimo Λ G (x, t) := Γ H(x) (t) Lokalna mera λ lokalna porazdelitev Λ: izberemo podgraf H(x) G za vsak x X G in nastavimo Λ G (x, t) := λ H(x,t) (x)

Vizualizacija Slika: Absolutna porazdelitev vhodne stopnje z logaritemsko skalo (omrežje Crawl of Web Base, 2001)

Slika: Absolutna porazdelitev izhodne stopnje z logaritemsko skalo (omrežje Crawl of Web Base, 2001)

Slika: Razsevni diagram vhodne in izhodne stopnje z logaritemsko skalo (omrežje Crawl of Web Base, 2001)