OSNOVE UMETNE INTELIGENCE

Podobni dokumenti
OSNOVE UMETNE INTELIGENCE

PowerPoint Presentation

Osnove statistike v fizični geografiji 2

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

Microsoft Word - SI_vaja5.doc

Reliability estimation of individual predictions

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Univerza v Ljubljani Fakulteta za računalništvo in informatiko David Možina Argumentirano strojno učenje z uporabo logistične regresije MAGISTRSKO DEL

Analiza infrardecih spektrov z globokimi nevronskimi mrežami

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

Osnove matematicne analize 2018/19

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

ČLANKI UDK :004.8 Umetna inteligenca v bančništvu univerzalno orodje? Dušan Fister, Iztok Jr. Fister in Timotej Jagrič* ARTIFICIAL INTELLIGENCE

Slide 1

EKVITABILNE PARTICIJE IN TOEPLITZOVE MATRIKE Aleksandar Jurišić Politehnika Nova Gorica in IMFM Vipavska 13, p.p. 301, Nova Gorica Slovenija Štefko Mi

E-nepremična inženirska zakladnica

Napovedovanje obsega komentiranja spletnih novic z modeli strojnega ucenja

Napovedovanje custvene naravnanosti avtorjev v spletnih komentarjih

FGG13

Vrste

Datum in kraj

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

Iskanje in razvršcanje spletnih trgovin

Mere kompleksnih mrež (angl. Network Statistics) - Seminarska naloga pri predmetu Izbrana poglavja iz diskretne matematike

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO ANALIZA PRIMERNOSTI UPORABE METOD PODATKOVNEGA RUDARJENJA ZA MODELIRANJE TVEGANJA PRI ZAVAROV

Microsoft Word - SI_vaja1.doc

Več varovanja, manj varnosti?

11. Navadne diferencialne enačbe Začetni problem prvega reda Iščemo funkcijo y(x), ki zadošča diferencialni enačbi y = f(x, y) in začetnemu pogo

Matematika 2

ANALITIČNA GEOMETRIJA V RAVNINI

Matematika II (UN) 2. kolokvij (7. junij 2013) RE ITVE Naloga 1 (25 to k) ƒasovna funkcija f je denirana za t [0, 2] in podana s spodnjim grafom. f t

Strojno ucenje kemijskih reakcij proteinov v interakciji z RNA

Slide 1

Algoritmicno podprta optimizacija pospeševanja prodaje

5 SIMPLICIALNI KOMPLEKSI Definicija 5.1 Vektorji r 0,..., r k v R n so afino neodvisni, če so vektorji r 1 r 0, r 2 r 0,..., r k r 0 linearno neodvisn

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo

UNIVERZA V MARIBORU FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO Leon Bošnjak VPLIV PODOBNOSTI NA USPEŠNOST KLASIFIKACIJE EVOLUCIJSKIH OD

glava.dvi

2019 QA_Final SL

C:/Users/Matevž Èrepnjak/Dropbox/FKKT/testi in izpiti/ /IZPITI/FKKT-februar-14.dvi

(Microsoft PowerPoint - vorsic ET 9.2 OES matri\350ne metode 2011.ppt [Compatibility Mode])

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Umetna inteligenca Artificial Intelligence Študijski program in stopnja Study programme a

FGG14

Osnove verjetnosti in statistika

3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja

Geografska segmentacija uporabnikov za uporabo v oglaševanju

3. Preizkušanje domnev

Uvodno predavanje

PowerPoint Presentation

AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

2. Model multiple regresije

'Kombinatoricna optimizacija / Lokalna optimizacija'

Microsoft Word - Pravila - AJKTM 2016.docx

UNIVERZA V MARIBORU FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO Oddelek za matematiko in računalništvo DIPLOMSKO DELO Denis Kolarič Maribor, 2010

UNIVERZA V LJUBLJANI

Slide 1

Microsoft Word - M doc

predstavitev fakultete za matematiko 2017 A

Trg proizvodnih dejavnikov

PowerPoint Presentation

Model IEUBK za napoved vsebnosti svinca v krvi otrok in njegova uporaba na primeru Zgornje Mežiške doline

Delavnica Načrtovanje digitalnih vezij

Poskusi s kondenzatorji

UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Andrej Grah Napovedovanje pozicij obrambnih igralcev z nevronskimi mrežami DIPLOMSKO DE

UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Sašo Moškon Nomogramsko iskanje podprostorov neodvisnih atributov DIPLOMSKO DELO NA INT

MODEL PRIMERNOSTI OBMOČIJ ZA POVEZOVANJE

PowerPoint Presentation

Kein Folientitel

PowerPoint Presentation

Microsoft Word - Astronomija-Projekt19fin

1 Diskretni naklju ni vektorji 1 1 Diskretni naklju ni vektorji 1. Dopolni tabelo tako, da bosta X in Y neodvisni. X Y x x x x x

Teorija kodiranja in kriptografija 2013/ AES

Primer 1: Analiziramo produkcijske funkcije za podjetja industrijske dejavnosti v RS v podskupini DL Proizvodnja računalnikov in druge opreme za

Microsoft PowerPoint _12_15-11_predavanje(1_00)-IR-pdf

Microsoft Word - CelotniPraktikum_2011_verZaTisk.doc

LaTeX slides

7. VAJA A. ENAČBA ZBIRALNE LEČE

MAGIČNI KVADRATI DIMENZIJE 4n+2

10. Meritev šumnega števila ojačevalnika Vsako radijsko zvezo načrtujemo za zahtevano razmerje signal/šum. Šum ima vsaj dva izvora: naravni šum T A, k

Microsoft Word - UP_Lekcija04_2014.docx

KOMISIJA ZA LOGIKO 32. TEKMOVANJE IZ ZNANJA LOGIKE DRŽAVNO TEKMOVANJE, in 2. letnik Šifra: NALOGA MOŽNE TOČKE DOSEŽENE TOČKE

SMERNICE O METODAH ZA IZRAČUN PRISPEVKOV V SISTEME JAMSTVA ZA VLOGE EBA/GL/2015/ Smernice o metodah za izračun prispevkov v sisteme jamst

Vektorji - naloge za test Naloga 1 Ali so točke A(1, 2, 3), B(0, 3, 7), C(3, 5, 11) b) A(0, 3, 5), B(1, 2, 2), C(3, 0, 4) kolinearne? Naloga 2 Ali toč

resitve.dvi

Navodila za pripravo oglasov na strani Med.Over.Net v 2.2 Statistično najboljši odziv uporabnikov je na oglase, ki hitro in neposredno prenesejo osnov

Univerza v Ljubljani Fakulteta za računalništvo in informatiko Anže Sodja Segmentacija prostorskih medicinskih podatkov na GPE DIPLOMSKO DELO UNIVERZI

2.1 Osnovni pojmi 2 Nim Ga²per Ko²mrlj, Denicija 2.1 P-poloºaj je poloºaj, ki je izgubljen za igralca na potezi. N- poloºaj je poloºaj, ki

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

Priprava prispevka za Elektrotehniški vestnik

Ceccato_DRB_20-34_IVR_Leaflet_ENG_ indd

ovitek FIT-1

Poročilo o opravljenem delu pri praktičnem pouku fizike: MERJENJE S KLJUNASTIM MERILOM Ime in priimek: Mitja Kočevar Razred: 1. f Učitelj: Otmar Uranj

Brownova kovariancna razdalja

Brexit_Delakorda_UMAR

Microsoft Word - Andrej_Meh_Diploma.doc

Numeri na analiza - podiplomski ²tudij FGG doma e naloge - 1. skupina V prvem delu morate re²iti toliko nalog, da bo njihova skupna vsota vsaj 10 to k

Transkripcija:

OSOVE UMETE ITELIGECE 07/8 regresijsa drevesa ocenjevanje učenja linearni modeli - Zoran Bosnić del gradiva povzet po: Brato: Prolog programming for AI, Pearson (0) in Russell, orvig: AI: A Modern Approach, Pearson (00) Obravnava atributov Regresijsa drevesa potrebno je nasloviti še naslednja problema: manjajoči podati v atributih: ignorirati cele primere z neznanimi vrednostmi? uporabiti vrednost A/UKOW? nadomestiti manjajočo vrednost (povprečna, najbolj pogosta, naljučna, napovedana) primer obravnavamo verjetnostno glede na vse možne vrednosti atributa (s tao utežjo laho sodeluje pri gradnji modela in lasifiaciji) zvezna ciljna spremenljiva regresijsi problem so podobna odločitvenim drevesom, le za regresijse probleme sistemi: CART (Breiman et al 984), RETIS (Karalič 99), M5 (Quinlan 99), WEKA (Witten and Fran, 000) listi v regresijsem drevesu predstavljajo: predstavljajo povprečno vrednost označb ("razreda") primerov v listu preprost napovedni model (npr linearna regresija) za nove primere obravnava numeričnih atributov: običajno izvedemo disretizacijo v dva (binarizacija) ali več disretnih intervalov intervali z enao frevenco primerov (equal-frequency) intervali enae širine (equal-width) intervali, i masimizirajo informacijsi dobite Bora Beran, On Anything Data, domena MPG Regresijsa drevesa Gradnja regresijsih dreves atribut delimo glede na izbrano mejno vrednost drugačna mera za merjenje nedoločenosti/nečistoče: srednja vadratna napaa v vozlišču v: MSE v n y n i y i cilj: minimiziramo rezidualno nedoločenost po delitvi primerov glede na vrednosti atributa A pričaovana rezidualna nečistost I res A p left I left + p right I right p left A p right I left I right João eto, Classification & Regression Trees, http://wwwdifculpt/~jpn/r/tree/treehtml

Ocenjevanje učenja riteriji za ocenjevanje hipotez: točnost (angl accuracy) omplesnost (angl complexity) razumljivost (angl comprehensibility) subjetivni riterij ocenjevanje : na učnih podatih (angl training set, learning set) na testnih podatih (angl testing set, test set) izločimo del učnih podatov, s aterimi simuliramo ne-videne podate želimo si, da je testna množica reprezentativna za nove podate uporabimo laho intervale zaupanja v oceno uspešnosti na testni množici, i upoštevajo število testnih primerov na novih (ne-videnih) podatih (angl new data, unseen data) na njih bo naučeni sistem dejanso deloval Ocenjevanje učenja Prečno preveranje nasprotujoča si cilja: potrebujemo čim več podatov za uspešno učenje potrebujemo čim več podatov za zanesljivo ocenjevanje (večje število testnih primerov nam daje ožji interval zaupanja v oceno ) rešitev: adar je učnih podatov dovolj, laho izločimo testno množico (angl holdout test set) alternativa: večratne delitve na učno in testno množico različni načini vzorčenja testnih primerov: naljučno, nenaljučno (npr prečno preverjanje) poljubno ali stratificirano (zagotovimo enao porazdelitev razredov ot v učni množici) poseben primer večratnega učenja in testiranja -ratno prečno preverjanje (angl -fold cross-validation): celo učno množico razbij na disjuntnih podmnožic za vsao od podmnožic: uporabi množico ot testno množico uporabi preostalih - množic ot učno množico povpreči dobljenih ocen v ončno oceno testna množica učna množica ocena ocena ocena ončna (povprečna) ocena Prečno preveranje v prasi najpogosteje: 0 (0-ratno prečno preverjanje) vplive izbranega razbitja podatov na podmnožice laho zmanjšamo tao, da tudi prečno preverjanje večrat (npr 0x) ponovimo (torej 0 000 izvajanj učnega algoritma) in rezultate povprečimo poseben primer prečnega preverjanja je metoda izloči enega (angl leaveone-out, LOO) je ena številu primerov (vsaa testna množica ima samo en primer) najbolj stabilna ocena glede učinov razbitja na podmnožice časovno zelo zamudno, primerno za manjše množice iz meritev na vseh podmnožicah je možno izračunati tudi varianco/ intervale zaupanja

Linearni modeli Linearna regresija uporaba pri lasifiaciji (ot separator razredov) in regresiji (ot prileganje sozi podane toče) linearni model z eno odvisno spremenljivo (angl univariate linear model): h x w x + w 0 w 0 in w sta uteži (angl weights) spremenljiv (oeficienta) linearna regresija: postope isanja funcije h(x) (oziroma uteži w 0 in w ), i se najbolje prilega učnim podatom optimizacijo izvedemo z minimizacijo srednje vadratne napae: napaa h y j w x j + w 0 j prostor oeficientov je onvesen, loalni minimumi ne obstajajo (samo globalni) obstaja analitična rešitev: w x jy j x j y j x j x j w 0 y j w x j primer: cene hiš v Bereley, CA (009) napaa Linearna regresija Posplošitev v več dimenzij primer linearne regresije x j y j 8 9 9 4 6 5 4 6 7 8 9 4 0 x jy j 8 8 7 4 0 8 8 6 0 x j 4 9 6 5 6 49 64 8 00 x j 55 y j 48 x jy j 90 x j 85 w x jy j x j y j x j x j 0,897 w 0 y j w x j 0 90 55 48 0 85 55 48 0,897 55 9,7 0 možna je posplošitev v višje število dimenzij več neodvisnih spremenljiv (atributov) (angl multivariate linear regression) h x w 0 + i w i x j,i jer so w i uteži (oeficienti), x j,i pa i-ta spremenljiva (atribut) primera x j uteži laho določimo analitično: w X T X X T y jer je X matria s podati (vrstice učni primeri, stolpci atributi), y pa vetor z vrednostmi odvisnih spremenljiv primerov v prasi se odločamo za isanje oeficientov z gradientnim spustom w naljučna začetna rešitev ponavljaj do onvergence za vsa w i v w: w i w i α w i napaa(w) problem s pretiranim prilagajanjem, regularizacija Linearni modeli pri lasifiaciji Linearni modeli pri lasifiaciji linearni model se uporablja za ločevanje primerov, i pripadajo različnim razredom iščemo odločitveno mejo (angl decision boundary) oz linearni separator (obstaja samo pri linearno ločljivih problemih) za spodnji primer je linearno separator laho funcija 49 + 7x x 0 hipoteza je torej: h x prag(w x), jer prag z z 0 0 sicer primer linearno ločljivega in neločljivega problema (domena o potresih), x - jaost v tleh, x - jaost na površju stopničasta pragovna funcija možnih ustreznih premic je več preprosto isanje rešitve stohastični gradientni spust s posodabljanjem uteži za vsa učni primer x, y izvedi posodobitev uteži: w i w i + α y h x x i jer so w i uteži (oeficienti), α pa vpliva na hitrost spremembe (ora) intuicija: če y h(x), potem se w i ne spremeni če y in h x 0 (preniza vrednost hipoteze), potem se za pozitiven x i utež poveča in za negativen x i utež zmanjša če y 0 in h(x) (previsoa vrednost hipoteze), potem se za pozitiven x i utež zmanjša in za negativen x i utež poveča algoritem laho pri ustreznem α najde optimalno rešitev tudi za linearno neločljive podate smiselna izboljšava: logistična pragovna funcija

Linearni modeli pri lasifiaciji demo onvergenca algoritma pri linearno ločljivih podatih (levo) in linearno neločljivih podatiih (desno) Metoda najbližjih sosedov Metoda najbližjih sosedov angl nearest neighbors lastnosti: neparametrična metoda (ne ocenjuje parametre izbranega modela) učenje na podlagi posameznih primerov (angl instance-based learning) leno učenje (angl lazy learning): z učenjem odlaša vse do povpraševanja o novem primeru ideja: ob vprašanju po vrednosti odvisne spremenljive za novi primer: poišči primerov, i so najbližji glede na podano mero razdalje napovej pri lasifiaciji: npr večinsi razred med sosedi pri regresiji: npr povprečno vrednost/mediano označb sosedov v izogib neodločenemu glasovanju za večinsi razred pri lasifiaciji običajno izberemo, da je liho število pomembna izbira ustreznega : premajhen : pretirano prilagajanje preveli : prešibo posploševanje (pri : napoved večinsega razreda) v prasi običajno: 5 Hastie, Tibshirani, Friedman: Elements of Statistical Learning, 009 Metoda najbližjih sosedov Opombe razdaljo običajno merimo z razdaljo Minowsega: L p p x i, x j x i, x j, za p je to evlidsa razdalja: L x i, x j x i, x j, za p je to manhattansa razdalja: L x i, x j x i, x j, za zvezne atribute: razlia za disretne atribute: Hammingova razdalja (število disretnih disretnih atributov z ujemajočimi vrednostmi pri obeh primerih) p p p vpliv intervala vrednosti na izračunano razdaljo vpliva na najdene najbližje sosede potrebna normalizacija pri veliem številu dimenzij laho postanejo primeri zelo oddaljeni preletstvo dimenzionalnosti (angl the curse of dimensionality) implementacije isanja: O(), O(log), O() 4

Bayesov lasifiator 5