Iskanje in razvršcanje spletnih trgovin
|
|
- Aleks Gomboc
- pred 4 leti
- Pregledov:
Transkripcija
1 Univerza v Ljubljani Fakulteta za računalništvo in informatiko Aron Birsa Iskanje in razvrščanje spletnih trgovin DIPLOMSKO DELO VISOKOŠOLSKI STROKOVNI ŠTUDIJSKI PROGRAM PRVE STOPNJE RAČUNALNIŠTVO IN INFORMATIKA Mentor: izr. prof. dr. Marko Robnik Šikonja Ljubljana, 2017
2
3 To delo je ponujeno pod licenco Creative Commons Priznanje avtorstva-deljenje pod enakimi pogoji 2.5 Slovenija (ali novejšo različico). To pomeni, da se tako besedilo, slike, grafi in druge sestavine dela kot tudi rezultati diplomskega dela lahko prosto distribuirajo, reproducirajo, uporabljajo, priobčujejo javnosti in predelujejo, pod pogojem, da se jasno in vidno navede avtorja in naslov tega dela in da se v primeru spremembe, preoblikovanja ali uporabe tega dela v svojem delu, lahko distribuira predelava le pod licenco, ki je enaka tej. Podrobnosti licence so dostopne na spletni strani creativecommons.si ali na Inštitutu za intelektualno lastnino, Streliška 1, 1000 Ljubljana. Besedilo je oblikovano z urejevalnikom besedil L A TEX.
4
5 Fakulteta za računalništvo in informatiko izdaja naslednjo nalogo: Tematika naloge: Za preiskovanje spleta je marsikdaj smiselno definirati specializirane iskalnike, ki za ozko področje ponudijo bolj kakovostno informacijo. Tak primer so spletne trgovine, saj jih obstaja ogromno, prodajajo pa zelo različne vrste izdelkov. Ponudniki novih proizvodov težko najdejo vse trgovine, ki bi bile primerne za prodajo njihovega produkta. Sestavite prototip specializiranega spletnega iskalnika, ki bo najprej uporabil spletnega pajka za iskanje trgovin, nato pa bo najdene spletne trgovine klasificiral v nekaj vnaprej definiranih kategorij. K problemu pristopite z analizo besedil in strojnim učenjem. Razvito rešitev ovrednotite s pomočjo že razvrščenih trgovin v spletnih imenikih.
6
7 Zahvaljujem se mentorju izr. prof. dr. Marku Robniku Šikonji za strokovno pomoč in za vse nasvete pri izdelavi diplomske naloge.
8
9 Kazalo Povzetek Abstract 1 Uvod 1 2 Kategorije spletnih strani Pridobivanje podatkov Strojno učenje Zbiranje podatkov Rezultati 15 5 Sklepne ugotovitve 19 Literatura 23
10
11 Seznam uporabljenih kratic kratica angleško slovensko SVM support vector machine metoda podpornih vektorjev HTTP hypertext transfer protokol za izmenjavo protocol hiperteksta TLD top level domain vrhnji imenski strežnik HTML hypertext markup označevalni jezik za language oblikovanje večpredstavnostnih dokumentov TF-IDF term frequency inverse uteževanje s frekvenco besed in document frequency inverzno dokumentno frekvenco knn k-nearest neighbors k-najbližjih sosedov BFS breath first search iskanje v širino IP internet protocol internetni protocol IPv4 internet protocol internetni protokol version 4 verzije 4 IPv6 internet protocol internetni protokol version 6 verzije 6
12
13 Povzetek Naslov: Iskanje in razvrščanje spletnih trgovin Cilj diplomske naloge je razvoj orodja, ki omogoča avtomatsko zaznavanje spletnih trgovin glede na tip izdelkov, ki jih ponuja. Spletne strani smo klasificirali v sedem vnaprej določenih kategorij: starine in zbirke, oblačila, zabavna elektronika, pohištvo, dom in vrt, nakit in pisarniški izdelke. Glavni problem je bil pridobivanje ustreznih podatkov za izgradnjo učne in testne množice ter klasificiranje spletnih strani. Uporabili smo naslednje metode strojnega učenja: naivni Bayesov klasifikator, k-najbližjih sosedov, metodo naključnih gozdov, nevronsko mrežo in metodo podpornih vektorjev. Najbolj obetavne rezulate smo dobili z metodo podpornih vektorjev. Ključne besede: specializirani iskalnik, podatkovno rudarjenje, strojno učenje, spletne trgovine, analiza besedil, naivni Bayesov klasifikator, k-najbližjih sosedov, metoda naključnih gozdov, nevronska mreža, metoda podpornih vektorjev.
14
15 Abstract Title: Search and classification of web shops The aim of the thesis was to develop a tool for automatic classification of online stores depending on the type of products they offer. Websites are classified into seven predefined categories: antiques and collectibles, clothing, consumer electronics, furniture, home and garden, jewelry and office products. The main problem was getting relevant data to build a learning and test data set and classifying web sites. The following machine learning methods were used: naive Bayesian classifier, k-nearest neighbors algorithm, random forests, neural networks and support vector machine. The most promising result were obtained using the support vector machine classifier. Keywords: specialized search engine, data mining, machine learning, e- commerce, text analysis, naive Bayesian classifier, k-nearest neighbors algorithm, random forests, neural networks, support vector machine.
16
17 Poglavje 1 Uvod Zaradi obsežnosti podatkov, ki jih ponuja svetovni splet, postaja iskanje specifičnih spletnih vsebin čedalje zahtevnejše. S pomočjo splošnih iskalnikov, kot so npr. Google, Bing in Yahoo, je v kratkem času praktično nemogoče priti do ciljnega nabora informacij in ustreznih spletnih mest, ki služijo pri opravljanju neke specifične dejavnosti, kot je spletna prodaja ali spletno nakupovanje. Zato smo se v diplomski nalogi ukvarjali z razvojem specializiranega iskalnika, ki omogoča pridobivanje želenih vsebin za določeno področje, dejavnost ali izdelek. Pri tem smo se ukvarjali z rešitvijo klasifikacijskega problema, s katerim smo prišli do želenih ciljnih informacij in razvili orodje za učinkovito iskanje spletnih trgovin. Večina uporabnikov interneta se ne zaveda, da v ozadju poteka neprestano zbiranje informacij s pomočjo spletnih pajkov. Prvotno so bili namenjeni preiskovanju spleta za iskalnike, ki potrebujejo čim več informacij, da lahko nudijo točne rezultate. Nadaljni razvoj spletnih pajkov je šel v smeri vse večje specializacije in danes se uporabljajo tudi oz. predvsem za pridobivanje specifičnih informacij. Ker s splošnimi iskalniki ne dosegamo dovolj natančnih iskalnih rezultatov, menimo, da bo v prihodnosti še večji poudarek na razvoju specializiranih programov za specifično raziskovanje in indeksiranje svetovnega spleta. 1
18 2 POGLAVJE 1. UVOD Struktura diplomskega dela je naslednja. Poglavje 2 opisuje pristop k iskanju in razvrščanju spletnih trgovin, opis metod pridobivanja podatkov in učinkovitega iskanja spletnih trgovin. Poglavje 3 obravnava podrobnosti strojnega učenja, strukturo rešitve in uporabljene algoritme. Poglavje 4 prikazuje rezultate strojnega učenja, ki smo jih predstavili s pomočjo tabel in vizualizacij. Poglavje 5 predstavi sklepne ugotovitve diplomskega dela, ter opisuje možne izboljšave pridobivanja podatkov, spletnega pajka in izboljšave klasifikatorja.
19 Poglavje 2 Kategorije spletnih strani Svetovni splet postaja glavni vir dostopa do podatkov in informacij, na osnovi katerih izvajamo naše vsakdanje aktivnosti. Po eni strani nam nudi obsežen nabor vsebin, ki so razmeroma lahko dostopne, po drugi strani pa se je skupaj z relevantnimi vsebinami povečala tudi redundantnost podatkov, tako da za iskanje informacije porabimo več časa, kot bi ga z uporabo prilagojenih spletnih iskalnikov. Vse večjemu pretoku informacij po spletu sledi tudi vse večji pretok blaga in storitev. Spletno nakupovanje se poleg udobnosti, hitrosti in anonimnosti od klasičnega razlikuje po bistveno večji izbiri izdelkov. Z večanjem izbire izdelkov je za kupca ključno, da v čim krajšem času pride do izdelka, ki ga išče. Splošni internetni brskalniki, kot so Firefox, Internet Explorer in Chrome, ter splošni internetni iskalniki, kot je npr. Google, so za povprečnega uporabnika sicer uporabniško prijazni, vendar pri podajanju rezultatov velikokrat zgrešijo cilj, bodisi ker ponujajo presplošne zadetke bodisi ker pri iskanju ne upoštevajo vseh uporabnikovih kriterijev. Navedimo primer, ko uporabnik ne ve natančno, kako se izdelek, ki ga išče, imenuje oz. kakšen opis ima na spletu. Polega tega mogoče ni seznanjen z novostmi na danem področju, torej z novimi spletnimi mesti in izdelki, ki ga zanimajo. Kot zadetke splošnih iskalnikov dobi veliko število spletnih strani, ki morda niti niso spletne trgovine ali pa ne ponujajo iskanega izdelka. 3
20 4 POGLAVJE 2. KATEGORIJE SPLETNIH STRANI Iskanje večje količine specifičnih podatkov s splošnimi internetnimi iskalniki je torej lahko časovno potratno in neučinkovito, zato smo se v diplomski nalogi osredotočili na razvoj primerne rešitve iskanja spletnih trgovin. Uporbniku smo želeli ponuditi programsko rešitev, ki bi mu poenostavila iskalno oz. nakupovalno izkušnjo. Ker na podobno rešitev še nismo naleteli, smo rešitev zastavili sami. Odločiti smo se morali, kakšne parametre iskanja bomo uporabili in po katerih kriterij bomo razvrščali trgovine. Po pridobitvi podatkov smo ugotovili, da so za razvrščanje spletnih trgovin najprimernejše metode strojnega učenja. Le-te omogočajo, da se računalnik s pomočjo ustreznega algoritma uči in prilagaja novim podatkom. Program ne predvidi vseh prihodnih situacij, vendar omogoča sprotno učenje in prepoznavanje novih vzorcev na podalgi predhodno naučenega. V našem primeru smo sestavili program, ki smo ga na učni množici podatkov naučili ustreznega razvrščanja trgovin glede na izbrane ciljne kategorije. Po učenju je program sam razvrščal nove primere. 2.1 Pridobivanje podatkov V splošnih iskalnikih je težko zožiti izbor podatkov, izločiti odvečne in nerelevantne podatke pa tudi pridobljeni podatki večkrat niso popolni, pri čemer zlahka zgrešimo cilj iskanja. Ponudniki novih proizvodov tako na primer težko najdejo spletna mesta, ki bi bila primerna za prodajo njihovih izdelkov. Pri iskanju ustreznih spletnih trgovin porabijo bodisi preveč časa bodisi je zaradi različne stopnje relevantnosti podatkov glede na vpisano ključno besedo težko izostriti poizvedbo. Zato smo sestavili prototip spletnega iskalnika, ki spletne trgovine klasificira v nekaj vnaprej določenih kategorij. Zanimalo nas je nekaj ciljnih kategorij razredov: starine in zbirke (antiques and collectibles), oblačila (clothing),
21 2.1. PRIDOBIVANJE PODATKOV 5 zabavna elektronika (consumer electronics), pohištvo (furniture), dom in vrt (home and garden), nakit (jewelry) in pisarniški izdelki (office products). Najprej smo raziskali možnosti učinkovitega iskanja spletnih trgovin in izdelkov. Želeli smo izboljšati izkušnjo spletnega iskanja tako, da bi naš prototip iskalnika ponudil le spletne trgovine s točno določeno kategorijo izdelkov. Tak iskalnik bi skrajšal čas iskanja, omogočil bi primerjavo spletnih trgovin z istimi kategorijami izdelkov, ponujal pregled nad spletnimi trgovinami in iz nabora zadetkov samodejno izločil napačne spletne trgovine ali izdelke. Spletnega pajka in analitično orodje za kategoriziranje spletne strani smo zgradili s pomočjo programskega jezika python in knjižnic scikit-learn, numpy, requests, tornado in html2text. Python je prost, odprtokoden in objekten programski jezik, ki lahko predstavlja podlago za različne programerske projekte. Danes se uporablja na številnih platformah npr. Linux, macos in Windows. Uporablja se pri strojnem učenju, podatkovnem rudarjenju, pisanju spletnih pajkov, izgradnji spletnih strani itd.
22 6 POGLAVJE 2. KATEGORIJE SPLETNIH STRANI
23 Poglavje 3 Strojno učenje Problem, s katerim se ukvarjamo v diplomski nalogi, zajema področje strojnega učenja. V osnovi je za strojno učenje potrebno pripraviti učno množico. Na ta način pridobivamo znanje na podlagi predhodnih primerov, s čimer lahko napovemo najverjetnejši izid v novih situacijah. Strojno učenje je vsaka sprememba sistema, ki mu omogoča, da opravlja isto nalogo bolje. Rezultat učenja je znanje, ki ga sistem uporabi za reševanje novih nalog [1]. Sistem za strojno učenje vsebuje učni in izvajalni algoritem ter model oz. hipotezo. Za slednjo je pomembno, da čim bolj ustreza vhodnim podatkom. Zato strojno učenje opredelimo kot modeliranje podatkov po kriterijih optimalnosti in učinkovitosti [1]. Strojno učenje se uporablja denimo v zdravstvu, meteorologiji ali igralništvu. Rezultati strojnega učenja so funkcije, pravila ali relacije, ki jih predstavimo z različnimi podatkovnimi shemami ali modeli. Metode in algoritme strojnega učenja izberemo glede na podatke, ki jih modeliramo. V našem primeru smo analizirali besedilo spletnih trgovin iz sedmih kategorij, v katere smo želeli klasificirati spletne trgovine na podlagi izdelkov, ki jih ponujajo. Klasifikacija ali uvrščanje je poleg segmentacije, vizualizacije ter ocenjevanja, ena najpogosteje uporabljenih metod. Uporabili smo več modelov, ki jih opisujemo v nadaljevanju. Za lažjo predstavo sistema smo na sliki 3.1 prikazali osnovne korake. 7
24 8 POGLAVJE 3. STROJNO UČENJE Izgradnja učne in testne množice 1. Sortiranje podatkov glede na spletni naslov in kategorijo Vhodni podatki iz spletne strani similarweb.com 2. Shranjevanje tekstovne vsebine spletnih strani v določeno kategorijo Kategorija in spletni naslov Spletni pajek Kategorije VHOD IZHOD 3. Učenje klasifikacijskih modelov 4. Napoved kategorije spletne strani Spletni pajek WWW VHOD: Spletna stran Prenos tekstovne vsebine spletne strani IZHOD: Napoved kategorije spletne strani Slika 3.1: Shema arhitekture sistema.
25 3.1. ZBIRANJE PODATKOV Zbiranje podatkov Ključno za izvedbo metod strojnega učenja so dobro pripravljeni podatki s pravilno kategorizacijo. Za izvedbo spletnega iskalnika smo najprej pridobili veliko število spletnih strani, ki smo jih kasneje uporabili za strojno učenje. Najprej smo želeli imeti pregled nad ponudbo svetovnega spleta. Za izbor spletnih trgovin bi bilo potrebno pregledati praktično celoten splet in iz njega izločiti tiste spletne strani, ki ustrezajo kriterijem. Izkazalo se je, da obstaja spletna stran ( ki ponuja dovolj podatkov o tipih obstoječih spletnih trgovin. Izbrali smo 1000 naslovov spletnih trgovin skupaj z njihovo kategorizacijo na sedem razredov. Potrebno je bilo izločiti nerelevantne in napačne podatke. Strani smo ročno pregledali in izločili nezadovoljive zadetke. Ostalo je 883 spletnih mest. Nad ročno pridobljenem naboru trgovin smo zgradili učni model in ga testirali s prečnim preverjanjem. Spletne trgovine smo uvrstili glede na tip izdelkov v sedem razredov: starine in zbirke, oblačila, zabavna elektronika, pohištvo, dom in vrt, nakit, pisarniški izdelki.
26 10 POGLAVJE 3. STROJNO UČENJE Prečiščen nabor podatkov je vseboval 883 naslovov spletnih trgovin. Vsakemu naslovu je pripadala ustrezna kategorija spletne trgovine, npr. - nakit. Naslednji korak je bil razvoj spletnega pajka, ki je na podlagi obiskov spletnih trgovin pridobil njihov opis v obliki besedila. Besedilo vsake spletne strani je bilo shranjeno v samostojno tekstovno datoteko z ustrezno kategorijo. Za izvedbo opisane naloge smo izvedli naslednji postopek: 1. Postavitev strukture map, ki bodo služile za uvrščanje pridobljenih podatkov. 2. Implementacija uporabniškega posrednika (user agent), ki je simuliral obiskovalca spletne strani in omogoča pridobitev podatkov tudi z morebiti zaščitenih spletnih strani (anti-bot protection). 3. Preverba dosegljivosti posameznega spletnega mesta je potrebna zaradi morebitnih sprememb statusa spletnih strani. Na ta način smo izločili spletne strani, ki niso bile dosegljive. 4. V izogib morebitnim blokadam in jezikovnim omejitvam smo uporablili posredniški strežnik, ki je spletnega pajka prikazoval kot uporabnika iz tujine. Za izvedbo naštetih nalog smo uporabili nabor python knjižnic, ki se uporabljajo pri tekstovnem rudarjenju in analizi pridobljenih podatkov (scikitlearn), izvajanju HTTP poizvedb na spletnih strežnikih (requests), branju zelo velikih datotek (fileinput), pridobivanju vrhnjih internetnih domen (tld), enostavnemu kodiranju in dekodiranju zahtev (simplejson), neblokiranih omrežnih operacij (tornado) in ugotavljanju tehnologij, ki jih uporablja določena spletna stran (wappalyzer).
27 3.1. ZBIRANJE PODATKOV 11 Za luščenje besedila smo uporabili knjižnico, ki je iz spletne strani odstranila HTML elemente (html2text). Za učenje in testiranje smo uporabili stratificirano prečno preverjanje. Za strojno učenje smo besedilo vektorizirali z metodo vreče besed (bag of words) [1], ter izločili nerelevantne in nepomembne besede, kot so npr. vezniki. Uporabili smo naslednje klasifikatorje: 1. Naivni Bayesov klasifikator (Naive Bayesian classifier) [1] ocenjuje verjetnosti iz učne množice. Ocenjujemo verjetnost za vsak razred pri danem opisu novega primera. Zvezne atribute atribute je potrebno diskretizirati z uporabo mehke diskretizacije. Slabost algoritma je, da pri močnih odvistnostih med atributi odpove, v tem primeru konstruiramo nove, bolj informativne atribute. Lepa lastnost algoritma je inkrementalno učenje: Če dobimo nove učne primere, lahko le dopolnimo znanje, ki ga že imamo. Saj je potrebno samo popraviti frekvence [1]. 2. Metoda naključnih gozdov (Random forests) [1] temelji na ideji generiranja množice odločitvenih dreves, pri čemer pri vsakokratni izbiri najboljšega atributa v vozlišču drevesa naključno izbere majhno število atributov, izmed katerih izberemo najboljšega. Na strukturo drevesa vplivajo tudi učni primeri, ki so za vsako drevo vzorčeni z vračanjem. Dobra lastnost metode je, da zmanjšuje varianco posameznih dreves, slabost pa je otežena razlaga odločitev [1]. 3. Pri nevronskih mrežah [1] je učenje pogojeno z napako, glede na katero se uravnavajo uteži. Perceptron je najbolj razširjen tip nevronov. Uporablja se za nadzorovano učenje binarnih klasifikacijskih problemov. Vhod je predstavljen kot vektor številk, vse povezave med nevroni pa so pri Perceptronu usmerjene naprej. Vhodne in izhodne vrednosti so lahko poljubne zvezne spremenljivke. Učenje poteka postopoma in traja dokler ni napaka dovolj majhna [9]. Dobra lastnost nevronskih mrež je, da podpira večsmerno izvajanje, isti podatek je lahko vhod ali
28 12 POGLAVJE 3. STROJNO UČENJE izhod, slabost pa razlaga rešitve. Pri nevronskih mrežah se uporablja princip gradientnega učenja, to pomeni, da nevronski mreži spreminjamo uteži, odvod pa nam pove, kam se moramo premaknit, da bo napaka manjša [1]. 4. Metoda podpornih vektorjev SVM (Support Vector Machine) [1] se uspešno uporablja pri večdimenzionalnih podatkih in velja za enega najboljših klasifikatorjev tekstovnih podatkov. Je dvorazredni klasifikator (za pozitivne in negativne primere). Zaradi uporabe le dveh razredov zahteva dodatne strategije pri večrazrednih problemih npr. eden proti enemu [3]. 5. K-najbližjih sosedov (K-nearest neighbors) [1] za dani nov primer najde najbližje oz. najbolj podobne primere in oceni verjetnostno porazdelitev razreda iz porazdelitve razredov teh primerov. Nov primer klasificiramo v večinski razred, ki ga določa k najbližjih primerov. Algoritem je občutljiv na izbrano metriko razdalje med učnimi primeri. Slabost metode je njena relativno počasna klasifikacija [1][3]. Z zniževanjem vrednosti parametra k povečujemo vpliv šuma v učni množici. Parameter k ponavadi nastavimo na liho število, s tem se izognemo morebitnemu neodločenmu rezultatu (npr. pri dveh razredih). Vrednost k =1 uporabimo takrat, ko v podatkih ni napak, če imamo šum v podatkih, povečujemo vrednost k. Optimalen parameter k večinoma iščemo na validacijski množici. Pomembno pri algoritmu je, kako definiramo atributni prostor, da ga ne deformiramo z nepotrebnimi atributi.
29 3.1. ZBIRANJE PODATKOV 13 Za oceno točnosti klasifikacije smo izvedli desetkratno stratificirano prečno preverjanje na naboru podatkov, kot je prikazano na sliki 3.2. Učna množica je bila razdeljena na deset enakih delov, za vsak del je bila zgrajena hipoteza iz devetih delov, testirali smo jo na preostalem delu. Končna ocena točnosti predstavlja povprečje dobljenih klasifikacijskih točnosti. Za vsakega od zgoraj navedenih algoritmov smo uporabili stratificirano prečno preverjanje. Množica za testiranje Množica za učenje Korak 1 Korak 2 Korak 3 Korak 10 Slika 3.2: Potek 10-kratnega prečnega preverjanja.
30 14 POGLAVJE 3. STROJNO UC ENJE
31 Poglavje 4 Rezultati Tabela 4.1 prikazuje povprečno klasifikacijsko točnost posameznih algoritmov, pridobljeno z desetkrtanim stratificiranim prečnim preverjanjem. Povprečje z standardno deviacijo Metoda podpronih vektorjev (0.014) Multinomialni naivni Bayes (0.012) Nevronska mreža (0.015) Metoda naključnih gozdov (0.015) K-najbližjih sosedov (0.013) Binarni naivni Bayes (0.017) Tabela 4.1: Povprečje klasifikacijske točnosti z standardno deviacijo za desetkratno stratificirano prečno preverjanje pri napovedovanju vrste trgovine. 1. Metoda podpornih vektorjev je v našem primeru najuspešnejša, pri čemer je bila klasifikacijska točnost 87%. Uporabljene so bile privzete nastavitve algoritma iz knjižnice scikit-learn, razen parameter random state (z katerim nastavljamo generator naključnih števil izbiranja podatkov) smo nastavili na Klasifikacijska točnost multinomialnega naivnega Bayesovega klasifika- 15
32 16 POGLAVJE 4. REZULTATI torja je bila ocenjena na 85%. Od nastavljivih parametrov smo spremenili dovzetnost do učenja α na vrednost Tudi z nevronsko mrežo, smo dobili klasifikacijsko točnost 85%. Uporabljene so bile privzete nastavitve algoritma iz knjižnice scikit-learn, spremenili smo le parameter n iter, ki je zadolžen za število prehodov skozi učno množico. Nastavili smo ga iz 5 na Z metodo naključnih gozdov smo doesgli klasifikacijsko točnost 83%. Uporabljene so bile privzete nastavitve algoritma iz knjižnice scikitlearn, spremenili smo samo vrednost za število dreves iz 10 na 100 (parameter n estimators). 5. Za algoritem k-najbližjih sosedov smo dobili 82% klasifikacijsko točnost. Število sosedov k smo nastavili na vrednost 100 (parameter n neighbors), ker z večjim številom sosedov smo dobili boljše rezultate. Za vse ostale parametre smo pustili privzete vrednosti. 6. Binarni naivni Bayesov klasifikator je dosegel klasifikacijsko točnost 76%. Uporabljene so bile privzete nastavitve algoritma iz knjižnice scikit-learn, spremenili smo samo dovzetnost do učenja α na vrednost Slika 4.1 predstavlja matriko zmot za metodo podpornih vektorjev, ki se je izkazala za najboljšo metodo razvrščanja spletnih strani. Vsota vsake vrstice podaja delež pravilnih razredov, vsote stolpcev pa nam povejo število ali delež problemov, ki so uvrščeni v posamezni razred. Iz diagonale matrike zmot, kjer so podana števila pravilnih klasifikacij je razvidno, da je metoda podpornih vektorjev najuspešnejša pri klasificiranju oblačil in zabavne elektronike, najslabša pa pri pohištvu.
33 Slika 4.1: Matrika zmot za metodo podpornih vektorjev. 17
34 18 POGLAVJE 4. REZULTATI Ocenjujemo, da so pridobljeni rezultati dovolj natančni za praktično rabo. Glede na rezultate lahko pričakujemo, da bomo s 87% točnostjo razporejali spletne trgovine v pravilne kategorije.
35 Poglavje 5 Sklepne ugotovitve V diplomskem delu smo razvili orodje za pridobivanje spletnih trgovin s spleta ter kategoriziranje spletnih strani namenjenih prodaji. Naš spletni pajek deluje na osnovi asinhronih poizvedb. Na seznamu domen izvaja poizvedbe in shrani njihovo besedilno spletno vsebino. Za kategorizacijo trgovin uporabljmo metode strojnega učenja. Rezultati prototipa specializiranega spletnega iskalnika so spodbudni, z nekaj izboljšavami bi iskanje in kategoriziranje lahko nadgradili do mere, da bi postalo avtomatsko. Pri praktični rabi smo zaznali več priložnosti za izboljšanje, ki jih v nadaljevanju opišemo. Izboljšave pridobivanja podatkov: 1. Za izgradnjo nabora podatkov je bilo potrebno ročno obiskati vse spletne strani, ter preveriti ali so pravilno kategorizirane. Izločiti je bilo potrebno napake, ki so bile prisotne v prvotnem naboru podatkov. Za hitrejše pregledovanje bi lahko razvili prilagojen spletni brskalnik, ki bi na vhod dobil seznam domen in preko dveh gumbov shranjeval relevantne spletne strani. Tako orodje bi nam omogočilo lažje pregledovanje velike količine spletnih strani in bi bilo uporabno za izločanje napačnih spletnih strani. 2. Pridobivanje novih spletnih strani: S pomočjo TLD zone datotek bi lahko vsak dan pridobili sezname novo registriranih domen, ki bi jih 19
36 20 POGLAVJE 5. SKLEPNE UGOTOVITVE lahko uporabili v spletnem pajku. Možne izboljšave spletnega pajka: 1. Uporaba knjižnice Scrapy framework ( ki je robustna knjižnica, namenjena pridobivanju podatkov iz različnih virov. 2. Nadgradnja spletnega pajka z uporabo omejenega iskanja v širino (bound BFS). Iskanje v širino je osnovni algoritem za spletno preiskovanje. Preiskuje graf, določen z izhodiščnim vozliščem, kar je v našem primeru korenska spletna stran, kakor je razvidno na sliki 5.1. Omejeno preiskovanje v širino preiskuje v širino do določene globine. To bi nam omogočilo izgradnjo obsežnejšega nabora podatkov. 3. Nadgradnja spletnega pajka z uporabo različnih uporabniških posrednikov(user agent) ob vsaki poizvedbi. S tem se lahko izognemo blokadam spletnega pajka, ker simuliramo vsakič drug brskalnik in operacijski sistem. 4. Uporaba posredniškega strežnika: Z pomočjo spletne strani proxymesh.com, ki ponuja spreminjajoče posredniške strežnike, bi lahko nadgradili naš spletni pajek tako, da bi uporabili izmenjujoče se posredniške strežnike in se izognili blokadam določenih IP naslovov, kar pride v upoštev pri spletnih straneh, ki blokirajo uporabnike določenih držav. 5. S pomočjo knjižnice Langdetect je mogoče nadgraditi spletnega pajka tako, da določi jezik spletne strani. Če npr. spletna stran ni v angleškem jeziku, jo je mogoče prevesti in šele nato kategorizirati. 6. Ker se naslovni prostor IPv4, ki je trenutno najbolj razširjen, zapolnjuje, je smiselno prilagoditi spletnega pajka tako, da obiskuje tudi naslovni prostor IPv6, na katerem že delujejo nekatere spletne trgovine.
37 Slika 5.1: Vizualizacija delovanja algoritma z omejenim iskanjem v širino. 21
38 22 POGLAVJE 5. SKLEPNE UGOTOVITVE Možne izboljšave klasifikatorja: 1. Klasifikator bi lahko napovedal ciljni spol določene strani trgovine. Želimo napovedati ali spletna trgovina ponuja samo ženske, samo moške izdelke ali oboje. Prav tako bi lahko uvedli večnivojsko klasifikacijo, ki bi kategorije razvrstila še na podkategorije.
39 Literatura [1] I. Kononenko in M. Robnik Šikonja. Inteligentni sistemi. Ljubljana: Fakulteta za računalništvo in informatiko, [2] I. Kononenko. Strojno učenje. Ljubljana: Fakulteta za računalništvo in informatiko, [3] B. Liu. Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. New York: Springer, [4] M. Zorman in drugi. Inteligentni sistemi in profesionalni vsakdan. Maribor: Center za interdisciplinarne in multidisciplinarne raziskave in študije Univerze v Mariboru, [5] Napovedovanje vrednosti z algoritmom K najbližjih sosedov. [Online]. Dosegljivo: [Dostopano ]. [6] Python. [Online]. Dosegljivo: [Dostopano ]. [7] Python requests. [Online]. Dosegljivo: [Dostopano ]. 23
40 24 LITERATURA [8] Python html2text. [Online]. Dosegljivo: [Dostopano ]. [9] Perceptron. [Online]. Dosegljivo: learning.html. [Dostopano ].
OSNOVE UMETNE INTELIGENCE
OSNOVE UMETNE INTELIGENCE 2017/18 regresijska drevesa ocenjevanje učenja linearni modeli k-nn Zoran Bosnić del gradiva povzet po: Bratko: Prolog programming for AI, Pearson (2011) in Russell, Norvig: AI:
Prikaži več1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk
1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatkov in njihov prenos med spletnimi mesti. Obrazec v
Prikaži večCOBISS3/Medknjižnična izposoja
3/Medknjižnična izposoja 2.2 KATALOG Katalog nam omogoča: iskanje gradiva prikaz izbranih bibliografskih zapisov ali pripadajočih podatkov o zalogi iz lokalne baze podatkov v formatu COMARC vpogled v stanje
Prikaži večE-nepremična inženirska zakladnica
Smetanova ulica 17 2000 Maribor, Slovenija E-NEPREMIČNA INŽENIRSKA ZAKLADNICA - TEHNIŠKE FAKULTETE Naročnik: Energetika Maribor d.o.o. Vodja projekta: Daniela Dvornik Perhavec Fakultete za gradbeništvo,
Prikaži večVaja 2 Virtualizacija fizičnih strežnikov in virtualni PC A. Strežnik Vmware ESX Namestitev strežnika VMware ESX 3.5 na fizični strežnik 2. Nas
Vaja 2 Virtualizacija fizičnih strežnikov in virtualni PC A. Strežnik Vmware ESX 3.5 1. Namestitev strežnika VMware ESX 3.5 na fizični strežnik 2. Nastavitve strežnika ESX 3. Namestitev in nastavitve VM
Prikaži večNapovedovanje custvene naravnanosti avtorjev v spletnih komentarjih
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Urška Kosec Napovedovanje čustvene naravnanosti avtorjev v spletnih komentarjih DIPLOMSKO DELO UNIVERZITETNI ŠTUDIJSKI PROGRAM RAČUNALNIŠTVO
Prikaži večSlide 1
Projektno vodenje PREDAVANJE 7 doc. dr. M. Zajc matej.zajc@fe.uni-lj.si Projektno vodenje z orodjem Excel Predstavitev Najbolj razširjeno orodje za delo s preglednicami Dva sklopa funkcij: Obdelava številk
Prikaži večŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA
ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA Navdih Poizvedovanje po BD podatkovnih virih, ki imajo časovno dimenzijo in so dostopni. Večji promet pomeni večje število dobrin in močnejšo
Prikaži večIZGRADNJA PREDSTAVITVENE SPLETNE STRANI GLUCOWATCH Avtor: Marko Zajko Projekt delno financira Evropska unija, in sicer iz Evropskega socialnega sklada
IZGRADNJA PREDSTAVITVENE SPLETNE STRANI GLUCOWATCH Avtor: Marko Zajko UPORABLJENE TEHNOLOGIJE Za izdelavo predstavitvene spletne strani smo izbrali tehnologije, ki zagotavljajo: Hitro delovanje spletne
Prikaži večReliability estimation of individual predictions
Ocenjevanje zanesljivosti posameznih napovedi pri nadzorovanem učenju Darko Pevec DOKTORSKA DISERTACIJA PREDANA FAKULTETI ZA RAčUNALNIšTVO IN INFORMATIKO KOT DEL IZPOLNJEVANJA POGOJEV ZA PRIDOBITEV NAZIVA
Prikaži večChapter 1
- 1 - Poglavje 1 Uvod v podatkovne baze - 2 - Poglavje 1 Cilji (Teme).. Nekatere domene, kjer se uporabljajo podatkovne baze Značilnosti datotečnih sistemov Problemi vezani na datotečne sisteme Pomen izraza
Prikaži večDatum in kraj
Ljubljana, 5. 4. 2017 Katalog znanj in vzorci nalog za izbirni izpit za vpis na magistrski študij Pedagoško računalništvo in informatika 2017/2018 0 KATALOG ZNANJ ZA IZBIRNI IZPIT ZA VPIS NA MAGISTRSKI
Prikaži večElektronska pošta
Elektronska pošta ZGODOVINA Prvo sporočilo je bilo poslano leta 1971. Besedilo, ki ga je vsebovalo, je bilo QWERTYUIOP. Pošiljatelj je bil Ray Tomlinson, računalnika med katerima je bilo sporočilo poslano
Prikaži večProtokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij.
Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij. Protokoli - uvod Protokol je pravilo ali zbirka pravil, ki določajo načine transporta sporočil po računalniškem omrežju
Prikaži večMicrosoft Word - M doc
Državni izpitni center *M11145113* INFORMATIKA SPOMLADANSKI IZPITNI ROK NAVODILA ZA OCENJEVANJE Petek, 10. junij 2011 SPLOŠNA MATURA RIC 2011 2 M111-451-1-3 IZPITNA POLA 1 1. b 2. a 3. Pojem se povezuje
Prikaži večGimnazija Bežigrad Peričeva Ljubljana OPERACIJSKI SISTEM Predmet: informatika
Gimnazija Bežigrad Peričeva 4 1000 Ljubljana OPERACIJSKI SISTEM Predmet: informatika KAZALO 1. Uvod...3 2. Predstavitev programa Windows 98...5 3. Raziskovanje računalnika...5 4. Raziskovanje Interneta...6
Prikaži večOrodje za razporejanje clankov na konferencah
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Tadej Škvorc Orodje za razporejanje člankov na konferencah DIPLOMSKO DELO UNIVERZITETNI ŠTUDIJSKI PROGRAM PRVE STOPNJE RAČUNALNIŠTVO IN INFORMATIKA
Prikaži večDelavnica Načrtovanje digitalnih vezij
Laboratorij za načrtovanje integriranih vezij Univerza v Ljubljani Fakulteta za elektrotehniko Digitalni Elektronski Sistemi Osnove jezika VHDL Strukturno načrtovanje in testiranje Struktura vezja s komponentami
Prikaži večUniverza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA
Enopredmetna matematika IN STATISTIKE Maribor, 31. 01. 2012 1. Na voljo imamo kovanca tipa K 1 in K 2, katerih verjetnost, da pade grb, je p 1 in p 2. (a) Istočasno vržemo oba kovanca. Verjetnost, da je
Prikaži večVSEBINSKI NASLOV SEMINARSKE NALOGE
Univerza v Ljubljani Naravoslovnoteniška fakulteta Oddelek za tekstilstvo VSEBINSKI NASLOV SEMINARSKE NALOGE TITLE IN ENGLISH Avtorja: Študijska smer: Predmet: Informatika in metodologija diplomskega dela
Prikaži večUniverza v Ljubljani Fakulteta za računalništvo in informatiko David Možina Argumentirano strojno učenje z uporabo logistične regresije MAGISTRSKO DEL
Univerza v Ljubljani Fakulteta za računalništvo in informatiko David Možina Argumentirano strojno učenje z uporabo logistične regresije MAGISTRSKO DELO MAGISTRSKI PROGRAM DRUGE STOPNJE RAČUNALNIŠTVO IN
Prikaži večCODEKS IP KAMERA
CODEKS IP KAMERA uporabniška navodila Vse pravice pridržane. Noben del uporabniških navodil se ne sme reproducirati v kakršnikoli obliki ali na kakršen koli način - grafični, elektronski ali mehanski,
Prikaži večNapovedovanje obsega komentiranja spletnih novic z modeli strojnega ucenja
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Marko Vidoni Napovedovanje obsega komentiranja spletnih novic z modeli strojnega učenja DIPLOMSKO DELO UNIVERZITETNI ŠTUDIJSKI PROGRAM PRVE
Prikaži večPowerPoint Presentation
Uporaba storitve Office 365 v napravi iphone ali ipad Priročnik za hiter začetek dela Ogled e-pošte Nastavite napravo iphone ali ipad tako, da boste lahko pošiljali in prejemali e-pošto iz računa v storitvi
Prikaži večAnaliza infrardecih spektrov z globokimi nevronskimi mrežami
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Tina Avbelj Analiza infrardečih spektrov z globokimi nevronskimi mrežami DIPLOMSKO DELO INTERDISCIPLINARNI UNIVERZITETNI ŠTUDIJSKI PROGRAM
Prikaži večMATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje prir
MATLAB programiranje MATLAB... programski jezik in programersko okolje Zakaj Matlab? tipičen proceduralni jezik enostaven za uporabo hitro učenje priročno programsko okolje tolmač interpreter (ne prevajalnik)
Prikaži več(Microsoft Word - U\350enje telegrafije po Kochovi metodi.doc)
MORSE UČENJE PO KOCHOVI METODI Računalniški program za učenje skupaj z nekaterimi dodatnimi datotekami dobite na spletni strani avtorja: http://www.g4fon.net/. Zanimive strani so tudi: - http://www.qsl.net/n1irz/finley.morse.html
Prikaži več2. Model multiple regresije
2. Model multiple regresije doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014 2.1 Populacijski regresijski model in regresijski model vzorčnih podatkov
Prikaži večPowerPointova predstavitev
TIK terminal nima povezave s strežnikom Ob vpisu v TIK Admin se pojavi napis ni povezave s strežnikom Na terminalu je ikona 1. preverimo ali je pravilno nastavljen IP strežnika 1. Preverimo datoteko TIKSAdmin.INI
Prikaži večPRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA
KATALOG ZNANJA 1. IME PREDMETA ZBIRKE PODATKOV I ZBIRKE PODATKOV II 2. SPLOŠNI CILJI Splošni cilji predmeta so: razvijanje sposobnosti za uporabo znanstvenih metod in sredstev, razvijanje odgovornosti
Prikaži večMicrosoft Word - M docx
Š i f r a k a n d i d a t a : ržavni izpitni center *M15178112* SPOMLNSKI IZPITNI ROK Izpitna pola 2 Četrtek, 4. junij 2015 / 90 minut ovoljeno gradivo in pripomočki: Kandidat prinese nalivno pero ali
Prikaži večINDUSTRIJA 4.0: PRILOŽNOSTI DIGITALNE PREOBRAZBE PROCESA RAZVOJA BARV IN PREMAZOV TOMAŽ KERN, BENJAMIN URH, MARJAN SENEGAČNIK, EVA KRHAČ
INDUSTRIJA 4.0: PRILOŽNOSTI DIGITALNE PREOBRAZBE PROCESA RAZVOJA BARV IN PREMAZOV TOMAŽ KERN, BENJAMIN URH, MARJAN SENEGAČNIK, EVA KRHAČ AGENDA IZZIV OZADJE RAZISKAVE POSNETEK STANJA ANALIZA STANJA in
Prikaži večMicrosoft Word - M docx
Š i f r a k a n d i d a t a : Državni izpitni center *M15245112* JESENSKI IZPITNI ROK Izpitna pola 2 / 90 minut Dovoljeno gradivo in pripomočki: Kandidat prinese nalivno pero ali kemični svinčnik in računalo.
Prikaži večPOMOČ PREDSTAVITEV EKOSKLADOVNICE UPORABLJENA TERMINOLOGIJA REGISTRACIJA V EKOSKLADOVNICO PRIJAVA V EKOSKLADOVNICO OBJAVA PRISPEVKA ISKANJE PRISPEVKOV
POMOČ PREDSTAVITEV EKOSKLADOVNICE UPORABLJENA TERMINOLOGIJA REGISTRACIJA V EKOSKLADOVNICO PRIJAVA V EKOSKLADOVNICO OBJAVA PRISPEVKA ISKANJE PRISPEVKOV OCENJEVANJE PRISPEVKOV KOMENTIRANJE PRISPEVKOV KONTAKT
Prikaži večMicrosoft Word - CNC obdelava kazalo vsebine.doc
ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo mesto, april 2008 Ime in priimek študenta ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo
Prikaži večOsnove verjetnosti in statistika
Osnove verjetnosti in statistika Gašper Fijavž Fakulteta za računalništvo in informatiko Univerza v Ljubljani Ljubljana, 26. februar 2010 Poskus in dogodek Kaj je poskus? Vržemo kovanec. Petkrat vržemo
Prikaži večpredstavitev fakultete za matematiko 2017 A
ZAKAJ ŠTUDIJ MATEMATIKE? Ker vam je všeč in vam gre dobro od rok! lepa, eksaktna veda, ki ne zastara matematičnoanalitično sklepanje je uporabno povsod matematiki so zaposljivi ZAKAJ V LJUBLJANI? najdaljša
Prikaži večOrodje za izvoz podatkov
Pomoč uporabnikom -NA-SI-200, V6.13-00 IZUM, 2018 COBISS, COMARC, COBIB, COLIB, IZUM so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod... 1 2 Predstavitev orodja za izvoz podatkov...
Prikaži večFolie 1
S&TLabs Innovations mag. Damjan Kosec, S&T Slovenija d.d. marec 2013 S&TLabs Laboratorij za inovacije in razvoj spletnih in mobilnih informacijskih rešitev Kako boste spremenili svoj poslovni model na
Prikaži več'Kombinatoricna optimizacija / Lokalna optimizacija'
Kombinatorična optimizacija 3. Lokalna optimizacija Vladimir Batagelj FMF, matematika na vrhu različica: 15. november 2006 / 23 : 17 V. Batagelj: Kombinatorična optimizacija / 3. Lokalna optimizacija 1
Prikaži večMicrosoft Word - NAVODILA ZA UPORABO.docx
NAVODILA ZA UPORABO VODILO CCM-18A/N-E (K02-MODBUS) Hvala ker ste se odločili za nakup našega izdelka. Pred uporabo enote skrbno preberite ta Navodila za uporabo in jih shranite za prihodnjo rabo. Vsebina
Prikaži večVPELJAVA MDM V DRŽAVEM ZBORU MATJAŽ ZADRAVEC
VPELJAVA MDM V DRŽAVEM ZBORU MATJAŽ ZADRAVEC Državni zbor v številkah 90 poslancev 9 + 1 poslanska skupina 150+ mobilnih naprav (OS Android, ios) 500+ internih uporabnikov, 650+ osebnih računalnikov, 1100+
Prikaži večNameščanje Adopt Open Java Development Kit 8
Nameščanje Adopt Open Java Development Kit 8 za Windows x64 IZUM, 2019 IZUM, COBISS, COMARC, COBIB, COLIB, CONOR, SICRIS, E-CRIS so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod...
Prikaži večINFORMATOR BIROKRAT 1/2011
ta Veleprodaja Maloprodaja Storitve Računovodstvo Proizvodnja Gostinstvo Turizem Hotelirstvo Ticketing CRM Internetna trgovina Izdelava internetnih strani Grafično oblikovanje NOVOSTI IN NASVETI ZA DELO
Prikaži več3. Preizkušanje domnev
3. Preizkušanje domnev doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014 3.1 Izračunavanje intervala zaupanja za vrednosti regresijskih koeficientov Motivacija
Prikaži večNameščanje Adopt Open Java Development Kit 8
Nameščanje Adopt Open Java Development Kit 8 za Windows x64 IZUM, 2019 IZUM, COBISS, COMARC, COBIB, COLIB, CONOR, SICRIS, E-CRIS so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod...
Prikaži večOSNOVNE INFORMACIJE O TRGOSKOPU Kaj je Trgoskop? TRGOSKOP je orodje za pregled podatkov o sklenjenih poslih z nepremičninami, nepogrešljivo za investi
OSNOVNE INFORMACIJE O TRGOSKOPU Kaj je Trgoskop? TRGOSKOP je orodje za pregled podatkov o sklenjenih poslih z nepremičninami, nepogrešljivo za investitorje, cenilce, banke, zavarovalnice, nepremičninske
Prikaži večRAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni
RAM stroj Nataša Naglič 4. junij 2009 1 RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni trak, pomnilnik ter program. Bralni trak- zaporedje
Prikaži večOptimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije
Univerza v Ljubljani Fakulteta za matematiko in fiziko Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije 2. junij 2011 Koncept PSO Motivacija: vedenje organizmov v naravi Ideja: koordinirano
Prikaži večDiapozitiv 1
Računalništvo in informatika Program: Mehatronika dr. Hubert Fröhlich, univ. dipl. el. Podatkovne baze 2 Podatkovne baze Podatki osnova za odločanje in izvajanje akcij tiskana oblika elektronska oblika
Prikaži večPKP projekt SMART WaterNet_Opis
PKP projekt SMART WaterNet Po kreativni poti do znanja (PKP) opis programa Program Po kreativni poti do znanja omogoča povezovanje visokošolskih zavodov s trgom dela in tako daje možnost študentom za pridobitev
Prikaži večBrezplačno učenje zaposlenim in brezposelnim od 2018 do 2022 omogočata Ministrstvo za izobraževanje, znanost in šport ter Evropska unija iz Evropskega
ter Evropska unija iz Evropskega socialnega sklada Računalniška pismenost za odrasle 60 ur. - Seznaniti vas z osnovnimi komponentami računalnika in osnovnimi pojmi informacijske tehnologije. - Naučiti
Prikaži večStrojna oprema
Asistenta: Mira Trebar, Miha Moškon UIKTNT 2 Uvod v programiranje Začeti moramo razmišljati algoritmično sestaviti recept = napisati algoritem Algoritem za uporabo poljubnega okenskega programa. UIKTNT
Prikaži večUNIVERZA V MARIBORU FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO Leon Bošnjak VPLIV PODOBNOSTI NA USPEŠNOST KLASIFIKACIJE EVOLUCIJSKIH OD
UNIVERZA V MARIBORU FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO Leon Bošnjak VPLIV PODOBNOSTI NA USPEŠNOST KLASIFIKACIJE EVOLUCIJSKIH ODLOČITVENIH DREVES Magistrsko delo Maribor, junij 2014
Prikaži večPOTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u
POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo učbenik in delovni zvezek, ki sta obvezna učna pripomočka
Prikaži večUčinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v
Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar 2009 1 Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero velja 0 f(e) u(e) za e E(G). Za v V (G) definiramo presežek
Prikaži večVprašanja za 2. izpitno enoto poklicne mature Strokovni predmet NPA Vprašanja Visual C# (4. letnik) 1. Uporabniški vmesnik razvojnega okolja Visual C#
Vprašanja za 2. izpitno enoto poklicne mature Strokovni predmet NPA Vprašanja Visual C# (4. letnik) 1. Uporabniški vmesnik razvojnega okolja Visual C# Pomen posameznih oken uporabniškega vmesnika, urejevalnik
Prikaži večMicrosoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode]
Telekomunikacijski inženiring dr. Iztok Humar Vsebina Značilnosti TK prometa, preprosti modeli, uporaba Uvod Značilnosti telekomunikacijskega prometa Modeliranje vodovno komutiranih zvez Erlang B Erlang
Prikaži večMicrosoft Word - SI_vaja5.doc
Univerza v Ljubljani, Zdravstvena fakulteta Sanitarno inženirstvo Statistika Inštitut za biostatistiko in medicinsko informatiko Š.l. 2011/2012, 3. letnik (1. stopnja), Vaja 5 Naloge 1. del: t test za
Prikaži večSpletno raziskovanje
SPLETNO RAZISKOVANJE RM 2013/14 VRSTE SPLETNEGA RAZISKOVANJA RENKO, 2005 Spletne fokusne skupine Spletni eksperiment Spletno opazovanje Spletni poglobljeni intervjuji Spletna anketa 2 PREDNOSTI SPLETNIH
Prikaži večAvtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri
Univerza v Ljubljani Fakulteta za gradbeništvo in geodezijo 36. Goljevščkov spominski dan Modeliranje kroženja vode in spiranja hranil v porečju reke Pesnice Mateja Škerjanec 1 Tjaša Kanduč 2 David Kocman
Prikaži večUpravljanje sistema COBISS Navodila za uporabo tiskalnika CITIZEN S310II V1.0 VIF-NA-27-SI
Navodila za uporabo tiskalnika CITIZEN S310II V1.0 VIF-NA-27-SI IZUM, 2015 COBISS, COMARC, COBIB, COLIB, IZUM so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod... 1 2 Uporaba tiskalnika...
Prikaži večKomisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod
Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: ksz@mf.uni-lj.si T: +386 1 543 7700 Režim študija Predmet: Uvod v medicino, modul Informatika Študijski program: EMŠ
Prikaži večKazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij
Kazalo 1 DVOMESTNE RELACIJE 1 1.1 Operacije z dvomestnimi relacijami...................... 2 1.2 Predstavitev relacij............................... 3 1.3 Lastnosti relacij na dani množici (R X X)................
Prikaži večSlajd 1
REPUBLIKA SLOVENIJA MINISTRSTVO ZA JAVNO UPRAVO 1 EU ENOTNI DIGITALNI PORTAL: PRIHAJA NOVA EU UREDBA Alenka Žužek Nemec, Tina Kuliš DNEVI SLOVENSKE INFORMATIKE 18. april 2018 Ko podjetja ali državljani
Prikaži večSpoznajmo PowerPoint 2013
Spoznajmo PowerPoint 2013 13 Nova predstavitev Besedilo v predstavitvi Besedilo, ki se pojavlja v predstavitvah lahko premaknemo kamorkoli v diapozitivu. Kadar izdelamo diapozitiv z že ustvarjenimi okvirji
Prikaži večPoročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo
Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefonih. Obstaja precej različic, sam pa sem sestavil meni
Prikaži večMicrosoft PowerPoint - OAPS1- Uvod.ppt
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Igor Rožanc Osnove algoritmov in podatkovnih struktur I ( OAPS I ) 2. letnik VSP Računalništvo in informatika, vse smeri Študijsko leto 2006/07
Prikaži več3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja
3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja AV k = V k H k + h k+1,k v k+1 e T k = V kh k+1,k.
Prikaži večDocument ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov
ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov Gospodarski subjekti Definicija: V skladu z 2. členom Izvedbene uredbe Komisije (EU) 2018/574
Prikaži večglava.dvi
Lastnosti verjetnosti 1. Za dogodka A in B velja: P(A B) = P(A) + P(B) P(A B) 2. Za dogodke A, B in C velja: P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C) Kako lahko to pravilo posplošimo
Prikaži večVAJE RID 1 (4), program PTI, šol
VAJE INFORMATIKA, program PTI šol. leto 08/09 Za vsako vajo izdelajte kratka navodila oz. katere ukaze ste uporabili za izdelavo dokumenta. Vsak dokument stiskajte in ga vsatvite v delovno mapo. Pred izpitom
Prikaži večNAVODILA ZA IZPOLNJEVANJE ELEKTRONSKEGA OBRAZCA ZA PRIJAVO IN PREKLIC DIGITALNIH POTRDIL Verzija Datum Opis sprememb dokumenta dokumenta
NAVODILA ZA IZPOLNJEVANJE ELEKTRONSKEGA OBRAZCA ZA PRIJAVO IN PREKLIC DIGITALNIH POTRDIL Verzija Datum Opis sprememb dokumenta dokumenta 1.0 22.11.2013 Prva verzija dokumenta 1.1 15.04.2015 Dodana možnost
Prikaži večDSI 2019
SINERGIJA PROTOKOLA IPFS IN TEHNOLOGIJE VERIŽENJA BLOKOV Aida Kamišalić Latifić, Muhamed Turkanović, Blaž Podgorelec, Marjan Heričko TEHNOLOGIJA VERIŽENJA BLOKOV in IPFS Porazdeljena & decentralizirana
Prikaži večUNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Sašo Moškon Nomogramsko iskanje podprostorov neodvisnih atributov DIPLOMSKO DELO NA INT
UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Sašo Moškon Nomogramsko iskanje podprostorov neodvisnih atributov DIPLOMSKO DELO NA INTERDISCIPLINARNEM UNIVERZITETNEM ŠTUDIJU Mentor: akad.
Prikaži večINFORMATIKA TEČAJ ZA VIŠJEGA GASILCA
INFORMATIKA TEČAJ ZA VIŠJEGA GASILCA Damjan Munda, GČ, II.st. VSEBINA PREDMETA INFORMACIJSKI SISTEMI SISTEM OSEBNIH GESEL IN HIERARHIJA PRISTOJNOSTI GASILSKI INFORMACIJSKI SISTEM KAJ JE INFORMATIKA? Informatika
Prikaži večModel IEUBK za napoved vsebnosti svinca v krvi otrok in njegova uporaba na primeru Zgornje Mežiške doline
MODEL IEUBK ZA NAPOVED VSEBNOSTI SVINCA V KRVI OTROK IN NJEGOVA UPORABA NA PRIMERU ZGORNJE MEŢIŠKE DOLINE ZZV Ravne na Koroškem mag. Matej Ivartnik Portorož 25.11.2011 IEUBK model Računalniško orodje,
Prikaži večZadeva: Ponudba
Navodila za urejanje Spletne strani CTEK.si 1. Dodajanje novega polnilnika Za dodajanje novega polnilnika nikoli ne prepisujte že objavljenih vsebin, ampak sledite tem navodilom. Ta so zagotovilo, da bodo
Prikaži večUNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO ANALIZA PRIMERNOSTI UPORABE METOD PODATKOVNEGA RUDARJENJA ZA MODELIRANJE TVEGANJA PRI ZAVAROV
UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO ANALIZA PRIMERNOSTI UPORABE METOD PODATKOVNEGA RUDARJENJA ZA MODELIRANJE TVEGANJA PRI ZAVAROVANJU MOTORNIH VOZIL Ljubljana, september 2014 NATAŠA
Prikaži več08_03
OBVESTILO O RAZPISU ZA OBLIKOVANJE REZERVNEGA SEZNAMA Naziv delovnega mesta Funkcionalna skupina/razred AD 6 Vrsta pogodbe Sklic Rok za prijavo Kraj zaposlitve Veljavnost rezervnega seznama do Število
Prikaži večMicrosoft Word - P-5_specifikacije.doc
Obrazec P-5 Specifikacije 24K110316»Vzdrževanje centralne rešitve enaročanje«tehnične specifikacije KAZALO VSEBINE 1. Predmet javnega naročila...4 2. Opis...4 2.1 EČAKALNI SEZNAMI...5 2.2 ENAROČANJE...6
Prikaži večFGG14
Iterativne metode podprostorov Iterativne metode podprostorov uporabljamo za numerično reševanje linearnih sistemov ali računanje lastnih vrednosti problemov z velikimi razpršenimi matrikami, ki so prevelike,
Prikaži večPodatkovni model ER
Podatkovni model Entiteta- Razmerje Iztok Savnik, FAMNIT 2018/19 Pregled: Načrtovanje podatkovnih baz Konceptualno načtrovanje: (ER Model) Kaj so entite in razmerja v aplikacijskem okolju? Katere podatke
Prikaži večPowerPoint Presentation
ANALIZA SPREMEMB PRI UPORABNIŠKEM ZAVEDANJU O ZASEBNOSTI OB UPORABI DRUŽBENIH OMREŽIJ Lili Nemec Zlatolas DSI, 16.4.2019 Družbeno omrežje Facebook Dnevno uporablja omrežje 1, milijarde ljudi na svetu Slovenija
Prikaži večStrojno ucenje kemijskih reakcij proteinov v interakciji z RNA
Univerza v Ljubljani Fakulteta za računalništvo in informatiko Jernej Henigman Strojno učenje kemijskih reakcij proteinov v interakciji z RNA DIPLOMSKO DELO UNIVERZITETNI ŠTUDIJSKI PROGRAM PRVE STOPNJE
Prikaži večNEVTRIN d.o.o. Podjetje za razvoj elektronike, Podgorje 42a, 1241 Kamnik, Slovenia Telefon: Faks.: in
NEVTRIN d.o.o. Podjetje za razvoj elektronike, Podgorje 42a, 1241 Kamnik, Slovenia Telefon: +386 1 729 6 460 Faks.: +386 1 729 6 466 www.nevtrin.si info@elektrina.si USB RFID READER Navodila za uporabo?
Prikaži večNavodila za študente
Moodle UM Verzija 3.5.1 Navodila za študente RCUM, Služba za IS Maribor, 2019 Kazalo 1 Prijava v Moodle UM... 3 2 Odjava iz Moodla UM... 3 3 Seznam učnih enot... 4 4 Navigacijski trak... 4 5 Bloki... 5
Prikaži večNove različice programske opreme GE Podjetje GE Digital, vodilni svetovni proizvajalec programske opreme za področje avtomatike, je izdalo kar nekaj n
Nove različice programske opreme GE Podjetje GE Digital, vodilni svetovni proizvajalec programske opreme za področje avtomatike, je izdalo kar nekaj novosti na področju SCADA sistemov (ifix Productivity
Prikaži večVaje: Matrike 1. Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N 0 1 n ; n N Pokaži, da je množica x 0 y 0 x
Vaje: Matrike 1 Ugani rezultat, nato pa dokaži z indukcijo: (a) (b) [ ] n 1 1 ; n N n 1 1 0 1 ; n N 0 2 Pokaži, da je množica x 0 y 0 x y x + z ; x, y, z R y x z x vektorski podprostor v prostoru matrik
Prikaži večPodročje uporabe
Regulator Področja uporabe Regulator DIALOG EQ je namenjen predvsem vodenju in nadziranju sistemov ogrevanja in hlajenja, lahko pa se uporabi tudi na različnih področjih avtomatizacije in inteligentnih
Prikaži večDCS-2330L_A1_QIG_v1.00(EU).indd
HD WIRELESS N OUTDOOR CLOUD CAMERA DCS-2330L KRATKA NAVODILA ZA UPORABO VSEBINA PAKETA HD WIRELESS N OUTDOOR CLOUD CAMERA DCS-2330L NAPAJALNI ADAPTER ADAPTER ETHERNET KABEL (CAT5 UTP) MED POSTAVITVIJO,
Prikaži večUNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Andrej Grah Napovedovanje pozicij obrambnih igralcev z nevronskimi mrežami DIPLOMSKO DE
UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Andrej Grah Napovedovanje pozicij obrambnih igralcev z nevronskimi mrežami DIPLOMSKO DELO NA VISOKOŠOLSKEM STROKOVNEM ŠTUDIJU Mentor: doc.
Prikaži večOsnove matematicne analize 2018/19
Osnove matematične analize 2018/19 Neža Mramor Kosta Fakulteta za računalništvo in informatiko Univerza v Ljubljani Funkcija je predpis, ki vsakemu elementu x iz definicijskega območja D f R priredi natanko
Prikaži večMrežni modeli polimernih verig Boštjan Jenčič 22. maj 2013 Eden preprostejših opisov polimerne verige je mrežni model, kjer lahko posamezni segmenti p
Mrežni modeli polimernih verig Boštjan Jenčič. maj 013 Eden preprostejših opisov polimerne verige je mrežni model, kjer lahko posameni segmenti polimera asedejo golj ogljišča v kvadratni (ali kubični v
Prikaži večOblikovanje in razvijanje spletnih strani
Uporabniški vmesnik načrtovanje in izdelava Interaktivni mediji Doc. dr. Aleš Hladnik Načrtovanje uporabniškega vmesnika (UV) Načrtovanje oz. zasnova UV (User( interface design or engineering) je načrtovanje
Prikaži večMicrosoft Word - vprasalnik_AZU2007.doc
REPUBLIKA SLOVENIJA Anketa o zadovoljstvu uporabnikov statističnih podatkov in informacij Statističnega urada RS 1. Kako pogosto ste v zadnjem letu uporabljali statistične podatke in informacije SURS-a?
Prikaži večIme in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be
Ime in priimek: Vpisna št: FAKULEA ZA MAEMAIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6 julij 2018 Navodila Pazljivo preberite besedilo naloge, preden se lotite reševanja Za pozitiven rezultat
Prikaži večOSNOVE UMETNE INTELIGENCE
OSOVE UMETE ITELIGECE 07/8 regresijsa drevesa ocenjevanje učenja linearni modeli - Zoran Bosnić del gradiva povzet po: Brato: Prolog programming for AI, Pearson (0) in Russell, orvig: AI: A Modern Approach,
Prikaži večNavodila za uporabo Mini snemalnik
Navodila za uporabo Mini snemalnik www.spyshop.eu Pred vami so navodila za pravilno uporabo mini snemalnika in opis funkcionalnosti. Lastnosti snemalnika: Naziv Mere Teža Kapaciteta spomina Snemanje Format
Prikaži večUPRAVLJANJE RAZPRŠENIH PODATKOV Shranjevanje, zaščita in vzdrževanje informacij, ki jih najbolj potrebujete
UPRAVLJANJE RAZPRŠENIH PODATKOV Shranjevanje, zaščita in vzdrževanje informacij, ki jih najbolj potrebujete ELEKTRONSKI PODATKI, KI JIH ORGANIZACIJA USTVARJA IN POTREBUJE ZA DOSTOP, SE KAŽEJO V RAZLIČNIH
Prikaži več