E-nepremična inženirska zakladnica

Podobni dokumenti
PKP projekt SMART WaterNet_Opis

Microsoft Word - A-3-Dezelak-SLO.doc

Univerza v Mariboru Fakulteta za naravoslovje in matematiko Oddelek za matematiko in računalništvo Enopredmetna matematika IZPIT IZ VERJETNOSTI IN STA

%

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

Gradbeništvo kot Industrija 4.0

Slide 1

1. IDENTIFIKACIJA PODATKOVNEGA NIZA 1.1 Naslov Strukturno-tektonska karta Slovenije 1: Alternativni naslov Strukturno-tektonska karta Slove

Microsoft Word - M docx

PowerPoint-Präsentation

Microsoft Word - CNC obdelava kazalo vsebine.doc

OSNOVE UMETNE INTELIGENCE

Microsoft PowerPoint - cigre_c2_15.ppt [Compatibility Mode]

Microsoft Word - M doc

Microsoft Word - WP5 D15b infopackage supplement public buildings Slovenia.doc

Poročilo projekta : Učinkovita raba energije Primerjava klasične sončne elektrarne z sončno elektrarno ki sledi soncu. Cilj projekta: Cilj našega proj

UNIVERZA V MARIBORU FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO Leon Bošnjak VPLIV PODOBNOSTI NA USPEŠNOST KLASIFIKACIJE EVOLUCIJSKIH OD

Macoma katalog copy

Delavnica Načrtovanje digitalnih vezij

Microsoft PowerPoint - MK 3 tehnicni sistemi.ppt

Microsoft PowerPoint - MK 3 tehnicni sistemi.ppt

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO ANALIZA PRIMERNOSTI UPORABE METOD PODATKOVNEGA RUDARJENJA ZA MODELIRANJE TVEGANJA PRI ZAVAROV

Univerza v Ljubljani Fakulteta za računalništvo in informatiko David Možina Argumentirano strojno učenje z uporabo logistične regresije MAGISTRSKO DEL

FGG13

Podatkovni model ER

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA

PowerPoint Presentation

II-RIS-Primer Seminarske Naloge Redni-LJ

PRILOGA 3 TRAJNOSTNA URBANA STRATEGIJA MES 2030

Microsoft PowerPoint - 07-bostjan_tavcar.ppt

Avtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

Termin in lokacija izvedbe Naslov delavnice Ciljna skupina Cilji in/ali kratek opis Izvajalec Kontaktni e-naslov 6. oktober 2018 Gimnazija Franceta Pr

INDUSTRIJA 4.0: PRILOŽNOSTI DIGITALNE PREOBRAZBE PROCESA RAZVOJA BARV IN PREMAZOV TOMAŽ KERN, BENJAMIN URH, MARJAN SENEGAČNIK, EVA KRHAČ

Chapter 1

Oblikovanje in razvijanje spletnih strani

Microsoft PowerPoint - Pedstavitev igre Prometna kača [Združljivostni način]

ŠOLSKI CENTER NOVO MESTO Šegova ulica 112, 8000 Novo mesto Višja strokovna šola Datum: Razpis za imenovanje predavateljev Zadeva: Razpis za

Microsoft Word - 13-Selekcijski intervju.docx

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

DODATEK_F8

Ko je izbira ovira v napredovanju Silva Novljan

MODEL PRIMERNOSTI OBMOČIJ ZA POVEZOVANJE

Na podlagi 65. člena Zakona o urejanju prostora (Uradni list RS, št. 61/17; ZUreP-2) izdaja minister za okolje in prostor P R A V I L N I K o elaborat

Microsoft PowerPoint - MSPO_4_DiagramiVpliva.pptx

PROJECT OVERVIEW page 1

Microsoft Word - magistrska naloga Miha Kronovšek.docx

Microsoft PowerPoint - 9_Xella.pptx

Event name or presentation title

Postopek poracuna 2007 za JU

Datum in kraj

Diapozitiv 1

Opozorilo: Neuradno prečiščeno besedilo predpisa predstavlja zgolj informativni delovni pripomoček, glede katerega organ ne jamči odškodninsko ali kak

Microsoft Word - SI_vaja5.doc

Orodje za izvoz podatkov

Microsoft Word - PRzjn-2.doc

(Microsoft Word - 3. Pogre\232ki in negotovost-c.doc)

Ime Priimek

PRILOGA II Obrazec II-A Vloga za pridobitev statusa kvalificiranega proizvajalca elektri ne energije iz obnovljivih virov energije 1.0 Splošni podatki

Mere kompleksnih mrež (angl. Network Statistics) - Seminarska naloga pri predmetu Izbrana poglavja iz diskretne matematike

DNEVNIK

N E O B V E Z N I I Z B I R N I P R E D M E T I O s n o v n a š o l a P o l z e l a P o l z e l a, a p r i l

predstavitev fakultete za matematiko 2017 A

(Microsoft PowerPoint _IZS_izobraevanje ZK_1_del.ppt [Zdru\236ljivostni na\350in])

Navodila Trgovina iCenter

EVROPSKA KOMISIJA Bruselj, C(2018) 7597 final IZVEDBENA UREDBA KOMISIJE (EU) / z dne o vzpostavitvi začasnega neposrednega stati

Informatika v službi učinkovite rabe energije DSI; ; Portorož mag. Tatjana M. Zupan mag. Bogomil Kandus

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 31. avgust 2018 Navodila Pazljivo preberite

3. Metode, ki temeljijo na minimalnem ostanku Denimo, da smo z Arnoldijevim algoritmom zgenerirali ON bazo podprostora Krilova K k (A, r 0 ) in velja

P r e d m e t n i k Seznam skupnih izbirnih predmetov v študijskem programu Izbirni predmeti Zap. št. Predmet Nosilec Kontaktne ure Klinične Pred. Sem

ENERGETSKO UPRAVLJANJE STAVB

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Univerza v Ljubljani Fakulteta za elektrotehniko PREDSTAVITVENI ZBORNIK MAGISTRSKEGA ŠTUDIJSKEGA PROGRAMA II. STOPNJE ELEKTROTEHNIKA NA FAKULTETI ZA E

Osnovna šola Hinka Smrekarja Gorazdova 16, Ljubljana NEOBVEZNI IZBIRNI PREDMETI ZA UČENCE 4. RAZREDA ŠOL. LETO 2018/2019 Ljubljana, april 2018

Microsoft Word - RAZISKAVA_II._del.doc

resitve.dvi

SLO wintherwax

PREGLED FOTOVOLTAIČNEGA TRGA V SLOVENIJI preliminarno poročilo za leto 2013 Podatki o fotovoltaičnem trgu v Sloveniji so zbrani iz javno dostopnih pod

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

COBISS3/Medknjižnična izposoja

POROČILO

Osnove statistike v fizični geografiji 2

Microsoft Word - 10-Selekcijski intervju _4.del_.docx

PODATKI O VLOŽNIKU prostor za potrditev prejema (ime in priimek oz. naziv pravne osebe) (naselje, ulica in hišna številka) (poštna številka in pošta)

PowerPoint Presentation

Microsoft Word - 25_LPK_E_PE_L2011.doc

Microsoft Word - SRS A.doc

Uvodno predavanje

AAA

MERE SREDNJE VREDNOSTI

Osnovna šola Davorina Jenka Cerklje na Gorenjskem NEOBVEZNI IZBIRNI PREDMETI v šolskem letu 2015/16 april 2015

OPOMNIK

PowerPoint Presentation

Analiza vpliva materiala, maziva in aktuatorja na dinamiko pnevmatičnega ventila

UPRAVLJANJE RAZPRŠENIH PODATKOV Shranjevanje, zaščita in vzdrževanje informacij, ki jih najbolj potrebujete

PowerPoint Presentation

PowerPointova predstavitev

Transkripcija:

Smetanova ulica 17 2000 Maribor, Slovenija E-NEPREMIČNA INŽENIRSKA ZAKLADNICA - TEHNIŠKE FAKULTETE Naročnik: Energetika Maribor d.o.o. Vodja projekta: Daniela Dvornik Perhavec Fakultete za gradbeništvo, prometno inženirstvo in arhitekturo Prof. dr. Miroslav Premrov, dekan Maribor, 1. oktobra 2015

Vsebina 1. UVOD 3 2. METODA DELA 3 2.1. Odkrivanje znanja v podatkih (Knowledge Discovery from Data) in podatkovno rudarjenje (Data Mining) 4 2.2. Podatkovne baza objektov Tehniških Fakultet 6 2.3. Poraba toplotne energije 7 3. PODATKOVNO RUDARJENJE S POMOČJO ODLOČITVENIH DREVES - OBJEKTA J1 IN J2 9 3.1. Gradnja odločitvenih dreves 9 3.2. Izbira oz. vzorčenje podatkov 10 3.3. Čiščenje oz. predobdelava podatkov 10 3.4. Transformacijo oz. redukcijo 11 3.5. Podatkovno rudarjenje 11 3.6. Cenitev in predstavitev rezultatov 14 4. PODATKOVNO RUDARJENJE PO ELEMENTIH KARAKTERISTIČNIH ZNAČILNOSTI ZGRADB Z RAZDELJENO PORABO TOPLOTNE ENERGIJE - VSI OBJEKTI 14 5. ZAKLJUČEK 17 6. SKLEP 18 2

1. UVOD V skladu z Dogovorom o sodelovanju 1/2013-2016-DDP pri razvojno raziskovalnem projektu»e-nepremična inženirska zakladnica«sklop Tehniške fakultete Univerze v Mariboru smo za ciljno določene objekte opravili raziskovalni in razvojni del z namenom povezovanja vsebin interdisciplinarne narave in sicer karakteristične podatke zgradbe in porabe toplotne energije z uporabo metod umetne inteligence. Sklop Tehniških Fakultet Univerze v Mariboru obsega 11 med seboj povezanih gradbenih objektov, grajenih v obdobju 1964-2006. Delo je bilo zastavljeno na način razvijanja modela s katerim smo opisali v tem obdobju dosegljive karakteristične značilnosti obstoječih objektov ter istočasno skušali vzpostaviti korelacijo med karakterističnimi značilnostmi objekta ter porabo toplotne energije. Za čas trajanja projekta, od leta 2013 do 2015 smo izdelali delna poročila, v katerih smo naročnika seznanjali z opravljenim raziskovalnim delom. Največje ovire, na katere smo naleteli pri raziskovalnem delu, so bile naslednje: - neobstoj podatkovnih baz - neustrezno arhivirani projekti iz katerih bi lahko pridobili karakteristične podatke o zgradbah - poraba toplotne energije po posameznih sklopih objektov in ne ločeno za posamezne objekte. 2. METODA DELA Pri delu smo uporabili analitične metode, kot so analiza projektov, analiza literature, raziskava področja umetne inteligence s poudarkom na odkrivanju znanja v podatkih (Knowledge Discovery from Data) in podatkovnem rudarjenju (Data Mining) ter analizo podatkov porabe toplotne energije. Podatkovno rudarjenje smo opravili z uporabo orodja Weka (akronim za: Waikato Environment for Knowledge Analysis), ki so ga zasnovali in razvili na Univerzi Waikato na Novi Zelandiji. 3

2.1. Odkrivanje znanja v podatkih (Knowledge Discovery from Data) in podatkovno rudarjenje (Data Mining) Metode pridobivanje znanja iz podatkov in podatkovno rudarjenje spadata v t.i. področje racionalne inteligence. Odkrivanje znanja v podatkih (KDD) je netrivialni proces za odkrivanja asociacij, sprememb, anomalij, dogodkov, potencialnih uporabnih in navsezadnje razumljivih vzorcev iz podatkov, ki predstavljajo implicitne, prvotno nepoznane zakonitosti ali informacije v danih podatkih (Witten & Frank, 2005) UMETNA INTELIGENCA (področja) vizualna inteligenca (prepoznavanje oblik, obrazov, prstnih odtisov,...) govorna inteligenca (prepoznavanje govora, sinteza govora,... ) manipulativna inteligenca (nadzor gibanja robotske roke, nadzor nožnih mehanizmov,... ) racionalna inteligenca (ekspertni sistemi, podatkovne baze,...) Inteligentni roboti - prepoznavajo predmete, se gibajo v prostoru Računalniški vid - sistemi, ki računalnikom omogočajo videti objekte Procesiranje naravnega jezika - prepoznavanje govora, prevajanje iz enega jezika v drugega, pisanje besedila na osnovi govora. Strojno učenje - stroji, ki imajo sposobnost učenja Nevronske mreže - najbolj znani stroji, ki se lahko učijo, izdelani po vzoru naših možganov Metode KDD in DM - KDD = pridobivanje znanja iz podatkov (knowledge discovery in databases); DM = rudarjenje po podatkih (data mining) Ekspertni sistemi - sistemi za pomoč pri odločanju SLIKA -1: PODROČJA IN PODPODROČJA UMETNE INTELIGENCE Definicijo podatkovnega rudarjenja sta postavila Han in Kamber leta 2001 (2000), in sicer»podatkovno rudarjenje je proces odkrivanja zanimivih in pomembnih vzorcev ter znanja iz ogromne količine podatkov, shranjenih v podatkovnih bazah, podatkovnih skladiščih in ostalih informacijskih odlagališčih s koriščenjem metod strojnega učenja«(han & Kamber, 2001). Odkrivanje znanja iz podatkov (KDD) je proces in vsebuje devet (9) korakov, in sicer: 1. Razumevanje uporabe področja za odkrivanje znanja bazah. 2. Ustvarjanje in oblikovanje nabora ciljnih podatkov. 3. Čiščenje podatkov in pred obdelava podatkov; zbrati je potrebne informacije za model, odločiti o strategijah za obravnavo manjkajočih podatkov in podobno. 4. Izbiranje podatkov v odvisnosti od namena naloge. 5. Izbira funkcij podatkovnega rudarjenja. 6. Modeliranje in raziskovalna analiza - izbira algoritmov, izbira metode ali metod, ki se uporabljajo pri iskanju vzorcev podatkov. 4

7. Podatkovno rudarjenje (Data Mining) je sedmi korak v postopku KDD je v bistvu iskanje vzorcev v določenih reprezentativnih oblikah ali nizu teh reprezentacij, 8. Tolmačenje in pojasnjevanje rezultatov z možnostjo vrnitve za nekaj korakov nazaj ali od koraka 1 do 7 z dodatnimi ponovitvami. Ta korak lahko vključuje tudi vizualizacijo. 9. Uporaba in predstavitev odkritega znanja ter predstavitev uporabe znanja in vključevanja poznavanja v drug sistem za nadaljnje ukrepanje zainteresiranim stranem oz. končnemu uporabniku. Proces podatkovnega rudarjenja (DM) izvajamo po naslednji shemi: SLIKA -2: PROCES PODATKOVNEGA RUDARJENJA Podatkovno rudarjenje praviloma izkorišča metode s področja inteligentnih sistemov, strojnega učenja in razpoznavanja vzorcev, ki omogoča, da se odkriva implicitno, prej nepoznano in potencialno koristno znanje. Na primer napovedovanje nečesa na podlagi množice dejstev o tem, zbranih v preteklosti. Gre za odkrivanje vzorcev v podatkih z avtomatiziranim ali polavtomatiziranim načinom. Strojno učenje je v bistvu»trening«in gre za učenje brez razmišljanja. Najpogosteje se uporabljajo naslednje metode podatkovnega rudarjenja, in sicer: - Odločitvena drevesa, - Asociacijska pravila (povezovalna pravila), - Metoda podpornih vektorjev, - Evolucijski algoritmi. 5

2.2. Podatkovne baza objektov Tehniških Fakultet Podatkovno bazo smo oblikovali na podlagi načrtov, arhiviranih v prostorih Tehniških fakultet, saj v letu 2013, ko smo pričeli z raziskovalno nalogo baze ni bilo. Za izdelavo podatkovne baze je bilo potrebno poiskati gradbene načrte obstoječih objektov, kar je predstavljalo večjo oviro kot smo jo pred pričetkom raziskave sploh lahko pričakovali. V prvi fazi smo s karakterističnimi značilnostmi zgradbe kot gradbenega objekta opisali objekta J1 in J2. Kasneje smo dodali osnovne karakteristične značilnosti še za ostale objekte. SLIKA 3: PODATKI V SKLADU Z ARHITEKTURNO ZASNOVO IN TIPOLOGIJO TABULA 6

SLIKA 4: PODATKI O OVOJU ZGRADBE 2.3. Poraba toplotne energije Podatke o porabi toplotne energije objektov na območju Tehniških Fakultet za obdobje 2012 do tekočega meseca avgusta 2015 smo pridobili od dobavitelja ELTEC Petrol d.o.o. Podatki so prikazani po posamezni toplotni podpostaji tabelarično in grafično z navedbo objektov porabe toplotne energije posamezne toplotne podpostaje. Toplotna podpostaja TOP 809: TABELA 1: KOLIČINA TOPLOTNE ENERGIJE TOPLOTNE PODPOSTAJE TOP 809 Št. Šifra toplotne postaje Odjemno mesto obstoječa / nova (toplotna postaja) Naziv članice Univerze v Mariboru Obračunska moč (v KW) količina (v MWh) Januar Februar Marec April Maj Oktober November December 3. TOP809 TF - J1 nova Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor 560 2012 103,76 113,20 61,43 35,45 0,55 41,67 53,60 74,16 2013 101,58 84,18 70,88 21,14 0,00 17,15 48,79 75,26 2014 66,45 62,78 36,38 17,43 0,00 16,84 36,91 75,79 2015 77,24 71,87 50,38 26,39 1,47 7

120,00 Poraba toplotne enrgije TOP 809 objekta J1 in J2 (vmwh) 100,00 80,00 60,00 40,00 20,00 0,00 Januar Februar Marec April Maj Oktober November December 2012 2013 2014 2015 SLIKA 5: GRAFIČNI PRIKAZ PORABE TOPLOTNE ENERGIJE V TOP 809 PO LETIH IN MESECIH Toplotna podpostaja TOP 808: TABELA 2: KOLIČINA TOPLOTNE ENERGIJE TOPLOTNE PODPOSTAJE TOP 808 Št. Šifra toplotne postaje Odjemno mesto obstoječa / nova (toplotna Naziv članice Univerze v Mariboru Obračunska moč (v KW) količina (v MWh) Januar Februar Marec April Maj Oktober November December 2. TOP808 TF - B nova Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor 830 2012 146,94 159,50 82,51 49,72 0,54 49,75 81,75 114,82 2013 153,32 128,38 107,82 33,22 0,00 22,81 79,19 115,95 2014 99,12 91,80 50,12 20,88 0,00 23,56 64,63 139,05 2015 142,48 132,80 98,57 51,79 2,41 Poraba toplotne energije TOP 808 objekti A, B in C (v MWh) 180,00 160,00 140,00 120,00 100,00 80,00 60,00 40,00 20,00 0,00 Januar Februar Marec April Maj Oktober November 2012 2013 2014 2015 SLIKA 6: GRAFIČNI PRIKAZ PORABE TOPLOTNE ENERGIJE V TOP 808 PO LETIH IN MESECIH Toplotna podpostaja TOP 807: TABELA 3: KOLIČINA TOPLOTNE ENERGIJE TOPLOTNE PODPOSTAJE TOP 807 Št. Šifra toplotne postaje Odjemno mesto obstoječa / nova (toplotna postaja) Naziv članice Univerze v Mariboru Obračunska moč (v KW) količina (v MWh) Januar Februar Marec April Maj Oktober November December 1. TOP807 FERI obstoječa Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor 1.690 2012 272,10 314,60 169,30 106,10 11,50 90,00 180,10 253,30 2013 372,20 289,60 255,60 88,90 0,20 109,50 200,30 276,40 2014 242,70 234,60 155,00 21,00 0,00 51,10 136,00 237,10 2015 256,20 242,50 180,60 100,50 10,50 8

400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 Poraba toplotne energije TOP 807 objekti D1, D2, E, F, G1, G2 in H (v MWh) Januar Februar Marec April Maj Oktober November December 2012 2013 2014 2015 SLIKA 7: GRAFIČNI PRIKAZ PORABE TOPLOTNE ENERGIJE V TOP 807 PO LETIH IN MESECIH 3. PODATKOVNO RUDARJENJE S POMOČJO ODLOČITVENIH DREVES - OBJEKTA J1 IN J2 Z metodami umetne inteligence, kot sta metoda pridobivanja znanja iz podatkov (KDD) in metoda podatkovnega rudarjenja (DM), smo preverili možnost odkrivanja novih znanj in uporabnost le-teh pri ciljno usmerjenem modelu. 3.1. Gradnja odločitvenih dreves Iz celotne pripravljene učne množice (informacijske tabele razvidne iz slike 8) oblikujemo odločitveno drevo. SLIKA 8: INFORMACIJSKA TABELA UČNE MNOŽICE 9

Lastnosti učne množice so opisane z množico atributov (lastnostmi) in izidom (razredom, odločitvijo). Medtem ko so opisni atributi lahko zvezni ali diskretni, je odločitveni atribut samo diskretni. 3.2. Izbira oz. vzorčenje podatkov Vzorčenje podatkov (izbira reprezentativnih vzorcev) običajno poteka zaradi enormnih velikosti podatkovnih baz, ki jih praktično ni mogoče obdelati v celoti. V primeru, ki ga obravnavamo tega problema nimamo, saj smo v tem projektu šele pričeli z gradnjo podatkovnih baz. Uporabimo v celoti zapisano podatkovno bazo iz poglavja 2.2. Istočasno smo bazo dopolnili še z letno porabo toplotne energije za leto 2012-2014. SLIKA 9: VZORCI PODATKOVNE BAZE 3.3. Čiščenje oz. predobdelava podatkov Podatke je potrebno pripraviti za obdelavo z algoritmom za podatkovno rudarjenje, ki obsega brisanje ali zamenjavo neustreznih podatkov in pretvorbo podatkov v primeren format. Podatkovne baze iz poglavja, 2.2. smo zapisali v zapis strukturnega vzorca. Vzorci so opisani s karakterističnimi lastnostmi, ki jih imenujemo atributi (a1,.., an) in razrednim atributom ali razredom klasifikacije (c ). Atributi so lahko diskretni ali zvezni. V kolikor imamo opravka z zveznimi atributi je potrebno opraviti diskretizacijo z eno izmed metod diskretizacije. 10

Vrednosti podane v tabelah 1, 2, in 3 smo preoblikovali v diskretne zapise. Vzorci podatkovne baze so razvidni iz slike 9. Vsak vzorec (vrstica v tabeli) je opisan z atributi in oznako c (razredni atribut), ki pove pripadajoč razred. Klasifikacijski razred je sestavljen iz oznake objekta. Množico vzorcev smo preoblikovali v format arff, ki je primerna za obdelavo z algoritmi. 3.4. Transformacijo oz. redukcijo Za končni rezultat v mnogih primerih niso potrebni vsi atributi posameznega vzorca, temveč lahko kakšnega spustimo ali pa v drugem primeru dodamo. To opravimo v fazi transformacije oz. redukcije. 3.5. Podatkovno rudarjenje Podatkovno rudarjenje se nanaša na uporabo izbranega algoritma podatkovnega rudarjenja nad izbranimi podatki. Za podatkovno rudarjenje smo uporabili orodje Weka (akronim za: Waikato Environment for Knowledge Analysis), ki so ga zasnovali in razvili na Univerzi Waikato na Novi Zelandiji. SLIKA 10: ORODJE WEKA Weka je bila napisana v Java programskem jeziku in deluje na skoraj vseh platformah. Weka je sicer zbirka orodij in algoritmov s katerimi analiziramo podatke in modeliramo napovedovanje. Zasnovana je tako, da omogoča hitro in fleksibilno preizkušanje na novih podatkovnih nizih in zagotavlja celotno podporo za proces podatkovnega rudarjenja, vključno s pripravo podatkov in vizualizacijo. Vsi algoritmi v Weki berejo vhodne podatke v isti obliki, v datoteki tipa ARFF (attribute relation File Format). 11

Programsko orodje Weka vsebuje vse učne algoritme, ki jih lahko porabimo na naši učni množici. Vsebuje vse standardne metode podatkovnega rudarjenja kot so klasifikacija, regresija, gručenje podatkov,.asociativnost pravil in izbiro atributov. Iz histograma porazdelitve vzorcev atributov in klasifikacijskega razreda opazimo, da naš model po vsej verjetnosti ne bo prinesel zadovoljivih rezultatov, saj smo kombinirali statične (podatke o zgradbi) in dinamične (podatki o porabi toplotne energije) podatkovne baze. Prav tako smo izdelali model v katerem je zadovoljivo število atributov in premalo podatkovnih vzorcev (le za 2 objekta). SLIKA 11: SKUPEK HISTOGRAMOV GLEDE NA VZORCE IN POSAMEZNE PARAMETRE Če želimo preverit možnost pravilnosti učenja učno množico nato razdelimo na učno in testno množico. Razdelitev, 2/3 : 1/3 je standardna, ki smo jo tudi uporabili. Algoritem za učenje ima dostop samo do učne množice s katero mora ustvariti hipotezo. Tesna množica se uporabi v namen testiranja kakovosti dobljene hipoteze in podaja predvideno natančnost za nevidne vzorce. Cilj je, da krovno vozlišče učinkovito loči podatke tako, da bo drevo čim manjše. 12

Najboljša je tista delitev, ki nam da največjo informacijsko pridobitev. Informacija ima matematični pomen, ki je povezan z gotovostjo pri odločanju. SLIKA 12: PROCES INDUKCIJE SLIKA 13: REZULTATI INDUKCIJE 13

3.6. Cenitev in predstavitev rezultatov Rezultate, kot posledice klasifikacije je v zaključni fazi potrebno ovrednotiti. S tem se ugotovi dejanska kakovost dobljenih rezultatov in posredno, kakovost uporabljenih algoritmov. Kot smo predvidevali je natančnost vzorca 23%, kar smo pričakovali glede na statične in dinamične podatkovne baze in premalo število vzorcev. 4. PODATKOVNO RUDARJENJE PO ELEMENTIH KARAKTERISTIČNIH ZNAČILNOSTI ZGRADB Z RAZDELJENO PORABO TOPLOTNE ENERGIJE - VSI OBJEKTI Prej omenjeni postopek smo ponovili s tem, da smo za objekte Tehniških fakultet razdelili porabo toplotne energije za leto 2014 glede na delež skupne tlorisne površine posameznega objekta. Podatkov o porabi toplotne energije za posamezni objekt namreč ni na razpolago. V odvisnosti od porabe toplotne energije na m 2 površine smo določili energetske razrede v skladu s Pravilnikom o metodologiji izdelave in izdaje energetskih izkaznic stavb (Ur. list RS 92/2014). TABELA 4: MNOŽICA VZORCEV TipFasade Povrsina Volumen FasadaSe ver OknaSe ver FasadaJu g OknaJug FasadaVz hod OknaVzh od FasadaZa hod OknaZah od LetoGrad nje Objekt fasadna opeka 496,64 10218,35 623,07 379,44 623,07 368,72 0 0 339,48 41,4 1983 J1 fasadna opeka 633,92 13122,14 585,81 280,08 585,81 345,44 463,68 0 0 0 1986 J2 teranova 798,06 13814,45 979,05 276 979,05 598,5 81,42 0 0 26,7 1964 A teranova 851,243 14735,02 814,09 306,18 814,09 291,41 104,44 8,645 104,44 47,25 1964 B teranova 577,88 4727,1 164,33 10 0 0 226,18 103,25 226,18 127,19 1964 C ne 798,06 3295,99 233,59 31,36 233,59 39,2 19,42 0 0 7,875 1980 A+ ne 851,243 4145,55 229,04 29,4 229,04 23,52 29,38 0 29,38 0 1980 B+ fasadna opeka 606 10362,58 625 362,34 625 374,82 0 0 0 0 1969 D1 fasadna opeka 207,25 3543,97 213,75 141,856 213,75 139,276 283,52 60,78 0 0 1990 D2 teranova 2000,5 11294,1 193,79 103,11 0 0 65,74 7,04 0 0 1969 E teranova 645,17 5445,24 0 0 0 0 169,48 113,875 0 77,875 1969 F teranova 501,75 8710,38 195,3 186,774 390,6 239,91 0 0 0 0 1981 G1 teranova 385,86 5012,4 198,75 111,01 198,75 198,75 0 0 0 0 2006 G1+ fasadna opeka 542,66 5030,49 0 0 0 0 0 0 0 1982 H Vrednosti v tabeli 4 smo preoblikovali v diskretne zapise kot je razvidno v tabeli 5. 14

TABELA 5: DISKRETIZACIJA PODATKOV Celotna Razred oznaka Poraba Razred Diskretiza ogrevalna površina Odstotek površine diskretizac ije Poraba 2014MWh 2014KWh na m 2 površine diskretizacij e cijska oznaka 1 2483,2 44 41-50 e 137,54 55,38821 35-60 C 3169,6 56 51-60 f 175,06 55,23094 35-60 C 3192,24 34 31-40 d 166,31 52,09821 35-60 C 3404,972 36 31-40 d 176,1 51,71849 35-60 C 1155,76 12 11-20 b 58,71 50,79774 35-60 C 798,06 9 0-10 a 44,02 55,15876 35-60 C 851,243 9 0-10 a 44,02 51,71261 35-60 C 3030 24 21-30 c 258,6 85,34653 60-105 D 1036,25 8 0-10 a 86,2 83,18456 60-105 D 2000,5 16 21-30 c 172,4 86,17846 60-105 D 1290,34 10 11-20 b 107,75 83,50512 60-105 D 2508,75 19 11-20 b 204,72 81,60239 60-105 D 1929,3 15 0-10 a 161,63 83,7765 60-105 D 1085,32 8 0-10 a 86,2 79,42358 60-105 D SLIKA 14: SKUPEK HISTOGRAMOV GLEDE NA VZORCE IN POSAMEZNE ATRIBUTE 1 Oznaka ustreza oznakam energetskih razredov 15

Po opravljenem učenju smo dobili rezultate indukcije kot je razvidno iz slike 15. SLIKA 15: DEL INDUKCIJSKE MATRIKE SLIKA 16: REZULTATI KLASIFIKACIJE 16

Kvaliteto klasifikatorja najpogosteje merimo na osnovi nekaterih indikatorjev, kot so: Natančnost verjetnost pravilne klasifikacije vzorca Senzitivnost in specifičnost Grafični prikaz pravilno klasificiranih pozitivnih vzorcev proti napačno klasificiranim pozitivnim vzorcem za družino klasifikatorjev (ROC krivulja) Različne metode za delitev baze podatkov na učno in testno množico. Rezultati po opravljeni klasifikaciji so boljši, in sicer 42% natančnost vzorca, kar je ponovno pričakovan rezultat glede na omejeno število vzorcev. SLIKA 17: ODLOČITVENO DREVO PO OPRAVLJENI INDUKCIJI 5. ZAKLJUČEK Iskanje korelacij med vsebinsko različnimi zadevami je s pomočjo metod umetne inteligence enostavneje in učinkovitejše če imamo podlago v obširnih bazah. Zaradi tega, ker smo se lotili izdelave baz karakterističnih značilnosti zgradb, ki jih do sedaj ni bilo, je rezultat pričakovan in po eni strani vseeno presenetljiv. Največji informacijski prirastek predstavlja tip fasade, ter nadalje volumen objekta in poraba toplotne energije. Dobljeni rezultati kažejo, da največjo porabo toplotne energije beležijo objekti D1, D2. E, F, G1, G2 in H, vendar je potrebno nadalje in natančneje raziskati najprej same objekte, sestaviti bazo karakterističnih značilnosti objektov in ponovno zmodelirati. Izdelava baze karakterističnih značilnosti objektov grajenih med 1964 in 2006 še ne izdelujemo (pričeli smo pri stanovanjskih objektih grajenih v obdobju vladavine avstroogrske). V nadaljevanju je potrebna tipizacija objektov in dograjevanje baze. 17

Osnova za dograjevanje predstavljajo arhivirani projekti kot tudi vso gradivo nanašajoč bodisi se na materiale grajenja, predpise, zakone in podobno. Predvidevamo (ob pridobitvi finančnih sredstev za raziskovalni del in ustrezni podpori vodstva Fakultete in deležnikov iz okolja), da bi v nekaj letih lahko operirali že z dokaj obširno bazo karakterističnih značilnosti obstoječih objektov, katera bi služila kot podlaga za nadaljnje modeliranje z interdisciplinarnim značajem. Na osnovi uporabe umetne inteligence pridemo do novo odkritega znanja. Slednje pride v poštev predvsem takrat: - kadar imamo veliko podatkov in ne moremo uporabiti fizikalnih modelov zaradi sinergijskih učinkov različnih vplivov, ki povzročajo kompleksne nelinearne povezave med vhodnimi in izhodnimi parametri pojava - kadar je mogoče pripraviti obširno in reprezentativno bazo podatkov, ki pojav opisuje. - kadar se lahko rešitev problema s časom spreminja znotraj meja vhodnih in izhodnih parametrov (zaradi izboljšanja in dopolnitve baze podatkov, natančnosti meritev, ipd) - kadar so izhodni parametri ne numerični (mehke spremenljivke ) ali diskretna funkcija. 6. SKLEP Zahvaljujemo se podjetju Energetika Maribor d.o.o. za zaupanje in izkazan interes za pričetek razvoja podatkovnih baz karakteristik obstoječih objektov. Neodvisno od raziskovalno razvojnega projekta smo pričeli z raziskovanjem zgradb grajenih v obdobju 1857-1948, vendar smo z modeliranjem na objektih Tehniških fakultet lahko pokazali, da bomo za popolnejše in zanesljivejše baze potrebovali več časa ter dolgoročno finančno podporo. Rezultate raziskovanja in sestavljanja podatkovnih baz za objekte grajene v obdobju 1857-1948 smo predstavili na mednarodni konferenci v Napoliju (članek v prilogi), rezultate modeliranja s podatkovnimi bazami»tehniških fakultet«pa bomo na podlagi sprejetega Povzetka predstavili na konferenci REHABEND 2016, prihodnje leto maja v Španiji. 18