KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: Sprejeto: Izvleček Izvirni znanstveni

Velikost: px
Začni prikazovanje s strani:

Download "KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: Sprejeto: Izvleček Izvirni znanstveni"

Transkripcija

1 KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: Sprejeto: Izvleček Izvirni znanstveni članek UDK : 02 : Prispevek predstavlja pripravo algoritma za krnjenje slovenskih besedil s področja bibliotekarstva, ki je potekal v treh fazah: učni, testni in evalvacijski. Predstavljena je priprava oz. učenje Optimalnega algoritma za krnjenje bibliotekarskih besedil, njegovo testiranje in primerjava z dvema drugima algoritmoma za krnjenje, imenovanima Popovičev in Generični. Za učenje je bil uporabljen korpus besed s področja bibliotekarstva. Zgrajeni so bili seznami krnov, besednih končnic ter blokiranih besed. Testna faza je obsegala testiranje algoritma, predvsem zgrajenih sestavnih delov, z dodatnim korpusom, obsegajočim besed. V evalvacijski fazi je bila izvedena primerjava delovanja omenjenih treh algoritmov na istem korpusu. Rezultati delovanja algoritmov so primerjani z intelektualno pripravljenim kontrolnim rezultatom. V njem so množice semantično povezanih besed, zastopane s krni. Spremljano je premalo natačno krnjenje koliko krnov za semantično povezane besede izdela posamezen algoritem. Rezultati so statistično obdelani s Kruskal-Wallisovim testom. Optimalni algoritem daje najboljše rezultate. Največkrat doseže popolno ujemanje s kontrolnim rezultatom in hkrati izdela najmanj krnov za en pomen. Sledi Popovičev z majhnim odstopanjem. Najmanj natančen je Generični. Opisani postopki lahko predstavljajo izhodišče za nadaljnjo gradnjo orodij za avtomatsko indeksiranje dokumentov s področja bibliotekarstva in poizvedovanje po njih. Ključne besede: avtomatsko krnjenje, algoritmi, slovenski jezik, bibliotekarstvo 1 Prispevek opisuje eksperiment, ki je v letih 2000 in 2001 potekal na Oddelku za bibliotekarstvo, informacijsko znanost in knjigarstvo na Filozofski fakulteti v Ljubljani, in je podrobneje opisan v magistrskem delu Krnjenje slovenskih besedil s področja bibliotekarstva (Vilar, 2001). VILAR, Polona; Jasna MAVER: Stemming of Slovenian library science texts. Knjižnica, Ljubljana, 46(2002)1-2,

2 Knjižnica 46(2002)1-2, Abstract Original scientific article UDC : 02 : The theme of the article is the preparation of a stemming algorithm for Slovenian library science texts. The procedure consisted of three phases: learning, testing and evaluation. The preparation of the optimal stemmer for Slovenian texts from the field of library science is presented, its testing and comparison with two other stemmers for the Slovenian language: the Popovič stemmer and the Generic stemmer. A corpus of words from the field of library science was used for learning. Lists of stems, word endings and stop-words were built. In the testing phase, the component parts of the algorithm were tested on an additional corpus of words. In the evaluation phase, a comparison of the three stemmers processing the same word corpus was made. The results of each stemmer were compared with an intellectually prepared control result of the stemming of the corpus. It consisted of groups of semantically connected words with no errors. Understemming was especially monitored the number of stems for semantically connected words, produced by an algorithm. The results were statistically processed with the Kruskal-Wallis test. The Optimal stemmer produced the best results. It matched best with the reference results and also gave the smallest number of stems for one semantic meaning. The Popovič stemmer followed closely. The Generic stemmer proved to be the least accurate. The procedures described in the thesis can represent a platform for the development of the tools for automatic indexing and retrieval for library science texts in Slovenian language. Key words: stemming, stemming algorithms, Slovenian language, library and information science 1Uvod 1.1 Poizvedovanje in avtomatsko indeksiranje Tehnika, ki jo opisuje prispevek, sodi na področje avtomatskega indeksiranja, oz. širše gledano, na področje poizvedovanja. Oboje sta v preglednem članku opisala Vilarjeva in Dimec. Poizvedovanje definirata kot: Prevod angleškega termina information retrieval, za katerega se v slovenskem prostoru pojavljajo različna poimenovanja, npr. iskanje informacij, iskanje in priklic informacij, itd. Gre za sistematično preiskovanje indeksiranih informacijskih virov z odkrivanjem, izbiranjem in pridobivanjem podatkov, zapisov iz njih. V širšem, v svetu najbolj uveljavljenem pomenu, information retrieval pomensko vključuje tudi predhodne postopke gradnje zbirke dokumentov, še posebej postopke opisovanja njihove vsebine (Vilar in Dimec, 2000, str. 7). 112

3 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Avtomatsko indeksiranje je ena najpogostejših tehnik obdelave dokumentov s polnimi besedili na področju poizvedovanja. Gre za proces algoritmične obdelave besedil z namenom določanja seznama indeksnih izrazov. Sodi med derivativne metode, saj indeksni izrazi izvirajo iz dokumenta. Prednosti, ki jih ponuja avtomatsko indeksiranje, so odprava nekaterih pomanjkljivosti intelektualnega indeksiranja, denimo zmanjševanje stroškov in količine intelektualnega dela, in predvsem večja hitrost. Poleg tega je bolj izčrpno, ima bolj specifično terminologijo, in vsaj teoretično natančno predstavlja vsebino dokumenta. Njegova pomanjkljivost pa je, da je izrazito vezano na besedilo dokumenta (tako glede postopkov indeksiranja kot tudi iskanja), ne uvaja semantičnih povezav med indeksnimi izrazi (kot npr. v tezavru) in proizvede obsežne sezname indeksnih izrazov. Avtomatsko indeksiranje uporabljamo skoraj izključno za analizo besedil. Avtomatske tehnike na področju analiziranja slik, video in avdio dokumentov so trenutno še v eksperimentalni fazi, čeprav znanstveniki na njih intenzivno delajo. Cilj, h kateremu težijo sistemi za poizvedovanje po polnih besedilih, je doseganje enakih rezultatov tako iskanja kot tudi vsebinske obdelave, kot bi ti bili, če bi se jih lotil človek. Seveda je dejansko stanje še precej oddaljeno od tega cilja. Potrebno je opozoriti, da je moč računalnikov pri konceptualnem indeksiranju zelo omejena, saj so le v redkih primerih sposobni interpretiranja. To zaenkrat še vedno ostaja domena človeka, prav tako pa tudi prepoznavanje zatipkanih besed ali oblikoslovnih različic besed, ki so posledica slovničnih značilnosti jezika. Za avtomatski izbor vsebinskih predstavnikov besedila obstajata dva osnovna pristopa: jezikoslovni in statistični. Prvi temelji na semantičnih in sintaktičnih metodah, drugi pa na pogostosti pojavljanja besed v besedilu (Popovič, 1990). Pri sodobnih avtomatskih tehnikah za opisovanje vsebine gre navadno za statistično analizo pogostosti pojavljanja besed v tekstu. Včasih so jim dodane še metode za razpoznavanje besednih korenov, fraz ali celo semantičnih pomenov besed. Sistemi tehtajo pomembnost posameznih izrazov glede na njihovo pozicijo v dokumentu, kontekst, v katerem se pojavljajo, ali glede na njihovo sintaktično pozicijo, mnogi pa tudi glede na vgrajene tezavre (Vilar in Dimec, 2000, str. 11). 113

4 Knjižnica 46(2002)1-2, Postopek avtomatskega indeksiranja V procesu avtomatskega indeksiranja je potrebno opraviti nekaj zaporednih postopkov: 1. Leksikalna analiza To je avtomatska analiza besedila dokumenta (naslov, povzetek ali celotno besedilo), v kateri predvsem določamo potencialne kandidate za indeksne izraze. Drugače povedano, gre za pretvarjanje vhodnega besedila v niz posameznih besed v stolpcih, te pa nato obdelamo z avtomatskimi postopki. 2. Blokiranje To je primerjava kandidatov za gesla s t. i. seznamom blokiranih besed, oziroma negativnim slovarjem, v katerem so besede, ki v besedilu nosijo zelo malo ali nič pomena, in so zato nepotrebne. 3. Izbor izrazov, ki predstavljajo vsebino dokumenta 4. Krnjenje To je poenotenje morfoloških različic izrazov, ki so bili izbrani za gesla, in na ta način zlitje besed v enotno obliko, ki nato zastopa vse različice. Je ključnega pomena za uspeh poizvedovanja. 1.3 Krnjenje Oblikoslovje in semantika Jezik je živ organizem in nanj vplivajo različne zakonitosti, zato obstajajo za isti semantični pomen različne oblike besed. Mednje sodijo sinonimi, kratice, pa tudi morfološke oziroma oblikoslovne različice, ki nastajajo z dodajanjem najrazličnejših končnic, oz. pon (pripon ali predpon). Te bodisi spreminjajo besedno vrsto, spol, sklon, sklanjatev, spregatev bodisi katero drugo značilnost posamezne besede. Ujemanje iskalnih zahtev in dokumentov v podatkovni zbirki je odvisno od števila in pogostosti izrazov, ki se pojavljajo v obojih. V nasprotju z jezikoslovjem, ki različne besedne vrste, izpeljanke, zloženke in podobno obravnava ločeno, je za proces poizvedovanja bistvenega pomena semantična interpretacija besed. Oblikoslovne različice, ki so posledica obnašanja naravnega jezika, zato v procesu poizvedovanja predstavljajo oviro, kajti z vidika semantike jih lahko obravnavamo kot sinonime (Vilar in Dimec, 2000, str. 12). 114

5 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Zlivanje besed Ker bi iskalni algoritmi omenjene oblikoslovne različice prepoznali kot različne besede, je za besedila v naravnem jeziku potrebno procesiranje, katerega končni cilj je odstraniti omenjene oblikoslovne različice iz besedila, oz. jih poenotiti. To najpogosteje storimo tako, da jih zreduciramo na koren, ki je sicer dejanski nosilec pomena besede. Ta potem nastopa namesto vseh različnih oblik. Velikokrat pa se zgodi, da preostanek ne ustreza korenu v jezikoslovnem pomenu, zato namesto tega izraza uporabljamo izraz krn, iz česar izvira tudi izraz krnjenje. Krnjenje povzroči zlivanje oziroma združevanje pomensko sorodnih, a različnih besed v enotno obliko. Lahko se izvaja ročno ali avtomatsko. Ročno krnjenje imenujemo tudi ročni odrez. Navadno se izvaja v fazi iskanja, ponavadi z desnim krnjenjem, ki je lahko nastavljeno kot privzeta vrednost, a ga pogosteje izvaja iskalec. Za avtomatsko krnjenje pa se uporabljajo algoritmi. V nasprotju z ročnim se avtomatsko krnjenje ne izvaja v fazi iskanja, temveč na besedah, ki sestavljajo iskalne izraze ter na dokumentih, ki sestavljajo podatkovno zbirko (Vilar in Dimec, 2000, str. 13). Med najpogostejše težave pri krnjenju sodita premočno in prešibko krnjenje. Prvo povzroči zlivanje besed, ki imajo različne pomene, in bi torej ne smele biti zlite na en krn. Zaradi tega pri poizvedovanju trpi natančnost. Prešibko krnjenje pa se pojavi, kadar algoritem ne uspe zliti vseh različic besed za en pomen na isti krn, zaradi česar ostane za en pomen več različnih krnov, kar zmanjšuje odziv Vrste algoritmov za krnjenje Obstaja veliko različnih vrst algoritmov, za katere avtorji predlagajo različne delitve. Vilarjeva in Dimec (2000, str. 14) predlagata delitev na: 1. algoritme, ki zlivajo besede na osnovi soodvisnosti črk v besedi; 2. algoritme, ki združujejo semantično sorodne besede v šope na osnovi njihove statistične sorodnosti; 3. algoritme, ki zlivajo besede z odstranjevanjem pon; 4. algoritme, ki pri zlivanju uporabljajo slovarje. Poleg opisov nekaterih algoritmov za tuje jezike natančno predstavita tudi štiri algoritme, ki so bili izdelani za slovenščino (Ibidem, str ): 1. Preprost algoritem, izdelan na Medicinski fakulteti v Ljubljani; 2. Algoritem Mirka Popoviča; 3. Generični algoritem; 4. Optimalni algoritem. 115

6 Knjižnica 46(2002)1-2, Optimalni algoritem Za eksperimente, ki so opisani v nadaljevanju, smo uporabili algoritem, ki so ga avtorji (Dimec et al., 1999) preprosto poimenovali Optimalni algoritem, kajti njegov namen je, naj bi v vsakem trenutku oblikoval najbolj optimalen krn. Podrobno sta ga opisala Vilarjeva in Dimec (2000), tu bomo omenili le nekaj najpomembnejših značilnosti. Algoritem sodi v družino algoritmov, ki odstranjujejo pone, natančneje besedne končnice. Deluje po načelu najdaljšega ujemanja, a tako, da poskuša vedno ohraniti najdaljši možni niz znakov, ki nato zastopa oblikoslovne različice semantično povezanih besed. Pri najkrajši možni različici namreč prehitro lahko pride do premočnega krnjenja. Dodatna ideja avtorjev je bila, da je potrebno krnjenje bolj prilagoditi strokovnim podjezikom. Iz tega drugega razloga je za delovanje algoritma vedno v začetku potrebna t. i. učna faza, v kateri pridobimo nabor krnov, ki izvirajo iz terminologije nekega področja. Tako zgradimo sestavne dele algoritma, ki jih moramo v nadaljnjih postopkih seveda redno dopolnjevati in vzdrževati. V sistemu tako sodelujejo trije seznami krnov: - veljavni krni; - imenski krni; - novi krni. Prvi seznam vključuje optimalne oblike krnov podjezika, v drugem se nahajajo krni, ki ne sodijo v podjezik, a so pomembni kot vsebinski predstavniki dokumentov (osebna, geografska imena, kratice ). V tretjem se nahajajo vsi krni, ki nastanejo v postopku, in jih še ni med veljavnimi in imenskimi. Zato se imenuje seznam novih krnov. Delovanje algoritma je naslednje (Vilar in Dimec, 2000): V nasprotju z algoritmi z najdaljšim ujemanjem, Optimalni algoritem načne besedo na koncu. Od desne proti levi išče pare soglasnik-samoglasnik. Pri vsakem paru opravi popolni postopek krnjenja odrez končnice, obdelavo soglasniških parov in uporabo pravil za popravljanje krnov. Krn, ki nastane, sistem poskuša najti v seznamih veljavnih in imenskih krnov. Če ga najde, je postopek opravljen, sicer poišče naslednji par soglasnik-samoglasnik v smeri proti začetku besede in ponovi krnjenje. Algoritem torej deluje iterativno, z vedno daljšimi in daljšimi končnicami. Če se iskanje krna v seznamih veljavnih in imenskih krnov nikoli ne izteče pozitivno, je rezultat zadnji krn, ki je nastal v postopku. Slika 1 na simboličen način predstavlja delovanje Optimalnega algoritma. 116

7 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva 1. Begin. STEM = word; 2. Search for the STEM in LEGAL_STEMS and in OTHER_STEMS list; 3. If found go to 11; 4. If MOVING_ALLOWED move cursor in STEM one character to the left else go to 11; 5. Search in the CV_ENDINGS list for the STEM s ending beginning at the cursor; 6. If found cut it off the STEM else go to 4; 7. Iteratively process the STEM consonant pairs with the use of CONS_PAIRS list; 8. Process the STEM with rules from the RECOD_RULES list; 9. Search for the STEM in LEGAL_STEMS and OTHER_STEMS list; 10.If found go to 11 else go to 4 11.End Pass the STEM to next indexing steps. Legenda: LEGAL_STEMS seznam veljavnih krnov OTHER_STEMS seznam drugih krnov MOVING ALLOWED pravila o najkrajšem dovoljenem krnu CV-ENDINGS ÃVH]QDPÃNRQþQLFÃNLÃFHSLMRÃEHVHGRÃQDÃVWLNXÃVRJODsniksamoglasnik CONS-PAIRS seznam parov soglasnikov RECOD-RULES pravila za popravljanje krnov Slika 1: Delovanje Optimalnega algoritma (Dimec et al., 1999) Srce algoritma so torej trije koraki (5-8), ki se izvedejo za vsak premik kazalca. Krnjenje ni možno na vsakem premiku, kadar pa je uspešno opravljeno, algoritem poskuša najti izdelani krn v seznamih veljavnih in drugih krnov. Če ga najde, se postopek konča, sicer se ponovi za naslednji premik kazalca. Končnim pogojem je zadoščeno, ko je krn najden v enem izmed seznamov, ali pa naslednji premik kazalca ni mogoč zaradi pravil o najkrajšem možnem krnu (Dimec et al., 1999). Krn, ki ga izdela algoritem, in rezultati vseh vmesnih stopenj krnjenja se zapišejo v seznam novih krnov. Administrator sistema nato ob pregledu seznama krne označi z eno izmed treh možnih oznak: - krn je lahko optimalen takrat dobi oznako v (iz angl. valid); - lahko izvira iz kratice, geografskega ali osebnega imena takrat dobi oznako n (iz angl. name); - ali pa izvira iz napačno zapisane ali iz kateregakoli drugačnega razloga nesprejemljive besede takrat dobi oznako b (iz angl. bad). Z uporabo posebnega programa, ki so ga avtorji poimenovali Program za čiščenje, in ki vse spremembe takoj odslika v indeksni datoteki zbirke doku 117

8 Knjižnica 46(2002)1-2, mentov, dosežemo, da se označeni krni iz tega seznama preslikajo v ustreznega izmed prvih dveh. Optimalni krni se vključijo v seznam veljavnih krnov, imenski v seznam imenskih krnov, slabe pa zavržemo. Najpomembnejše v celotnem postopku je vzdrževanje seznama veljavnih krnov, ki vsebuje nabor besed oz. krnov podjezika, in seznama imenskih krnov. Seznama naraščata z vsakim obdelanim dokumentom in tako se algoritem uči podjezika. Dela s seznami je z naraščanjem zbirke dokumentov vedno manj, kajti vse več izrazov se že nahaja v enem izmed njiju, zato jih je vse manj v seznamu novih krnov. Administrator sistema določa najustreznejšo obliko krnov. Ni nujno, da se pri pregledovanju seznama novih krnov odloči za obliko krna, ki jo za določeno besedo predlaga algoritem. S pomočjo spiska vseh krnov, ki so nastali v zaporednih stopnjah krnjenja, izbere tistega, ki je po njegovem najustreznejši. Če ima občutek za jezik, obstaja velika verjetnost, da bo tak krn res optimalen. 3 Krnjenje besedil s področja bibliotekarstva 3.1Kratek opis eksperimentov Z eksperimenti smo skušali ugotavljati način in hitrost učenja algoritma na bibliotekarskem podjeziku ter njegovo učinkovitost in posledično uporabnost rezultatov. Zato smo v našem postopku zasnovali tri faze. 1. Učna faza Ker je bil Optimalni algoritem razvit za področje medicine, mi pa smo potrebovali besedišče s področja bibliotekarstva, smo učno fazo pričeli s praznima seznamoma veljavnih in imenskih krnov. Oba smo, skupaj s seznamom blokiranih besed in dopolnjenima seznamoma končnic, zgradili za bibliotekarski podjezik. Za to smo uporabili besedilni korpus, obsegajoč besed, ki smo ga pred tem morali pripraviti za obdelavo. 2. Testna faza Po končani učni fazi smo testirali izdelani algoritem z dodatno, testno množico besedil. Ta je bila manjša, obsegala je besed. V testni fazi smo preverjali uspešnost delovanja in zmanjševanje besedne mase v posamezni fazi v postopku krnjenja: blokiranju in samem krnjenju. 118

9 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva 3. Faza vrednotenja V tej fazi smo primerjali delovanje našega algoritma z dvema drugima algoritmoma, izdelanima za slovenščino. Primerjali smo ga z Generičnim algoritmom (Dimec et al., 2000) ter algoritmom, ki ga je izdelal Popovič (1991a). Rezultate obdelave testnega korpusa z vsemi tremi algoritmi smo statistično obdelali z neparametričnim Kruskal-Wallisovim testom. Ocenjevali smo, ali algoritmi dajo enake rezultate. Poskušali smo tudi ugotoviti, kateri algoritem da najboljše rezultate brez ročnega poseganja, oz. se kar najbolj približa idealnemu rezultatu krnjenja. To smo ugotavljali iz izračunanega povprečnega števila krnov, ki jih izdela vsak algoritem v primerjavi z referenčnim rezultatom, standardno deviacijo in kumulativno vsoto krnov. 3.2 Pridobivanje in priprava besedil Besedila za učno fazo Odločili smo se, da besedila s področja bibliotekarstva poiščemo v temeljni slovenski bibliotekarski reviji Knjižnica, ki jo izdaja Zveza bibliotekarskih društev Slovenije. Izbirali smo samo novejše članke v slovenskem jeziku, torej nismo upoštevali objav v drugih jezikih (hrvaščina, angleščina). Po ugotovitvi, da ne obstaja digitalni arhiv revije, smo se odločili za naslednji postopek: procesiranje besedil z optičnim čitalnikom in nato s programom za optično razpoznavanje znakov. Določene napake, ki so se pri tem pojavile, smo popravljali ročno. Izločali smo tudi izvlečke, ključne besede, bibliografijo. Na ta način smo pridobili besedila štirinštiridesetih člankov iz let 1998 in Drugi obsežni sklop besedil so predstavljala besedila prispevkov v zbornikih s posvetovanj Sekcije za specialne knjižnice pri Zvezi bibliotekarskih društev Slovenije (takih smo pridobili 55) ter besedilo zbornika ob petdeseti obletnici Narodne in univerzitetne knjižnice (10 člankov). Pridobili smo jih v digitalni obliki iz grafičnega studia, zato tu ni bilo potrebe za optično čitanje in razpoznavanje ter ročno popravljanje. V učno množico smo vključili tudi besedila 28 diplomskih nalog z Oddelka za bibliotekarstvo. Datoteke smo shranjevali v tekstovnem formatu. Besedilo smo nato v procesu leksikalne analize pretvorili v stolpec besed (tokenov), istočasno izločali nekatere odvečne znake (ločila, oklepaje, narekovaje, znake *, +, <, >, = ) in števke, ter pretvorili vse črke v male. Učni korpus je obsegal preko besed, ki smo jih zaradi enostavnejše obdelave razdelili v 53 segmentov po besed. 119

10 Knjižnica 46(2002)1-2, Besedila za testno fazo Tudi besedila za testno fazo smo pridobili iz grafičnega studia, zato postopki digitalizacije niso bili potrebni. Odločili smo se za drugo temeljno revijo s področja bibliotekarstva, Šolska knjižnica, ki jo izdaja Zavod Republike Slovenije za šolstvo. V celoti smo jih pridobili iz grafičnega studia, kjer besedila pripravljajo za tisk, in si s tem prihranili postopke digitalizacije. Testni korpus je bil manjši od učnega, obsegal je besed. Tudi to besedilo smo prevedli v ascii format in pretvorili v tokene, a smo ga ohranili kot en korpus v eni datoteki. Ker so bila besedila pripravljena z računalnikom tipa Apple-Macintosh, so bili pred uporabo potrebni določeni ročni posegi, npr. pretvarjanje znakov za šumnike. 3.3 Obdelava Učna faza Krnjenje Tako pripravljene datoteke smo po vrsti procesirali z Optimalnim algoritmom. Rezultat krnjenja je bil na vsakem koraku seznam novih krnov, iz katerega so bile razvidne tudi vse stopnje krnjenja, ki jih je algoritem opravil pri oblikovanju določenega krna. Ker sta bila v začetku oba seznama, veljavni in imenski krni, prazna, so bili v prvem koraku v datoteko Novi krni uvrščeni vsi krni, ki jih je izdelal algoritem. Kasneje pa se je z naraščanjem obeh seznamov obseg datoteke Novi krni na vsakem koraku zmanjšal, izjemoma pa ne, kadar je v obdelavo prišel nov vir krnjenih besedil. Krnjenju je sledila faza, v kateri je imela ključno vlogo administratorka. Njena naloga je bilo pregledovanje in ročno označevanje predlaganih krnov z ustreznimi oznakami v za veljavne oziroma optimalne, n za imenske in b za neustrezne. Pri veljavnih in imenskih krnih je morala biti administratorka poleg dodeljevanja oznak pozorna tudi na to, da z izbiro prekratkega krna ni povzročila premočnega krnjenja. V ta namen ji je bila v pomoč datoteka z izvornimi besedami za vsak predlagan krn New_stem_origins. Lahko se je namreč odločila za katero koli izmed stopenj krnjenja, ne nujno zadnjo. S tem se doseže nedvoumnost krna (ta bo zastopal vse različice besed za en pomen). Za besede, ki pomensko ne sodijo zraven, pa se lahko oblikuje nov krn, ali jih ne upošteva. Struktura zapisov v datotekah je naslednja: 120

11 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Datoteka novih krnov: krn/identifikacijska številka/stopnje krnjenja (na prvem mestu je cela beseda, sledijo pa koraki, ki so privedli do takega krna) Datoteka izvornih besed: identifikacijska številka/krn/izvorne besede, ki so dale ta krn Identifikacijska številka služi povezovanju zapisov v obeh datotekah, in je še posebej pomembna, kadar se administrator ne odloči za zadnjo stopnjo krnjenja. Naslednji primer prikazuje rezultat krnjenja oblikovno podobnih, a semantično različnih besed žarnica in žarčenje. Zapis iz datoteke novih krnov: žar/6464/žarnice,žarnic,žarn,žar Zapis iz izvorne datoteke: 6464/žar/žarnice,žarčenja V datoteki novih krnov vidimo oblikovan krn in vse stopnje krnjenja besede žarnice. Krn preverimo v datoteki izvornih besed. Ugotovimo, da sta besedi, iz katerih je algoritem izdelal krn žar, dve. Vidimo, da gre za premočno krnjenje, ker besedi žarnice in žarčenje ne smeta imeti istega krna. Zato se odločimo za predzadnjo stopnjo krnjenja, torej žarn za žarnico, in ročno ustvarimo nov krn žarč za žarčenje, ki mu dodamo identifikacijsko številko 0. Oba označimo kot veljavna. Po opravljeni nalogi izgledata zapisa v datoteki takole: v/žarn/6464/žarnice,žarnic,žarn,žar v/žarč/0/žarčenje Seveda se je bilo potrebno v določenih primerih sprijazniti tudi s prešibkim krnjenjem. V določenih primerih se zgodi, da en koncept neizogibno zastopata dva ali celo več krnov, katerih vzrok je besedotvorna in oblikoslovna pestrost slovenskega jezika, in ki jih ne moremo poenotiti, včasih niti s pravili za rekodiranje krnov. Naslednji primer ilustrira take dogodke: 121

12 Knjižnica 46(2002)1-2, Zapis iz datoteke novih krnov: zadel/5472/zadelo,zadel zadet/891/zadeti,zadet zadetk/3691/zadetkov,zadetk Zapis iz izvorne datoteke: 5472/zadel/zadelo, 891/zadet/zadeti, 3691/zadetk/zadetke,zadetki,zadetkih,zadetkov, Čiščenje seznama novih krnov Po opravljenem označevanju smo seznam novih krnov vsakič obdelali s programom za čiščenje. Program deluje tako, da krne označene z v preslika v seznam veljavnih krnov (Valid_stems), z n v seznam imenskih krnov (Name_stems), tiste z b pa zavrže. Enako se zgodi z izvornimi besedami za vsak posamezen krn. Datoteka z besedami, iz katerih izvirajo novi krni, se po opravljenem čiščenju krnov iz datoteke novih krnov razdeli glede na oznako, ki smo jo dodelili posameznemu krnu. Nastaneta torej dve novi datoteki: izvorna datoteka veljavnih krnov (Valid_stem_origins) in izvorna datoteka imenskih krnov (Name_stem_origins), ki pripadata ustreznima datotekama z veljavnimi in imenskimi krni. Poleg tega je rezultat procesiranja vsakič tudi datoteka s poročilom o postopku in naraščanju števila krnov v vseh seznamih. Oba seznama smo občasno tudi kontrolirali oz. popravljali morebitne napake administratorke (npr. napačno uvrščene besede) Dopolnjevanje seznamov končnic in blokiranih besed Na podlagi rezultatov krnjenja in opaženih napak smo po potrebi dopolnjevali tudi seznama končnic (moje_koncnice in sogl_koncnice), kot prikazuje naslednji primer: Zapis iz datoteke novih krnov: arhiv/5386/arhivskega,arhivskeg,arkivsk,arhiv arhivir/5947/arhiviranje,arhiviranj,arhivir Zapis iz izvorne datoteke: 5386/arhiv/arhiv,arhivih,arhivskega,arhivskem, arhivski,arhivskih,arhivu, 5947/arhivir/arhiviranje, 122

13 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Algoritem je izdelal dva različna krna za besede, ki pomensko sodijo v isto skupino. Vidimo, da gre tu dejansko za prešibko krnjenje, ki izvira iz dejstva, da v seznamu končnic manjka iranje. Zato smo jo dodali v seznam končnic. Dopolnjevali smo tudi seznam blokiranih besed. Ta je v začetku obsegal besed, na koncu pa je število naraslo na Dodajali smo besede kot idr., joj, hm, prva, dvojen, enem, dveh Učenje algoritma Naraščanje števila veljavnih in imenskih krnov v učnem korpusu prikazuje slika 3. Po zaključeni učni fazi je bilo v datoteki veljavnih krnov, datoteka imenskih krnov je obsegala krnov, torej je bilo celotno število sprejemljivih krnov Na Grafikonu 1 opazimo naraščanje števila veljavnih krnov, ki je sprva strmo, a se nato prične umirjati. Nasprotno pa je naraščanje števila imenskih krnov skoraj linearno Število krnov knj0 knj4 knj8 knj12 spec2 nuk0 dipl3 dipl7 Korpus dipl11 dipl15 dipl19 dipl23 dipl27 dipl31 Veljavni krni Imenski krni Skupaj Grafikon 1: Naraščanje števila sprejemljivih krnov Na Grafikonu 2 vidimo potek učenja bibliotekarskega podjezika z dodano krivuljo trenda. V prvem besedilnem segmentu besed, je bilo število sprejemljivih krnov (8,23%), v zadnjem segmentu pa le še 71 (0,47%). To pomeni, da je algoritem ob obdelavi našel vse več krnov že med veljavnimi ali imenskimi, in jih zato ni uvrščal v seznam novih krnov. Največje razlike opazimo pri veljavnih krnih teh je bilo v začetku (7,27%), nato je število novih strmo padalo do šestega segmenta. Nato se je ustalilo okrog enega odstotka, v zadnjem segmentu pa je bilo veljavnih krnov le še 14 (0,093%). Pri imenskih krnih je trend bolj enakomeren: v začetku jih je bilo 145 (0,97%), nato je število ostajalo bolj ali manj konstantno v vseh segmentih, na koncu jih je bilo 57 (0,38%). Opazimo lahko nenadno povečanje števila novih sprejemljivih krnov 123

14 Knjižnica 46(2002)1-2, ob menjavi vira besedila (spec1, nuk0, dipl0). Še posebej pa je zanimiv trend ob obdelavi besedil diplomskih nalog, kjer nekajkrat opazimo vidno povečanje števila krnov. Sklepamo lahko, da gre za vsebinsko izrazito heterogen korpus knj0 knj2 knj4 knj6 knj8 Število krnov knj10 knj12 spec0 spec2 spec4 nuk0 dipl1 dipl3 dipl5 dipl7 dipl9 dipl11 dipl13 dipl15 dipl17 dipl19 dipl21 dipl23 dipl25 dipl27 dipl29 dipl31 Segment Veljavni krni Imenski krni Vsi sprejemljivi krni Grafikon 2: Učenje bibliotekarskega podjezika Slika 2 vsebuje grafični prikaz mehanizma delovanja algoritma v fazi učenja. Učenje poteka v iteracijah, torej se ponovi za vsak segment s besedami. Slika 2: Mehanizem delovanja optimalnega algoritma v fazi učenja 124

15 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Testna faza S seznami, pripravljenimi v učni fazi, smo pričeli testno fazo optimalnega algoritma. V njej smo uporabili dodaten, posebej za to pridobljen korpus besedil iz revije Šolska knjižnica, ki je obsegal besed. Želeli smo testirati, kako učinkovita bo obdelava tega korpusa z algoritmom s sestavnimi deli, zgrajenimi v učni fazi. Obseg seznamov, s katerimi smo vstopili v testno fazo, je naslednji: - seznam veljavnih krnov: krnov; - seznam imenskih krnov: krnov; - seznam blokiranih besed: besed. Najprej smo želeli testirati učinkovitost blokiranja. Po navedbah nekaterih raziskovalcev (Popovič, 1991b) se pri jezikih z zapleteno oblikoslovno strukturo besedna masa po opravljenem blokiranju zmanjša celo do 50%. V našem primeru je algoritem na podlagi seznama blokiranih besed izločil pomensko praznih besed, kar predstavlja 38,7% korpusa. V postopek krnjenja je bilo tako uvrščenih besed. Drugi del testne faze je predstavljalo krnjenje testnega korpusa. Po končanem krnjenju je algoritem izdelal veljavnih in imenskih krnov, torej skupaj sprejemljivih krnov iz testnega korpusa. V datoteko novih krnov, torej takih, ki jih ni našel na nobenem seznamu, pa je uvrstil krnov. Po pregledu tega seznama je administratorka ugotovila, da jih je bilo slabih (94%), 214 imenskih in 135 veljavnih. Vidimo torej, da je bilo le 349 krnov takih, ki še niso bili uvrščeni na sezname sprejemljivih krnov, s katerimi je sicer delal algoritem. Po zaključenem krnjenju je tako od besed, ki so bile po blokiranju uvrščene v krnjenje, ostalo 12,27%. Če gledamo celoten korpus, predstavljajo izdelani krni 7,52% besedila. Tak rezultat predstavlja občutno zmanjšanje obsega datoteke. Slika 3 prikazuje zmanjševanje besedne mase v posamezni fazi postopka. 125

16 Knjižnica 46(2002)1-2, Skupaj Imenski krni Veljavni krni Vse besede Po blokiranju Po krnjenju Slika 3: Zmanjševanje besedne mase Potrebno je opozoriti, da gre v tem primeru za drugačno situacijo kot v fazi učenja. Tam so bili produkt krnjenja le tisti krni, ki jih algoritem ni uspel najti v seznamih veljavnih ali imenskih krnov, in jih je bilo zato potrebno ročno označevati kot veljavne, imenske ali nesprejemljive, s čimer smo dograjevali seznama veljavnih in imenskih krnov. Tu pa ni šlo več za dograjevanje seznamov. Teh krnov so vsi krni, ki so nastali iz korpusa besed. 349 krnov pa je bilo za algoritem novih. Gre za to, da so se besede, ki so ostale po opravljenem postopku blokiranja, zlile na krne, ki sedaj zastopajo njihov semantični pomen, in ki bi jih uporabili v nadaljnjih postopkih gradnje seznamov predstavnikov vsebine in tudi v postopkih poizvedovanja. 4 Vrednotenje Po zaključeni učni fazi je bil Optimalni algoritem izoblikovan in pripravljen za nadaljnje delo. S testnim korpusom smo testirali uspešnost učenja. Na njegovi osnovi smo želeli izvesti tudi vrednotenje. V fazi vrednotenja smo torej na testnem korpusu primerjali delovanje treh algoritmov za slovenski jezik, Optimalnega, Generičnega in Popovičevega. 4.1Referenčni rezultat krnjenja Za namene vrednotenja smo najprej oblikovali referenčni rezultat krnjenja, katerega značilnost je bila, da so se v njem nahajali krni, ki so brez napake zastopali besede v testnem korpusu. V testni fazi dobljene sezname končnic 126

17 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva in krnov smo ročno popravili in dopolnili in se poskušali kar najbolj približati idealnemu rezultatu krnjenja. V njem je bil torej prisoten samo po en krn za en semantičen pomen, in hkrati zastopani vsi semantični pomeni v korpusu, kar je idealen rezultat krnjenja. Enako velja tudi za krne, ki izvirajo iz lastnih imen. Istočasno pa smo poskrbeli, da v referenčnem rezultatu ni bilo nesprejemljivih krnov. Naša odločitev je, da v tem primeru ne bomo spremljali ustreznosti samih krnov, marveč smo se posvetili besedam, ki jih določen krn zastopa. Skupine besed, ki dajo določen krn, smo oblikovali ročno, oziroma intelektualno (želeli smo se namreč kar najbolj približati idealnemu rezultatu krnjenja) in jih poimenovali referenčni razredi. Pri oblikovanju referenčnih razredov smo upoštevali nekatere dogovorjene principe Principi oblikovanja referenčnih razredov V posameznem referenčnem razredu se nahajajo besede, ki sodijo skupaj glede na semantični pomen, ne glede na obliko. V naravnem jeziku, še zlasti pri oblikoslovno razgibanih jezikih, seveda naletimo na besede enakega pomena, ki so popolnoma različne (npr. mečem vržem, človek - ljudje), zato se z avtomatskimi metodami obdelave naravnih jezikov idealnemu rezultatu vedno le približamo. Pri oblikovanju referenčnih razredov smo zato upoštevali naslednje principe, pri katerih smo se opirali na semantiko: - v en referenčni razred sodijo besede oziroma besedne vrste, ki imajo enak semantičen pomen, ne glede na vrsto tvorjenja oziroma oblikoslovne značilnosti; - v primeru, da določena beseda zaradi semantike ne ustreza, jo uvrstimo v drug referenčni razred; - po potrebi tak referenčni razred, oz. njemu pripadajoči krn, ustvarimo intelektualno. Oblikovanje referenčnega razreda ilustrira naslednji primer: Algoritem je izdelal naslednji referenčni razred, pripadajoč krnu avtor: 107/avtor/avtor,avtoric,avtorica,avtorice,avtorici, avtorizacija,avtorizacije, avtorizacijo,avtorja, avtorje,avtorjem,avtorjema,avtorjev,avtorjeva,avtorjeve, avtorjevega,avtorjevem,avtorjevo,avtorji,avtorjih, avtorju,avtorske,avtorskega,avtorski, avtorskih,avtorsko, 127

18 Knjižnica 46(2002)1-2, Vidimo, da so na seznamu besede, ki zaznamujejo vse, kar je v zvezi z osebo, ki je ustvarila neko delo, torej avtorjem (to so različne oblikoslovne oblike besede avtor in iz nje izpeljanih pridevnikov). V seznamu besed pa so se znašle tudi besede avtorizacija, avtorizacije in avtorizacijo, ki semantično ne ustrezajo ostalim. Zato jih izločimo, in oblikujemo nov ekvivalenčni razred: 0/avtoriz/avtorizacija,avtorizacije,avtorizacijo, 4.2 Metodologija vrednotenja Isti korpus, iz katerega smo oblikovali referenčni rezultat, smo nato obdelali z vsakim izmed treh algoritmov. Za potrebe vrednotenja smo izhod obdelave testnega korpusa, ki ga je izdelal posamezen algoritem, združili v eno datoteko. To pomeni, da so se v njej nahajali vsi krni, ki jih je izdelal posamezen algoritem. Datoteke z rezultati vsakega algoritma smo nato primerjali z referenčnim rezultatom. Ugotavljali smo, koliko se rezultat krnjenja korpusa s posameznim algoritmom približa referenčnemu idealnemu. Šlo je za to, da ugotovimo, koliko ekvivalenčnih razredov z besedami enega referenčnega razreda izdela posamezen algoritem. V praksi so možne tri situacije; popolno ujemanje, premalo natančno ali premočno krnjenje. To pomeni, da določen algoritem lahko izdela en krn za vse semantično povezane besede, in se s tem izenači z referenčnim rezultatom. Algoritem lahko izdela tudi več kot en krn za en semantičen pomen, kar pomeni, da množico semantično enakih besed razdeli na nekaj manjših. Mogoče pa je seveda tudi, da se v množici besed, ki jih algoritem okrni na en krn, znajde beseda (ali več besed), ki bi zaradi svojega pomena sodila v drugo množico besed. Naslednji primer prikazuje situacijo, ko algoritem za en referenčni razred izdela tri ekvivalenčne: Referenčni razred: /žel/želel,6;želela,5;želele,5;želeli,11;želene,1; želenem,1; želenih,1; želeno,5;želi,24;želijo,31; želite,1;želno,1; želim,6;želimo,57; želja,13; željah,3; željami,2;želje,12;želji,5;željno,1;željo,9; Ekvivalenčni razredi: /žel/želel,6;želela,5;želele,5;želeli,11;želene,1; želenem,1; želenih,1;želeno,5;želi,24;želijo,31;želite,1;želno,1; /želim/želim,6;želimo,57; /želj/želja,13;željah,3; željami,2; želje,12;želji,5; željno,1;željo,9; 128

19 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Pri vrednotenju je zato mogoče spremljati več dejavnikov, predvsem pa dva: - število krnov (oz. množic besed), ki jih algoritem izdela za en semantičen pomen kar je premalo natančno krnjenje; - število napačno uvrščenih besed oz. premočno krnjenje. Odločili smo se, da se bomo pri vrednotenju delovanja algoritmov predvsem omejili na premalo natančno krnjenje. Le-to pri poizvedovanju vodi v zmanjševanje odziva, kar pomeni, da med zadetki ne bo vseh relevantnih dokumentov v podatkovni zbirki. Nismo testirali premočnega krnjenja, ki je sicer pomembno za natančnost. Pomeni, da so med zadetki tudi nerelevantni dokumenti. V primeru, da sistem npr. okrni besedi avtor in avtorizacija na isti krn, bi pri poizvedovanju dobili dokumente, ki govorijo o obojem, česar pa ne želimo. Zavedamo se, da prihaja tudi do tega pojava, ker pa smo izkustveno ugotovili, da je premalo natančno krnjenje veliko bolj izrazito, nas je to vodilo do odločitve, da ga izberemo kot kriterij vrednotenja. Potrebno je sicer še enkrat opozoriti, da gre pri referenčnem rezultatu za ročno oz. intelektualno oblikovane semantično povezane skupine besed, kar je v realnem okolju živega jezika nemogoče doseči z avtomatskimi metodami krnjenja. Zato smo domnevali, da bomo pri pregledovanju rezultatov delovanja posameznega algoritma ugotovili, da se posamezen rezultat lahko idealnemu približa, lahko mu je enak, ne more pa ga preseči. Naša domneva je bila torej, da bodo med rezultati delovanja algoritmov značilne razlike, ki smo jih poskušali tudi statistično dokazati. 4.3 Rezultati primerjave algoritmov Primerjava Optimalnega, Generičnega in Popovičevega algoritma V statistični analizi smo uporabili neparametrični Kruskal-Wallisov test ali krajše H test, namenjen primerjavi več vzorcev (Adamič, 1995). Številu ekvivalenčnih razredov (oz. krnov), ki jih algoritem izdela za en referenčni razred, je bila izbrana naključna spremenljivka. Ničelna hipoteza H 0 trdi, da med algoritmi ni razlik, torej da se ne razlikujejo glede na število proizvedenih ekvivalenčnih razredov. Dobljene razlike so zgolj naključne. Nasprotno tej postavimo osnovno hipotezo H 1, da se algoritmi razlikujejo, oz. da število ekvivalenčnih razredov, ki jih izdelajo, ni enako. Tabela 1 prikazuje rezultate delovanja vsakega izmed algoritmov. Prikazuje, koliko krnov oz. ekvivalenčnih razredov je izdelal posamezen algoritem v primerjavi z referenčnim rezultatom krnjenja. Dodani so tudi rangi posameznih rezultatov. Tako je npr. Optimalni algoritem v primerih izdelal rezultat, 129

20 Knjižnica 46(2002)1-2, enak referenčnemu, torej en krn, ki zastopa vse semantično enake besede. Generični algoritem je to storil v primerih, Popovičev pa v primerih. Po dva krna, ki zastopata besede, uvrščene v en ekvivalenčni razred v referenčnem rezultatu, so izdelali: Optimalni algoritem v 463 primerih, Generični v 892 primerih in Popovičev v 769 primerih. Največje število izdelanih krnov za en semantičen pomen je 32, iz tabele vidimo, da jih je izdelal Generični algoritem. Tabela 1: Rezultati delovanja algoritmov {tevilo ekv. razredov Optimalni G eneri~ni Popovi~ skupaj rang

21 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva T x 7 7 5, ,7683 x 10,3454 x 10 v 5 7 n v T v vsota rangov v posameznem vzorcu n v število enot v posameznem vzorcu Izračunana vrednost H = 930,4835 Zaradi velikega števila skupnih rangov se odločimo tudi za korekcijo. Izračunamo korekcijski koeficient k C, s katerim delimo izračunano vrednost H. k C = 0,5288 H C = 1759,6 Kritična vrednost hi-kvadrat pri 1% tveganju in dveh stopinjah prostosti je χ 2 = 9,21. Dobljena vrednost H C je znatno večja kot kritična vrednost. Ničelno hipotezo H 0 zavrnemo in sprejmemo osnovno hipotezo H 1, ki trdi, da rezultati krnjenja niso enaki, oz. da se število ekvivalenčnih razredov, ki jih proizvedejo algoritmi za en referenčni razred, značilno razlikuje. V primerjavi z referenčnim rezultatom, ki obsega krnov, jih Optimalni izdela 7.642, Popovičev in Generični Izračunamo še povprečno število ekvivalenčnih razredov za referenčni razred in standardno deviacijo. Rezultate prikazuje tabela 2. Tabela 2: Povprečno število in standardne deviacije ekvivalenčnih razredov na referenčni razred Algoritem x δ Optimalni 1,2307 0,5381 Popovi~ev 1,2659 0,6995 Generi~ni 2,5656 2,9044 Iz izračuna povprečnega števila in standardnih deviacij je očitno, da Generični algoritem izrazito odstopa od Popovičevega in Optimalnega, medtem ko sta si slednja dva glede na rezultate dokaj blizu. Zato smo izvedli še primerjavo Popovičevega in Optimalnega algoritma Primerjava Optimalnega algoritma s Popovičevim Ničelna hipoteza H 0 tokrat trdi, da se algoritma glede na število ekvivalenčnih razredov ne razlikujeta. Preverimo jo s Kruskal-Wallisovim testom. 131

22 Knjižnica 46(2002)1-2, Iz tabele 3 vidimo, da Optimalni algoritem doseže natančno ujemanje z referenčnim rezultatom v primerih, Popovičev pa v nekaj več kot pet tisoč. Popovičev algoritem izdela največ osem krnov za en pomen, medtem ko jih Optimalni izdela največ deset, kar pomeni, da se v tej značilnosti Popovičev algoritem izkaže celo kot boljši. Tabela 3: Rezultati delovanja Optimalnega in Popovičevega algoritma [ tevilo krnov O ptimalni Popovi~ skupaj rang T 3,6796 x 10,8978 x 10 v n v 3 7 H = 51,2455 Korekcija k C = 0,3643 H C = 140,6703 Kritična vrednost hi-kvadrat pri 1% tveganju in eni stopinji prostosti je χ 2 = 6,63. Dobljena vrednost H c je večja kot kritična vrednost. Značilna razlika tudi v tem primeru kaže, da lahko ničelno hipotezo H 0 zavrnemo in sprejmemo osnovno hipotezo H 1, pri čemer je tveganje 1%. Ta trdi, da sta rezultata krnjenja obeh algoritmov različna. 4.4 Povzetek vrednotenja algoritmov Z vrednotenjem algoritmov smo prišli do zaključka, da so algoritmi različni. Krnjenje enakega besedilnega korpusa proizvede tri izrazito različne rezultate. 132

23 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva Optimalni algoritem kaže najboljše rezultate, oz. se najbolj približa idealnemu rezultatu krnjenja. Generični algoritem se izkaže kot najmanj natančen. Popolno ujemanje z referenčnim rezultatom najdemo pri Optimalnem algoritmu v primerih, pri Popovičevem v primerih in pri Generičnem v primerih. Ob spremljanju največjega števila krnov za en semantičen pomen, smo ugotovili, da se tukaj najbolj izkaže Popovičev algoritem, saj v najslabšem primeru izdela osem krnov za en pomen. Optimalni algoritem jih sicer izdela devet oz. deset, vendar le v dveh primerih (0,032% vseh krnov), kar je zanemarljivo. Sicer pa je veliko bolj natančen od Popovičevega. Generični algoritem pa v 225 primerih izdela 10 ali več krnov za en semantičem pomen, od tega v dvanajstih več kot 20, v najslabšem primeru pa celo 32. Dejstvo postane razumljivo, če se spomnimo, da je glavna naloga Generičnega algoritma preprečevanje premočnega krnjenja (reduciranja besed z različnimi pomeni na enak krn). Sklepali smo, da izvrševanje te naloge rezultira v izrazito premalo natančnem krnjenju, ki je še posebej očitno v jeziku z bogato oblikoslovno strukturo, kot je slovenščina. Omeniti je sicer potrebno, da so bili tako izraziti rezultati v prid optimalnega algoritma gotovo tudi posledica omejenega besedilnega korpusa, s katerim smo delali. Res je tudi, da ima intelektualno oblikovan referenčni rezultat krnjenja značilnosti, ki se jih ne da doseči z avtomatskimi metodami krnjenja, saj referenčni razredi vsebujejo tudi sinonime in druge oblike semantično povezanih besed, ki jih algoritem brez vgrajenih leksičnih pripomočkov kot npr. slovar ali tezaver ne more doseči. 5 Zaključek Cilj dela, opisanega v prispevku, je bil razvoj in testiranje postopka avtomatskega krnjenja besedil slovenskega bibliotekarskega podjezika. Ta je potekal v treh fazah. V prvi fazi postopka je šlo za učenje algoritma z imenom Optimalni - na besedilnem korpusu iz temeljne slovenske bibliotekarske revije Knjižnica, referatov z nekaterih bibliotekarskih posvetovanj in diplomskih nalog s besedami, ki je bil razdeljen na segmente po besed. Cilj prve faze je bil zgraditi datoteke z veljavnimi in imenskimi krni, ki izvirajo iz besedišča s področja bibliotekarstva, in ki bi jih bilo mogoče uporabiti v nadaljnjih postopkih gradnje orodij za avtomatsko indeksiranje in pri poizvedovanju. Po opravljeni učni fazi je sledila testna faza, v kateri smo testirali delovanje algoritma z vsemi pripadajočimi datotekami (seznami veljavnih in imenskih 133

24 Knjižnica 46(2002)1-2, krnov, seznamoma blokiranih besed in pravil za popravljanje krnov) na dodatnem, sicer manjšem besedilnem korpusu. Ta je obsegal besed. Ugotovili smo, da se s krnjenjem besedna masa korpusa zmanjša za 92,48% in da je le 349 krnov takih, ki še niso uvrščeni na seznama sprejemljivih krnov. Nato smo izvedli vrednotenje. V tej fazi smo primerjali tri algoritme, Optimalnega, Generičnega in Popovičevega. Primerjali smo rezultate njihovega delovanja z referenčnim rezultatom. To je Optimalni rezultat krnjenja, ki smo ga namenoma izdelali ročno, da bi dosegli njegovo maksimalno pravilnost. Posebno pozornost smo posvetili skupinam besed, ki so semantično povezane, zato se lahko zlijejo na določen krn. Za kriterij vrednotenja delovanja algoritmov smo si izbrali premalo natančno krnjenje. Spremljali smo, koliko krnov (oz. skupin besed, zastopanih z določenim krnom) izdela posamezen algoritem za en semantičen pomen v primerjavi z referenčnim rezultatom. Tako skupino besed, ki dajo krn, smo poimenovali ekvivalenčni razred. Možno je bilo popolno ujemanje z referenčnim rezultatom, torej da algoritem izdela en sam ekvivalenčni razred ali pa da jih izdela več. Hkrati smo se zavedali, da je mogoče spremljati tudi premočno krnjenje, a smo ugotovili, da se pojavlja manj pogosto. Zato ga nismo spremljali. Rezultate smo statistično obdelali, za statistično obdelavo pa smo izbrali neparametrični Kruskal-Wallisov test ali krajše H test. Z eksperimenti in vrednotenjem smo prišli do zaključka, da najboljše rezultate med omenjenimi tremi algoritmi daje Optimalni algoritem. Največkrat doseže popolno ujemanje z referenčnim rezultatom in hkrati izdela najmanj krnov za en semantičen pomen. Sledi Popovičev algoritem, za tretjega, Generičnega, pa se je izkazalo, da je premalo natančno krnjenje njegova izrazita slabost. Ko rezultate optimalnega algoritma primerjamo z rezultati krnjenja medicinskega podjezika (Vilar in Dimec, 2001), lahko ugotovimo številne podobnosti. Zato lahko sklepamo na možnost uspeha algoritma tudi pri obdelavi besedil z drugih področij, seveda pa tudi za nadaljnje delo na področju obdelave bibliotekarskih besedil. S pomočjo eksperimentov smo zgradili nabor krnov, ki zastopajo semantično povezane besede iz besedil, s katerimi smo delali. Menimo, da tak nabor lahko predstavlja osnovo za nadaljnjo gradnjo besedišča podjezika s področja bibliotekarstva. Seveda pa se zavedamo, da je za to potreben dodaten, mnogo večji korpus besedil. Z obdelavo dodatnih besedil lahko zgradimo relativno ažuren besednjak, uporaben v orodjih za avtomatsko indeksiranje, iskalnih orodjih za dokumente v elektronski obliki. Možna je celo uporaba za nekatera druga področja, npr. terminologijo ali vsebinsko obdelavo. V tako zgrajenem naboru besed, pod pogojem, da je ažurno vzdrževan, se odraža dejansko stanje sodobnega znanstvenega in strokovnega jezika, kakršnega najdemo v pisnih virih na področju bibliotekarstva. Tako besedišče 134

25 Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva vključuje tudi mnoge druge, z vidika bibliotekarstva, mejne vede in stroke, vse od računalništva in informatike, preko upravljanja in vodenja, do družbenih ved, pedagogike in psihologije. Z eksperimenti smo tudi ugotovili, da je mogoče slovenski jezik, kljub njegovi razgibanosti, s kvalitetnim algoritmom in zadostno količino dodatnih pravil za preoblikovanje krnov dokaj uspešno modelirati. Naša metoda, s svojim relativno enostavnim načinom dograjevanja in dopolnjevanja besednjaka, lahko predstavlja osnovo za nadaljnje delo na področju avtomatske obdelave naravnega slovenskega jezika. Spričo hitrosti razvoja bibliotekarske znanosti in stroke in spričo dejstva, da je jezik živ, nenehno se razvijajoč organizem, se zavedamo, da je na tem področju potrebnega še mnogo dela, in da lahko rezultati pričujočega magistrskega dela služijo kot pomoč pri načrtovanju nadaljnjih postopkov pri gradnji orodij za avtomatsko indeksiranje slovenskega jezika. Zahvala Zahvaljujemo se vsem, ki so omogočili nastanek magistrskega dela, na katerem temelji prispevek. V prvi vrsti mentorici dr. Jasni Maver in avtorju uporabljene programske opreme in mnogih idej dr. Juretu Dimcu. Zahvala pa gre tudi uredništvoma revij Knjižnica in Šolska knjižnica, Zvezi bibliotekarskih društev Slovenije ter Narodni in univerzitetni knjižnici, ki so omogočili uporabo besedil v raziskovalne namene. Citirani viri 1. Adamič, Š. (1995). Temelji biostatistike. Ljubljana: Medicinska fakulteta. 2. Dimec, J., Todorovski, L., Hristovski, D., & Džeroski, S. (1999). The personalized search engine for Slovenian and English medical documents. V Managing multimedia collections. 23 rd Library systems seminar, Bled, April 1999 (str ). Ljubljana: National and University Library.. 3. Dimec, J., Todorovski, L., Hristovski, D., & Džeroski, S. (2000). Three new stemmers for Slovenian language. Pridobljeno s spletne strani: / 4. Popovič, M. (1991). Implementation of a Slovene language free-text retrieval system: a study submitted in fulfilment of the requirements for the degree of Doctor of Philosophy at the University of Sheffield. Sheffield: Department of Information Studies. 135

KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: Sprejeto: Izvleček Izvir

KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: Sprejeto: Izvleček Izvir KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: 26.10.2000 - Sprejeto: 05.12.2000 Izvleček Izvirni znanstveni članek UDK 004.021 :001.891.5 V prispevku

Prikaži več

Microsoft Word - bibliografske-zbirke-medicina.doc

Microsoft Word - bibliografske-zbirke-medicina.doc Univerza v Ljubljani Filozofska fakulteta Oddelek za bibliotekarstvo, informacijsko znanost in knjigarstvo Sistemi za poizvedovanje Bibliografske zbirke področje medicine Mentor: doc.dr. Jure Dimec Avtorja:

Prikaži več

Osnove statistike v fizični geografiji 2

Osnove statistike v fizični geografiji 2 Osnove statistike v geografiji - Metodologija geografskega raziskovanja - dr. Gregor Kovačič, doc. Bivariantna analiza Lastnosti so med sabo odvisne (vzročnoposledično povezane), kadar ena lastnost (spremenljivka

Prikaži več

Datum in kraj

Datum in kraj Ljubljana, 5. 4. 2017 Katalog znanj in vzorci nalog za izbirni izpit za vpis na magistrski študij Pedagoško računalništvo in informatika 2017/2018 0 KATALOG ZNANJ ZA IZBIRNI IZPIT ZA VPIS NA MAGISTRSKI

Prikaži več

VSEBINSKI NASLOV SEMINARSKE NALOGE

VSEBINSKI NASLOV SEMINARSKE NALOGE Univerza v Ljubljani Naravoslovnoteniška fakulteta Oddelek za tekstilstvo VSEBINSKI NASLOV SEMINARSKE NALOGE TITLE IN ENGLISH Avtorja: Študijska smer: Predmet: Informatika in metodologija diplomskega dela

Prikaži več

%

% OSNOVNA ŠOLA NARODNEGA HEROJA RAJKA HRASTNIK PODRUŽNIČNA ŠOLA DOL PRI HRASTNIKU PODRUŽNICA LOG AKTIV TJA IN NI KRITERIJ OCENJEVANJA 2018/2019 0-44 % nzd (1) 45-64 % zd (2) 65-79 % db (3) 80-89 % pdb (4)

Prikaži več

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem Kaja Dobrovoljc Ljubljana, 3. 2. 2012 Kaj je leksikon besednih oblik (LBO)? podatkovna zbirka o oblikoslovnih lastnostih besedišča zdruţevanje

Prikaži več

Microsoft PowerPoint - Lapajne&Randl2015.pptx

Microsoft PowerPoint - Lapajne&Randl2015.pptx RAZISKAVA OB PREDVIDENI SELITVI KNJIŽNIC OHK Raziskava je potekala v okviru predmetov Raziskovalne metode in Uporabniki informacijskih virov in storitev pod mentorstvom treh profesorjev (dr. Pisanski,

Prikaži več

Microsoft Word - SI_vaja5.doc

Microsoft Word - SI_vaja5.doc Univerza v Ljubljani, Zdravstvena fakulteta Sanitarno inženirstvo Statistika Inštitut za biostatistiko in medicinsko informatiko Š.l. 2011/2012, 3. letnik (1. stopnja), Vaja 5 Naloge 1. del: t test za

Prikaži več

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar 2009 1 Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero velja 0 f(e) u(e) za e E(G). Za v V (G) definiramo presežek

Prikaži več

Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / Uradni lis

Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / Uradni lis Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / 24. 5. 2019 Uradni list Republike Slovenije PRILOGA 1 PRAVILA ZA OBLIKOVANJE

Prikaži več

Microsoft Word - A-3-Dezelak-SLO.doc

Microsoft Word - A-3-Dezelak-SLO.doc 20. posvetovanje "KOMUNALNA ENERGETIKA / POWER ENGINEERING", Maribor, 2011 1 ANALIZA OBRATOVANJA HIDROELEKTRARNE S ŠKOLJČNIM DIAGRAMOM Klemen DEŽELAK POVZETEK V prispevku je predstavljena možnost izvedbe

Prikaži več

Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENO

Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko   ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENO Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko www.trojina.si ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENOSTI PISA 2009 TEMA POROČILA PISA (The Programme for

Prikaži več

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: ksz@mf.uni-lj.si T: +386 1 543 7700 Režim študija Predmet: Uvod v medicino, modul Informatika Študijski program: EMŠ

Prikaži več

Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se

Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se velikokrat zmoti. Na srečo piše v programu Microsoft

Prikaži več

Usmerjevalna skupina 2018 pripravljalni dokumenti Zadeva: Sklepi organov in strokovnih teles - ZSA Uvodna opomba: uvrščamo sklepe, ki se nanašajo na p

Usmerjevalna skupina 2018 pripravljalni dokumenti Zadeva: Sklepi organov in strokovnih teles - ZSA Uvodna opomba: uvrščamo sklepe, ki se nanašajo na p Usmerjevalna skupina 2018 pripravljalni dokumenti Zadeva: Sklepi organov in strokovnih teles - ZSA Uvodna opomba: uvrščamo sklepe, ki se nanašajo na predloge sprememb ali pripombe na veljavne akte agencije.

Prikaži več

3. Preizkušanje domnev

3. Preizkušanje domnev 3. Preizkušanje domnev doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014 3.1 Izračunavanje intervala zaupanja za vrednosti regresijskih koeficientov Motivacija

Prikaži več

Ko je izbira ovira v napredovanju Silva Novljan

Ko je izbira ovira v napredovanju Silva Novljan Ko je izbira ovira v napredovanju Silva Novljan Bralna pismenost v Sloveniji in Evropi Nacionalna konferenca, Brdo pri Kranju, 25. in 26. oktober 2011 Izhodišče razmišljanja Rezultati raziskav o povezanosti

Prikaži več

Delavnica Načrtovanje digitalnih vezij

Delavnica Načrtovanje digitalnih vezij Laboratorij za načrtovanje integriranih vezij Univerza v Ljubljani Fakulteta za elektrotehniko Digitalni Elektronski Sistemi Osnove jezika VHDL Strukturno načrtovanje in testiranje Struktura vezja s komponentami

Prikaži več

(Microsoft Word - U\350enje telegrafije po Kochovi metodi.doc)

(Microsoft Word - U\350enje telegrafije po Kochovi metodi.doc) MORSE UČENJE PO KOCHOVI METODI Računalniški program za učenje skupaj z nekaterimi dodatnimi datotekami dobite na spletni strani avtorja: http://www.g4fon.net/. Zanimive strani so tudi: - http://www.qsl.net/n1irz/finley.morse.html

Prikaži več

Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar Prirejeno po: Brcar, F. (2016). Pi

Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar   Prirejeno po: Brcar, F. (2016). Pi Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar franc.brcar@gmail.com http://www.uporabna-statistika.si/ Prirejeno po: Brcar, F. (2016). Pisanje strokovnih in znanstvenih del. Novo mesto: 1

Prikaži več

DODATEK_F8

DODATEK_F8 COMARC/B F.8 F.8 Tabela polj/podpolj s stopnjo obveznosti za posamezen bibliografski nivo V tabeli je podana obveznost polj/podpolj (o - obvezen podatek, p - obvezen podatek, če obstaja, in n - neobvezen

Prikaži več

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA Navdih Poizvedovanje po BD podatkovnih virih, ki imajo časovno dimenzijo in so dostopni. Večji promet pomeni večje število dobrin in močnejšo

Prikaži več

2. Model multiple regresije

2. Model multiple regresije 2. Model multiple regresije doc. dr. Miroslav Verbič miroslav.verbic@ef.uni-lj.si www.miroslav-verbic.si Ljubljana, februar 2014 2.1 Populacijski regresijski model in regresijski model vzorčnih podatkov

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev INFORMATIKA Tečaj za višjega gasilca OGZ PTUJ 2017 PRIPRAVIL: ANTON KUHAR BOMBEK, GČ VSEBINA TEORETIČNA PREDAVANJA INFORMACIJSKI SISTEMI SISTEM OSEBNIH GESEL IN HIERARHIJA PRISTOJNOSTI PRAKTIČNE VAJE ISKANJE

Prikaži več

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij Kazalo 1 DVOMESTNE RELACIJE 1 1.1 Operacije z dvomestnimi relacijami...................... 2 1.2 Predstavitev relacij............................... 3 1.3 Lastnosti relacij na dani množici (R X X)................

Prikaži več

POROČILO

POROČILO UVOD Delovanje knjižnice Fakultete za kemijo in kemijsko tehnologijo v Ljubljani (UL FKKT), ki je sedaj že 17 let funkcionalno združena s Centralno tehniško knjižnico (CTK), lahko ocenimo kot uspešno kar

Prikaži več

6.1 Uvod 6 Igra Chomp Marko Repše, Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru

6.1 Uvod 6 Igra Chomp Marko Repše, Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru 6.1 Uvod 6 Igra Chomp Marko Repše, 30.03.2009 Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru in na končni ali neskončni čokoladi. Igralca si izmenjujeta

Prikaži več

NAVODILA AVTORJEM PRISPEVKOV

NAVODILA AVTORJEM PRISPEVKOV Predmetna komisija za nižji izobrazbeni standard matematika Opisi dosežkov učencev 6. razreda na nacionalnem preverjanju znanja Slika: Porazdelitev točk pri matematiki (NIS), 6. razred 1 ZELENO OBMOČJE

Prikaži več

Microsoft Word - polensek-1.doc

Microsoft Word - polensek-1.doc Spletna učilnica športne vzgoje res deluje? Janja Polenšek OŠ Dobje janja.polensek@gmail.com Povzetek S pospešenim uvajanjem informacijsko-komunikacijske tehnologije v proces izobraževanja na OŠ Slivnica

Prikaži več

Microsoft Word - Visoko_citirane_3.doc

Microsoft Word - Visoko_citirane_3.doc Visoko citirane objave (1%) v obdobju 23-213 glede na predhodno obdobje Visoko citirane objave so znanstvene objave, ki se po številu citatov uvrščajo v zgornji odstotek najbolj citiranih objav. Gibanje

Prikaži več

Microsoft Word - SI_vaja1.doc

Microsoft Word - SI_vaja1.doc Univerza v Ljubljani, Zdravstvena fakulteta Sanitarno inženirstvo Statistika Inštitut za biostatistiko in medicinsko informatiko Š.l. 2011/2012, 3. letnik (1. stopnja), Vaja 1 Naloge 1. del: Opisna statistika

Prikaži več

Avtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri

Avtomatizirano modeliranje pri celostnem upravljanju z vodnimi viri Univerza v Ljubljani Fakulteta za gradbeništvo in geodezijo 36. Goljevščkov spominski dan Modeliranje kroženja vode in spiranja hranil v porečju reke Pesnice Mateja Škerjanec 1 Tjaša Kanduč 2 David Kocman

Prikaži več

Microsoft Word - CNC obdelava kazalo vsebine.doc

Microsoft Word - CNC obdelava kazalo vsebine.doc ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo mesto, april 2008 Ime in priimek študenta ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo

Prikaži več

PowerPoint Presentation

PowerPoint Presentation Zapisovanje učnih izidov Bled, 21.1.2016 Darko Mali ECVET ekspert, CPI Pojmi: Kvalifikacija Kompetenca Učni cilji Učni izidi Enote učnih izidov Kreditne točke Programi usposabljanja NE! 2 Učni cilji kompetence

Prikaži več

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v fina UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Katja Ciglar Analiza občutljivosti v Excel-u Seminarska naloga pri predmetu Optimizacija v financah Ljubljana, 2010 1. Klasični pristop k analizi

Prikaži več

Vaja 3 Kopiranje VM in namestitev aplikacij - strežnik SQL 2000 SP3a A. Lokalni strežnik Vmware ESX Dodajanje uporabnikov vajexx v skupino Vaje

Vaja 3 Kopiranje VM in namestitev aplikacij - strežnik SQL 2000 SP3a A. Lokalni strežnik Vmware ESX Dodajanje uporabnikov vajexx v skupino Vaje Vaja 3 Kopiranje VM in namestitev aplikacij - strežnik SQL 2000 SP3a A. Lokalni strežnik Vmware ESX 3.5 1. Dodajanje uporabnikov vajexx v skupino Vaje 2. Kopiranje Win2003 strežnika in registracija na

Prikaži več

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite vzorčne strani iz DELOVNIH LISTOV 1 v štirih delih

Prikaži več

POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u

POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo učbenik in delovni zvezek, ki sta obvezna učna pripomočka

Prikaži več

Microsoft Word - 021_01_13_Pravilnik_o_zakljucnem delu

Microsoft Word - 021_01_13_Pravilnik_o_zakljucnem delu Na podlagi 64. člena Pravil o organizaciji in delovanju Fakultete za humanistične študije, št. 011-01/13 z dne 27. 6. 2013, je Senat Univerze na Primorskem Fakultete za humanistične študije na svoji 4.

Prikaži več

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefonih. Obstaja precej različic, sam pa sem sestavil meni

Prikaži več

Microsoft Word - 13-Selekcijski intervju.docx

Microsoft Word - 13-Selekcijski intervju.docx številka 13, 15. dec.2004, ISSN 1581-6451, urednik:radovan Kragelj Pozdravljeni! Danes nadaljujemo z vprašanji, s katerimi vrednotite konkretne lastnosti in sposobnosti posameznega kandidata. V prejšnjih

Prikaži več

Microsoft Word - Vsebinska_izhodisca_nakupa_knjiznicnega_gradiva.doc

Microsoft Word - Vsebinska_izhodisca_nakupa_knjiznicnega_gradiva.doc VSEBINSKA IZHODIŠČA NAKUPA KNJIŽNIČNEGA GRADIVA Knjižnica v letu 2010 načrtuje 74.993 enot prirasta z nakupom oziroma 6.330 naslovov. V okolju s 325.312 prebivalci je to 231 enot na 1000 prebivalcev. Načrtujemo

Prikaži več

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6. julij 2018 Navodila Pazljivo preberite be Ime in priimek: Vpisna št: FAKULEA ZA MAEMAIKO IN FIZIKO Oddelek za matematiko Statistika Pisni izpit 6 julij 2018 Navodila Pazljivo preberite besedilo naloge, preden se lotite reševanja Za pozitiven rezultat

Prikaži več

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA KATALOG ZNANJA 1. IME PREDMETA ZBIRKE PODATKOV I ZBIRKE PODATKOV II 2. SPLOŠNI CILJI Splošni cilji predmeta so: razvijanje sposobnosti za uporabo znanstvenih metod in sredstev, razvijanje odgovornosti

Prikaži več

Microsoft PowerPoint - krstulovic

Microsoft PowerPoint - krstulovic PROST DOSTOP DO DOSEŽKOV SLOVENSKIH ZNANSTVENIKOV PREK PORTALA dlib.si mag. Karmen Štular Sotošek mag. Zoran Krstulović Daša Pokorn Narodna in univerzitetna knjižnica 3 Uporabniki in prosto dostopne zbirke

Prikaži več

EVRO.dvi

EVRO.dvi Management tehnologije dr. Cene Bavec Management tehnologije postaja v gospodarsko in tehnološko razvitih državah eno temeljnih managerskih znanj. V Sloveniji nimamo visokošolskih in univerzitetnih programov

Prikaži več

Microsoft Word - UP_Lekcija04_2014.docx

Microsoft Word - UP_Lekcija04_2014.docx 4. Zanka while Zanke pri programiranju uporabljamo, kadar moramo stavek ali skupino stavkov izvršiti večkrat zaporedoma. Namesto, da iste (ali podobne) stavke pišemo n-krat, jih napišemo samo enkrat in

Prikaži več

Microsoft Word - 10-Selekcijski intervju _4.del_.docx

Microsoft Word - 10-Selekcijski intervju _4.del_.docx številka 10,27.avg. 2004, ISSN 1581-6451, urednik:radovan Kragelj Pozdravljeni! V prejšnji številki mesečnika smo si ogledali, katera področja moramo vsebinsko obdelati v sklopu delovne zgodovine. V današnji

Prikaži več

Diapozitiv 1

Diapozitiv 1 FOUND POETRY Found poetry se ustvarja, piše z uporabo besedišča iz nepoetičnih kontekstov, ki se uporabi v pesniškem besedilu. Kot temeljno besedilo se lahko uporabijo teksti iz različnih virov: časopisov,

Prikaži več

IZVEDBENI SKLEP KOMISIJE - z dne marca o določitvi meril za ustanavljanje in vrednotenje evropskih referenčnih mrež in

IZVEDBENI  SKLEP  KOMISIJE  -  z  dne marca o  določitvi  meril  za  ustanavljanje  in  vrednotenje  evropskih  referenčnih  mrež  in 17.5.2014 L 147/79 IZVEDBENI SKLEP KOMISIJE z dne 10. marca 2014 o določitvi meril za ustanavljanje in vrednotenje evropskih referenčnih mrež in njihovih članov ter za lažjo izmenjavo informacij in strokovnega

Prikaži več

Microsoft Word - P043-A mod.doc

Microsoft Word - P043-A mod.doc Dr`avni izpitni center *P043A22213* ZIMSKI ROK NEM[^INA NAVODILA ZA OCENJEVANJE ^etrtek, 3. februar 2005 POKLICNA MATURA RIC 2003 2 P043-A222-1-3 IZPITNA POLA 1 1 A: BRALNO RAZUMEVANJE (20) Točke zapisujte

Prikaži več

Osnove matematicne analize 2018/19

Osnove matematicne analize  2018/19 Osnove matematične analize 2018/19 Neža Mramor Kosta Fakulteta za računalništvo in informatiko Univerza v Ljubljani Funkcija je predpis, ki vsakemu elementu x iz definicijskega območja D f R priredi natanko

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev INFORMACIJSKA PISMENOST Tomaž Bešter Center za informacijske storitve NUK 01/2001-200 tomaz.bester@nuk.uni.lj.si Dnevni red Podatek informacija znanje; vrste pismenosti Zakaj je informacijska pismenost

Prikaži več

EVROPSKA PRAVNA FAKULTETA V NOVI GORICI

EVROPSKA PRAVNA FAKULTETA V NOVI GORICI NOVA UNIVERZA, EVROPSKA PRAVNA FAKULTETA - Delpinova ulica 18b, 5000 Nova Gorica - tel: (05) 338-44-00, fax: (05) 338-44-01 - e-pošta: info@evro-pf.si Informativno mesto: - Referat za študijske zadeve,

Prikaži več

ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI Fakulteta za družbene vede Študentska anketa o študiju na III. stopnji Študijsko leto 2017/18 Pripombe, komenta

ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI Fakulteta za družbene vede Študentska anketa o študiju na III. stopnji Študijsko leto 2017/18 Pripombe, komenta ŠTUDENTSKE ANKETE UNIVERZE V LJUBLJANI Študentska anketa o študiju na III. stopnji Študijsko leto 2017/18 Pripombe, komentarje, vprašanja sporočite na http://1ka.si/set Ljubljana, 7. januar 2019 1. Povzetek

Prikaži več

GASILSKA ZVEZA SLOVENIJE Ljubljana, Tržaška cesta , Fax: Št.: GZS-35/2016 D

GASILSKA ZVEZA SLOVENIJE Ljubljana, Tržaška cesta , Fax: Št.: GZS-35/2016 D GASILSKA ZVEZA SLOVENIJE Ljubljana, Tržaška cesta 221 01 241 97 57, 241 97 52 Fax: 01 241 97 64 E-mail: gasilska.zveza-slo@siol.net Št.: GZS-35/2016 Datum: 22.02.2016 Zadeva: PREDLOG PRAVIL GASILSKE SLUŽBE

Prikaži več

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite

Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5. februar 2018 Navodila Pazljivo preberite Ime in priimek: Vpisna št: FAKULTETA ZA MATEMATIKO IN FIZIKO Oddelek za matematiko Verjetnost Pisni izpit 5 februar 018 Navodila Pazljivo preberite besedilo naloge, preden se lotite reševanja Nalog je

Prikaži več

Podatkovni model ER

Podatkovni model ER Podatkovni model Entiteta- Razmerje Iztok Savnik, FAMNIT 2018/19 Pregled: Načrtovanje podatkovnih baz Konceptualno načtrovanje: (ER Model) Kaj so entite in razmerja v aplikacijskem okolju? Katere podatke

Prikaži več

STAVKI _5_

STAVKI _5_ 5. Stavki (Teoremi) Vsebina: Stavek superpozicije, stavek Thévenina in Nortona, maksimalna moč na bremenu (drugič), stavek Tellegena. 1. Stavek superpozicije Ta stavek določa, da lahko poljubno vezje sestavljeno

Prikaži več

Microsoft Word - M doc

Microsoft Word - M doc Državni izpitni center *M11145113* INFORMATIKA SPOMLADANSKI IZPITNI ROK NAVODILA ZA OCENJEVANJE Petek, 10. junij 2011 SPLOŠNA MATURA RIC 2011 2 M111-451-1-3 IZPITNA POLA 1 1. b 2. a 3. Pojem se povezuje

Prikaži več

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to

NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo to NAVADNA (BIVARIATNA) LINEARNA REGRESIJA O regresijski analizi govorimo, kadar želimo opisati povezanost dveh numeričnih spremenljivk. Opravka imamo torej s pari podatkov (x i,y i ), kjer so x i vrednosti

Prikaži več

1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk

1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk 1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatkov in njihov prenos med spletnimi mesti. Obrazec v

Prikaži več

N

N Državni izpitni center *N19141132* 9. razred FIZIKA Ponedeljek, 13. maj 2019 NAVODILA ZA VREDNOTENJE NACIONALNO PREVERJANJE ZNANJA v 9. razredu Državni izpitni center Vse pravice pridržane. 2 N191-411-3-2

Prikaži več

Orodje za izvoz podatkov

Orodje za izvoz podatkov Pomoč uporabnikom -NA-SI-200, V6.13-00 IZUM, 2018 COBISS, COMARC, COBIB, COLIB, IZUM so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod... 1 2 Predstavitev orodja za izvoz podatkov...

Prikaži več

Microsoft Word - Analiza rezultatov NPZ slovenscina 2018.docx

Microsoft Word - Analiza rezultatov NPZ slovenscina 2018.docx OSNOVNA ŠOLA SOSTRO POROČILO O ANALIZI DOSEŽKOV NACIONALNEGA PREVERJANJA ZNANJA IZ SLOVENŠČINE leta 2018 Pripravile učiteljice slovenščine: Renata More, Martina Golob, Petra Aškerc, Katarina Leban Škoda

Prikaži več

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx Analiza dosežkov pri predmetu matematika za NPZ 28 6. razred NPZ matematika 28 Dosežek šole Povprečno število točk v % Državno povprečje Povprečno število točk v % Odstopanje v % 49,55 52,52 2,97 Povprečni

Prikaži več

Document ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov

Document ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov Gospodarski subjekti Definicija: V skladu z 2. členom Izvedbene uredbe Komisije (EU) 2018/574

Prikaži več

EVROPSKA PRAVNA FAKULTETA V NOVI GORICI

EVROPSKA PRAVNA FAKULTETA V NOVI GORICI NOVA UNIVERZA, EVROPSKA PRAVNA FAKULTETA - Delpinova ulica 18b, 5000 Nova Gorica - tel: (05) 338-44-00 - e-pošta: info@epf.nova-uni.si Informativno mesto: - Referat za študijske zadeve, Delpinova ulica

Prikaži več

PowerPoint Presentation

PowerPoint Presentation Napovedno oglaševanje Kombiniranje internih in eksternih podatkov za boljšo učinkovitost oglaševanja Miloš Suša, iprom Andraž Zorko, Valicon Mojca Pesendorfer, Atlantic Grupa Ljubljana, 22.10.2018 PREDIKTIVNO

Prikaži več

Navodila za pripravo oglasov na strani Med.Over.Net v 2.2 Statistično najboljši odziv uporabnikov je na oglase, ki hitro in neposredno prenesejo osnov

Navodila za pripravo oglasov na strani Med.Over.Net v 2.2 Statistično najboljši odziv uporabnikov je na oglase, ki hitro in neposredno prenesejo osnov Navodila za pripravo oglasov na strani Med.Over.Net v 2.2 Statistično najboljši odziv uporabnikov je na oglase, ki hitro in neposredno prenesejo osnovno sporočilo. Izogibajte se daljših besedil in predolgih

Prikaži več

Komisija za Čopove diplome in priznanja pri ZBDS je na svoji seji dne 5

Komisija za Čopove diplome in priznanja pri ZBDS je na svoji seji dne 5 Na podlagi določil 33., 98. in 120. člena Statuta Zveze bibliotekarskih društev Slovenije (v nadaljevanju Zveza) je Občni zbor Zveze na svoji redni seji dne 10. 5. 2011 sprejel PRAVILNIK O PODELJEVANJU

Prikaži več

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije Univerza v Ljubljani Fakulteta za matematiko in fiziko Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije 2. junij 2011 Koncept PSO Motivacija: vedenje organizmov v naravi Ideja: koordinirano

Prikaži več

Spletno raziskovanje

Spletno raziskovanje SPLETNO RAZISKOVANJE RM 2013/14 VRSTE SPLETNEGA RAZISKOVANJA RENKO, 2005 Spletne fokusne skupine Spletni eksperiment Spletno opazovanje Spletni poglobljeni intervjuji Spletna anketa 2 PREDNOSTI SPLETNIH

Prikaži več

Razpis - podiplomski študij

Razpis - podiplomski študij RAZPIS ZA VPIS V MAGISTRSKE ŠTUDIJSKE PROGRAME 2. STOPNJE UNIVERZE NA PRIMORSKEM V ŠTUDIJSKEM LETU 2016/2017 Za vpis v podiplomske magistrske študijske programe 2. stopnje v študijskem letu 2016/2017 Univerza

Prikaži več

predstavitev fakultete za matematiko 2017 A

predstavitev fakultete za matematiko 2017 A ZAKAJ ŠTUDIJ MATEMATIKE? Ker vam je všeč in vam gre dobro od rok! lepa, eksaktna veda, ki ne zastara matematičnoanalitično sklepanje je uporabno povsod matematiki so zaposljivi ZAKAJ V LJUBLJANI? najdaljša

Prikaži več

DN5(Kor).dvi

DN5(Kor).dvi Koreni Število x, ki reši enačbo x n = a, imenujemo n-ti koren števila a in to označimo z n a. Pri tem je n naravno število, a pa poljubno realno število. x = n a x n = a. ( n a ) n = a. ( n a ) m = n

Prikaži več

Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa

Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa znanja slovenskega jezika (Ur. l. RS št. 47/1994),

Prikaži več

PREDLOG ZA AKREDITACIJO

PREDLOG ZA AKREDITACIJO Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS STATISTIČNA ANALIZA PODATKOV Z RAČUNALNIKOM Študijski program in stopnja Study programme and level Tiflopedagogika in pedagogika specifičnih

Prikaži več

7. VAJA A. ENAČBA ZBIRALNE LEČE

7. VAJA A. ENAČBA ZBIRALNE LEČE 7. VAJA A. ENAČBA ZBIRALNE LEČE 1. UVOD Enačbo leče dobimo navadno s pomočjo geometrijskih konstrukcij. V našem primeru bomo do te enačbe prišli eksperimentalno, z merjenjem razdalj a in b. 2. NALOGA Izračunaj

Prikaži več

AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna

AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna vsebina: Ustno seštevanje in odštevanje do 20 sprehodom

Prikaži več

LaTeX slides

LaTeX slides Statistični modeli - interakcija - Milena Kovač 23. november 2007 Biometrija 2007/08 1 Število živorojenih pujskov Biometrija 2007/08 2 Sestavimo model! Vplivi: leto, farma Odvisna spremenljivka: število

Prikaži več

Microsoft PowerPoint - 14 IntrerspecifiOna razmerja .ppt

Microsoft PowerPoint - 14 IntrerspecifiOna razmerja .ppt IV. POPULACIJSKA EKOLOGIJA 14. Interspecifična razmerja Št.l.: 2006/2007 1 1. INTERSPECIFIČNA RAZMERJA Osebki ene vrste so v odnosih z osebki drugih vrst, pri čemer so lahko ti odnosi: nevtralni (0), pozitivni

Prikaži več

ENV2:

ENV2: . Kazalo. KAZALO.... UVOD... 3. ANALIZA POPULACIJE DRŽAV EU...5 4. VSEBINSKE UGOTOVITVE...8 5. LITERATURA... . Uvod Vir podatkov za izdelavo statistične naloge je Eurostat ali Statistični urad Evropske

Prikaži več

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC

Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC Verjetnost in vzorčenje: teoretske porazdelitve standardne napake ocenjevanje parametrov as. dr. Nino RODE prof. dr. Blaž MESEC VERJETNOST osnovni pojmi Poskus: dejanje pri katerem je izid negotov met

Prikaži več

Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah

Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah in Pravili ocenjevanja Gimnazije Novo mesto, veljavnim

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev Dostopnost elektronskih virov za slepe, slabovidne in druge osebe z motnjami branja Kristina Janc ZSSML - 27. Seja TIFLO sekcije 22.3.2012 Možnost izkoriščanja elektronskih virov za slepe, slabovidne in

Prikaži več

Microsoft Word - CN-BTU4 Quick Guide_SI

Microsoft Word - CN-BTU4 Quick Guide_SI Bluetooth Dongle Artikel: CN-BTU4 NAVODILA v1.0 Sistemske zahteve Zahteve za PC: - Proc.: Intel Pentium III 500MHz or above. - Ram: 256MB ali več. - Disk: vsaj 50MB. - OS: Windows 98SE/Me/2000/XP - Prost

Prikaži več

PAST CONTINUOUS Past continuous uporabljamo, ko želimo opisati dogodke, ki so se dogajali v preteklosti. Dogodki so se zaključili v preteklosti in nič

PAST CONTINUOUS Past continuous uporabljamo, ko želimo opisati dogodke, ki so se dogajali v preteklosti. Dogodki so se zaključili v preteklosti in nič PAST CONTNUOUS Past continuous uporabljamo, ko želimo opisati dogodke, ki so se dogajali v preteklosti. Dogodki so se zaključili v preteklosti in nič več ne trajajo. Dogodki so v preteklosti trajali dalj

Prikaži več

POMOČ PREDSTAVITEV EKOSKLADOVNICE UPORABLJENA TERMINOLOGIJA REGISTRACIJA V EKOSKLADOVNICO PRIJAVA V EKOSKLADOVNICO OBJAVA PRISPEVKA ISKANJE PRISPEVKOV

POMOČ PREDSTAVITEV EKOSKLADOVNICE UPORABLJENA TERMINOLOGIJA REGISTRACIJA V EKOSKLADOVNICO PRIJAVA V EKOSKLADOVNICO OBJAVA PRISPEVKA ISKANJE PRISPEVKOV POMOČ PREDSTAVITEV EKOSKLADOVNICE UPORABLJENA TERMINOLOGIJA REGISTRACIJA V EKOSKLADOVNICO PRIJAVA V EKOSKLADOVNICO OBJAVA PRISPEVKA ISKANJE PRISPEVKOV OCENJEVANJE PRISPEVKOV KOMENTIRANJE PRISPEVKOV KONTAKT

Prikaži več

rm.dvi

rm.dvi 1 2 3 4 5 6 7 Ime, priimek Razred 14. DRŽAVNO TEKMOVANJE V RAZVEDRILNI MATEMATIKI NALOGE ZA PETI IN ŠESTI RAZRED OSNOVNE ŠOLE Čas reševanja nalog: 90 minut Točkovanje 1., 2., in 7. naloge je opisano v

Prikaži več

Govorne in slikovne tehnologije

Govorne in slikovne tehnologije Uvod GOVORNE TEHNOLOGIJE prof. dr. France Mihelič PREGLED PREDSTAVITVE Osnovni pojmi Uporaba Zahtevnost raziskovalnega področja Variabilnost govora Razumevanje govora Interdisciplinarnost Govorne podatkovne

Prikaži več

Računalniški praktikum Projektna naloga - Izdelava spletne strani Avtor: Matej Tekavčič Skupina: Matej Tekavčič - koordinator Simon Vrhovnik Tine Kavč

Računalniški praktikum Projektna naloga - Izdelava spletne strani Avtor: Matej Tekavčič Skupina: Matej Tekavčič - koordinator Simon Vrhovnik Tine Kavč Računalniški praktikum Projektna naloga - Izdelava spletne strani Avtor: Matej Tekavčič Skupina: Matej Tekavčič - koordinator Simon Vrhovnik Tine Kavčič Matjaž Jerman 8. februar 2006 Kazalo 1 Uvod 2 2

Prikaži več

VPRAŠALNIK BRALNE MOTIVACIJE ZA MLAJŠE UČENCE –

VPRAŠALNIK BRALNE MOTIVACIJE ZA MLAJŠE UČENCE – PRAŠALNIK BRALNE MOTIACIJE ZA STAREJŠE UČENCE BM-st Pred teboj je vprašalnik o branju. Prosimo te, da nanj odgovoriš tako, kot velja zate. vprašalniku ni pravilnih oz. napačnih odgovorov. Na posamezne

Prikaži več

DELEGIRANA UREDBA KOMISIJE (EU) 2017/ z dne julija o dopolnitvi Direktive 2014/ 65/ EU Evropskega parlamenta in S

DELEGIRANA  UREDBA  KOMISIJE  (EU)  2017/ z dne julija o dopolnitvi  Direktive  2014/  65/  EU  Evropskega  parlamenta  in  S 31.3.2017 L 87/411 DELEGIRANA UREDBA KOMISIJE (EU) 2017/588 z dne 14. julija 2016 o dopolnitvi Direktive 2014/65/EU Evropskega parlamenta in Sveta v zvezi z regulativnimi tehničnimi standardi glede režima

Prikaži več

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo Turingov stroj in programiranje Barbara Strniša 12. 4. 2010 1 Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolov (običajno Σ 2) Σ n = {s 1 s 2... s n ; s i Σ, i =

Prikaži več

08_03

08_03 OBVESTILO O RAZPISU ZA OBLIKOVANJE REZERVNEGA SEZNAMA Naziv delovnega mesta Funkcionalna skupina/razred AD 6 Vrsta pogodbe Sklic Rok za prijavo Kraj zaposlitve Veljavnost rezervnega seznama do Število

Prikaži več

Slajd 1

Slajd 1 REPUBLIKA SLOVENIJA MINISTRSTVO ZA JAVNO UPRAVO 1 EU ENOTNI DIGITALNI PORTAL: PRIHAJA NOVA EU UREDBA Alenka Žužek Nemec, Tina Kuliš DNEVI SLOVENSKE INFORMATIKE 18. april 2018 Ko podjetja ali državljani

Prikaži več