KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: Sprejeto: Izvleček Izvir

Velikost: px
Začni prikazovanje s strani:

Download "KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: Sprejeto: Izvleček Izvir"

Transkripcija

1 KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: Sprejeto: Izvleček Izvirni znanstveni članek UDK : V prispevku so predstavljeni postopki krnjenja in utemeljeni kot najpomembnejša faza priprave besedila za vključevanje v zbirke polnih dokumentov, še posebno take, ki uporabljajo ne-boolove iskalne modele. Krnjenje je postopek obdelave besedil z algoritmi za krnjenje, s katerim avtomatsko določamo indeksne izraze,-primerne za opisovanje vsebine dokumentov. Predstavljen je statistični pristop h krnjenju, morfološki in semantični vidiki krnjenja ter različne vrste algoritmov za krnjenje. Avtorja govorita tudi o kriterijih za evalvacijo algoritmov in njihovi jezikovni odvisnosti. Na koncu podrobneje predstavita nekatere algoritme, ki so bili razviti za posamezne jezike: angleščino, slovenščino, francoščino, japonščino in arabščino. Ključne besede: informacijska znanost, indeksiranje, avtomatsko indeksiranje, avtomatsko krnjenje, algoritmi 1 Prevod angleškega termina Information retrieval, za katerega se v slovenskem prostoru pojavljajo različna poimenovanja, npr. iskanje informacij, iskanje in priklic informacij, itd. Gre za sistematično preiskovanje indeksiranih informacijskih virov z odkrivanjem, izbiranjem in pridobivanjem podatkov, zapisov iz njih. V širšem, v svetu najbolj uveljavljenem pomenu, Information retrieval pomensko vključuje tudi predhodne postopke gradnje zbirke dokumentov, še posebej postopke opisovanja njihove vsebine. VILAR, Polona; Jure, DIMEC: Stemming as a basis for some non-conventional methods of information retrieval. Knjižnica, Ljubljana, 44(2000)4,

2 Knjižnica 44(2000)4 Original scientific article UDC : Abstract The article presents various techniques of stemming, arguing that they are the most important phase in preparing the text for inclusion into full-text databases, especially those using non-boolean search models. Stemming is a process of text processing using stemming algorithms, the purpose of which is an automated selection of indexing terms used for content description. The article presents a statistic approach to stemming, morphological and semantical aspects of stemming, and several stemming algorithms. The authors also speak about evaluation criteria and linguistic dependence of such algorithms. At the end, they give more detailed descriptions of some stemming algorithms developed for English, Slovene, French, Japanese and Arabic languages. Keywords: information science, indexing, automatic indexing, stemming, algorithms 1 Poizvedovanje Sistemi za poizvedovanje so se pojavili kot pomoč pri obvladovanju ogromnega korpusa znanstvene literature, ki se je še posebej intenzivno pričel razvijati po letu Namen sistema za poizvedovanje je usklajevanje iskalnih zahtev 2 - ubesedenih informacijskih potreb uporabnikov - z zapisi v podatkovni zbirki. S tem usklajevanjem sistem za poizvedovanje posreduje reference na knjige, članke, časopise ter druge dokumente in informacije, lahko tudi v elektronski obliki. V našem okolju gre skoraj izključno za poizvedovanje v besedilnih podatkovnih zbirkah. Dokumenti so lahko shranjeni v polnem obsegu ali pa v okrnjeni obliki, npr. kot bibliografski zapisi. Take okrnjene oblike so bile v preteklosti sicer namenjene zmanjševanju obsega podatkovnih zbirk in skrajševanju iskalnega časa, vendar slednje danes spričo razvoja podatkovnih zbirk s popolnimi dokumenti nima več tolikšnega pomena. 1.1 Boolovi in ne-boolovi načini poizvedovanja Veliko današnjih sistemov za poizvedovanje deluje po principu Boolovega iskanja ali iskanja vzorcev v besedilu, ki ju uvrščamo med metode s popolnim uje- 2 Iskalne zahteve sestavljajo iskalni izrazi. Iskalni izrazje lahko ime avtorja, leto izida dokumenta, kadar pa gre za vsebino dokumenta, so to ključne besede, gesla oziroma deskriptorji, ali kakšni drugi izrazi, ki opisujejo vsebino. O njih bo več govora v nadaljevanju. 8

3 Vilar, R; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja manjem. Boolova algebra omogoča zelo natančno definiranje iskalnih zahtev in tudi jasno razmeji množico dokumentov v podatkovni zbirki na dva dela. V prvem so dokumenti, ki se ujemajo z iskalno zahtevo, v drugem pa dokumenti, ki se z iskalno zahtevo ne ujemajo, vendar niso nujno nerelevantni glede na uporabnikovo informacijsko potrebo. Boolov pristop zahteva dobro poznavanje tako sintakse iskalne zahteve kot tudi same podatkovne zbirke. Uporabnik je soočen z veliko množico poiskanih dokumentov, ki niso razvrščeni po relevantnosti (Dimec, 1995). V taki situaciji je velikokrat nujno potrebna pomoč informacijskega specialista. Sistemi za poizvedovanje, ki delujejo po načelu najboljšega oziroma najbližjega ujemanja, poskušajo preseči omejitve Boolovega pristopa. Prav tako poskušajo dati uporabnikom več samostojnosti pri poizvedovanju. Ugotavljajo relativno relevantnost dokumentov glede na iskalno zahtevo. Dokumenti torej niso razdeljeni na dve množici. Rezultat poizvedovanja je rangiran seznam - zapisi, razvrščeni po padajoči relevantnosti. Uporabnik najprej vidi zapise, za katere sistem presodi, da najbolj ustrezajo iskalni zahtevi. Če sistem to omogoča, lahko uporabnik nato prispeva svojo presojo relevantnosti manjšega števila najvišje razvrščenih zapisov, kar sistem uporabi za preoblikovanje, dograditev prvotne ali oblikovanje nove iskalne zahteve. To imenujemo poizvedovanje s povratno zanko. Ne-Boolove metode vključujejo različne pristope računanja relevantnosti (verjetnostne metode, metode vektorskega prostora) in prezentacije zadetkov (rangiranje). Uporabljajo vrsto metod, med katere sodijo lingvistične in statistične metode avtomatskega indeksiranja (zlivanje besed, izračunavanje koeficientov podobnosti med dokumenti, tehtanje (ponderiranje) ujemanja dokumentov in iskalnih zahtev) kot tudi kombinacije Boolovega iskanja in načela najboljšega ujemanja. Opisane metode v svoji osnovni obliki razumejo relevantnost kot ujemanje vsebine dokumenta in iskalne zahteve (načelo najboljšega ujemanja), poizvedovanje s povratno zanko pa deloma vpelje tudi uporabnikovo subjektivno razumevanje relevantnosti. 2 Opisovanje vsebine dokumentov 2.1 Ročno in avtomatsko indeksiranje Indeksiranje je postopek opisovanja vsebine dokumentov, bodisi z besedami, ki se pojavljajo v njih samih (ključne besede), bodisi iz zunanjih virov (navadno 9

4 Knjižnica 44(2000)4 so to kontrolirani seznami gesel oziroma deskriptorjev). Namen indeksiranja je dobiti seznam besed ali fraz, ki opisujejo vsebino dokumentov na najkrajši in hkrati najbolj izčrpen način. Take besede oziroma predstavnike dokumentov je mogoče dobiti na dva načina, "ročno" in avtomatsko. "Ročno", ali bolje "intelektualno" indeksiranje izvaja človek, praviloma izšolan informacijski delavec, oziroma dokumentalist, ki mora biti hkrati tudi strokovnjak za določeno področje. Izvaja lahko besedno oziroma derivativno ali pa konceptualno oziroma pripisovalno indeksiranje. Pri prvem izbira predstavnike vsebine iz besedišča samega dokumenta, pri drugem pa dokumentu pripisuje indeksne izraze iz vnaprej predpisanega seznama. Ročno indeksiranje je zahteven in drag proces. Popovič (1990) opozarja na nekaj temeljnih zahtev, ki pogojujejo učinkovito ročno indeksiranje, kot so temeljito poznavanje področja; razpoložljivost številnih in kvalitetnih pripomočkov, kot npr. tezaver; konsistentnost pri določanju gesel, izobrazba, znanje, izkušnje. Velika pomanjkljivost ročnega indeksiranja je prav konsistentnost, ki jo je v resnici dobesedno nemogoče zagotoviti, kakor hitro izvaja indeksiranje več kot en dokumentalist. Poleg tega tudi posamezen dokumentalist ne more biti vedno konsistenten. Uporaba informacij skega jezika in kontroliranega besednjaka prinaša še dodatne težave. Te občuti predvsem uporabnik, ki težje dela samostojno, še zlasti, če je neizkušen. V takšnih postopkih poizvedovanja mora biti prisoten tudi informacijski posrednik. Ta deluje kot posrednik med uporabnikom in sistemom in "prevede" uporabnikovo informacijsko zahtevo v poizvedbo. Ročno indeksiranje ima tudi nekaj prednosti, npr. predvidljivost in jezikovno neodvisnost. Avtomatsko indeksiranje je ena najpogostejših tehnik obdelave dokumentov na področju poizvedovanja (information retrieval, IR). Izvaja ga računalnik na podlagi vnaprej določenih pravil. Je proces algoritmične obdelave besedil z namenom določanja seznama indeksnih izrazov. Sodi med derivativne metode, saj indeksni izrazi izvirajo iz dokumenta. Prednosti, ki jih ponuja avtomatsko indeksiranje, so odprava nekaterih že omenjenih pomanjkljivosti, ki jih ima ročno indeksiranje, zmanjševanje stroškov in količine intelektualnega dela, predvsem pa večja hitrost. Poleg tega se tudi poizvedovanje lahko opravlja v naravnem jeziku in ne z uporabo Boolovih logičnih operatorjev (Popovič, 1990). Treba je sicer priznati, da dejansko poizvedovanje sicer poteka po načelih Boolove logike, uporabnik pa tega ne zazna, ker lahko pri tvorjenju iskalnih zahtev uporablja naravni jezik. Med pomanjkljivostmi moramo sicer izpostaviti, da med indeksnimi izrazi ni nobenih semantičnih povezav in da so tovrstni postopki (vsaj zaenkrat) izrazito jezikovno odvisni. Zato, da proces avtomatskega indeksiranja da dobre rezultate, je potrebno opraviti nekaj postopkov: 1. avtomatsko analizo besedila dokumenta (naslov, povzetek ali celotno besedilo), določanje potencialnih kandidatov za gesla (postopek imenujemo tudi leksikalna analiza), 10

5 Vilar, P.; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja 2. primerjavo kandidatov za gesla s t.i. seznamom blokiranih besed, oziroma negativnim slovarjem (v njem so besede, ki v besedilu nosijo zelo malo ali nič pomena), 3. izbor gesel, ki predstavljajo vsebino dokumenta, 4. poenotenje morfoloških različic izrazov, ki so bili izbrani za gesla, in na ta način zlitje besed v enotno obliko, 5. določanje relativne pomembnosti posameznih gesel (postopek, ki se običajno izvrši med poizvedovanjem). 2.2 Lingvistični in statistični pristop Poznamo dva osnovna pristopa k avtomatskemu izboru gesel: lingvistični in statistični pristop. Prvi temelji na semantičnih in sintaktičnih metodah, drugi pa na pogostosti pojavljanja besed v besedilu (Popovič, 1990). Prvotne tehnike indeksiranja - ročno indeksiranje - temeljijo na podrobni analizi in interpretaciji besedila, bodisi dokumenta bodisi iskalne zahteve, ki ga izvede človek. Indeksni izrazi ne izvirajo nujno neposredno iz opisanega dokumenta. Tudi prvi poskusi avtomatskega indeksiranja - izbiranja indeksnih izrazov - so izhajali iz lingvistične analize besedila, niso pa prinesli kdove kakšnega uspeha. Razloge lahko iščemo v kompleksnosti oblikoslovja naravnega jezika, še bolj pa verjetno v semantiki, kajti razumevanje pomena besed je pogosto pogojeno z razumevanjem konteksta. Pokazalo se je, da metode za analizo besednih zvez in fraz ne dajejo pričakovanega učinka in da se veliko bolje obnesejo preproste tehnike za izdvajanje ključnih besed (Popovič, 1990). Iz tega razloga se je raziskovanje usmerilo v statistične metode avtomatičnega izbiranja izrazov, merjenje sorodnosti dokumentov v podatkovni zbirki in izračunavanje povedne moči posameznih besed v dokumentih. Raziskovalci izhajajo iz hipoteze, da je frekvenca posameznih izrazov v besedilu v korelaciji s pomembnostjo teh besed kot predstavnikov vsebine (Popovič, 1990). 2.3 Seznami blokiranih besed V besedilu pa niso vse besede enako pomembne. V njem se nahaja tudi cela vrsta besed, ki nosijo zelo malo ali celo nič vsebine. To so takoimenovane funkcijske besede, števniki in povezovalni izrazi. Dokazano je, da gre za najštevilnejše besede, imajo pa tudi zelo enakomerno porazdelitev med dokumenti v zbirki (Dimec, 1995). Takšne besede, rečemo jim blokirane besede (angl. stop words, negative words) so iz procesa indeksiranja izključene na podlagi 11

6 Knjižnica 44(2000)4 postopka blokiranja. Obseg invertirane datoteke se po opravljenem blokiranju zmanjša za 40-50% (Popovič, 1990). Poznamo tudi pogojno blokira-nje, ki je vezano na strokovne podjezike. Gre za izločanje besed, ki v splošnem jeziku sicer imajo pomen, v strokovnem podjeziku pa se pojavljajo zelo pogosto in je zato njihov pomen manjši ali celo zanemarljiv (na področju bibliotekarstva je lahko npr. taka beseda knjižnica). 3 Zlivanje besed 3.1 Morfologija in semantika Odnosi med iskalnimi zahtevami in dokumenti v podatkovni zbirki so določeni pretežno s številom in pogostostjo izrazov, ki so jim skupni. Ker je jezik živa tvorba in nanj vplivajo slovnične zakonitosti, obstajajo za isti semantični pomen različne oblike besed. Imenujemo jih morfološke oziroma oblikoslovne različice, nastajajo pa z dodajanjem najrazličnejših končnic, pripon ali predpon, ki bodisi spreminjajo besedno vrsto, spol, sklon, sklanjatev, spregatev bodisi katero drugo karakteristiko posamezne besede. Takšne težave so rešljive z uporabo krnjenja z morfološko analizo. Morfologija, imenujemo jo tudi oblikoslovje, je veja jezikoslovja, ki se ukvarja s strukturo besed. Proučuje načine pregibanja in tvorbe besed. Predmet njenega proučevanja so jezikovni procesi, pregibanje, izpeljava in zlaganje 3. Rezultat vseh teh procesov so besede, ki jih najdemo v naravnem jeziku. V nasprotju z jezikoslovjem, ki različne besedne vrste, izpeljanke, zloženke in podobno obravnava ločeno, je za proces poizvedovanja bistvenega pomena semantična interpretacija besed. Morfološke različice, ki so posledica obnašanja naravnega jezika, v procesu poizvedovanja predstavljajo oviro, kajti z vidika semantike jih lahko obravnavamo kot sinonime. Iskalni algoritmi bi morfološke različice seveda prepoznali kot različne besede, zato je za besedila v naravnem jeziku potrebno vsaj minimalno procesiranje (npr. odstranjevanje množinskih 3 Pregibanje je proces dodajanja pon oziroma afiksov (predpon ali pripon) oziroma spreminjanje korena besed z namenom določanja njihovih različnih sintaktičnih vlog brez spremembe besedne vrste (npr. sklanjanje samostalnikov in pridevnikov, spreganje glagolov), izpeljava je proces dodajanja pon ali spreminjanja oblike korena besed, ki spreminjajo besedno vrsto (npr. oblikoslov-je, oblikoslov-ni), zlaganje je sestavljanje dveh ali več korenov ali besed, pri čemer ima novotvorjena beseda popolnoma drugačen pomen kot njeni sestavni deli (npr. dobrosrčen). 12

7 Vilar, P; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja končnic). Njegov končni cilj je "očistiti" besedilo morfoloških različic oziroma jih poenotiti - njihovo število zmanjšati tako, da jih zreduciramo na koren, ki je sicer dejanski nosilec pomena besede. Velikokrat se zgodi, da preostanek ne ustreza korenu v jezikoslovnem pomenu, zato namesto tega izraza uporabljamo izraz krn. Takšnemu postopku pravimo zlivanje besed (angl. conflation). Z njim dosežemo večjo učinkovitost poizvedovanja, hkrati pa še dodatno zmanjšamo obseg invertiranih indeksnih datotek. Največ pozornosti se posveča odstranjevanju končnic. Podobne postopke bi sicer lahko razvijali tudi za predpone, obstajajo pa dvomi o smotrnosti takega ravnanja (Hull, 1996). 3.2 Zlivanje in krnjenje besed Že leta 1968 je Salton (cv: Dimec, 1995) prišel do zaključka, da zelo podobne rezultate, ali celo boljše kot izrazi, dobljeni z ročnim indeksiranjem, dajejo tudi krnjene ključne besede. Izkušen iskalec lahko doseže zelo natančen rezultat poizvedovanja že s kombiniranjem Boolove algebre in ročnega desnega krnjenja. Avtomatske tehnike, ki se ukvarjajo s posameznimi izrazi v podatkovni zbirki ali iskalni zahtevi, pa uporabljajo krnjenje, tehtanje, sezname blokiranih besed in podobno. Krnjenje povzroči "zlivanje" 4 oziroma združevanje pomensko sorodnih, a različnih besed v enotno obliko. Lahko se izvaja ročno ali avtomatsko. Ročno krnjenje imenujemo tudi ročni odrez. Navadno se izvaja v fazi iskanja, ponavadi z desnim krnjenjem, ki je lahko nastavljeno kot privzeta vrednost, a ga pogosteje izvaja iskalec. Za avtomatsko krnjenje pa se uporabljajo algoritmi. V nasprotju z ročnim se avtomatsko krnjenje ne izvaja v fazi iskanja, torej v iskalni zahtevi, temveč v samih dokumentih, ki sestavljajo podatkovno zbirko. 4 Krnjenje Danes obstaja veliko število algoritmov za krnjenje, ki so jih razvijali prav z namenom poenotenja oblikoslovnih različic. Vključujejo številne metode, med drugim odstranjevanje končnic, segmentacijo besed, ujemanje parov ali trojic sosednjih črk, jezikoslovno morfologijo in druge. 4 V nekaterih člankih (glej npr. Popovič, 1990) se besedi krnjenje (angl. stemming) in zlivanje (angl. conflation) uporabljata kot podrejeni in nadrejeni izraz - krnjenje naj bi sodilo med postopke zlivanja besed. V tem besedilu sta se avtorja odločila za pomensko razlikovanje: krnjenje je postopek, zlivanje pa posledica. 13

8 Knjižnica 44(2000)4 Samo krnjenje ima lahko več funkcij. Nanj lahko gledamo kot na mehanizem za razširitev iskalne zahteve, v smislu, da sistem uporabi iskalne izraze, ki niso dobesedne oblike, kot jih je uporabil iskalec - v tem smislu bi lahko krnjenje primerjali z uporabo kontroliranega slovarja. Prav tako lahko rečemo, da krnjenje pomeni postopek normiranja pojmov v podatkovni zbirki. V iskalni zahtevi imamo običajno le eno oblikoslovno različico iste besede, v zbirki pa mnogo, ki jih poskušamo zliti na isti krn. Pravila, ki določajo, katere oblike so sorodne, katere pa ne, imenujemo inference 5. Na krnjenje lahko gledamo tudi kot na združevanje v skupine, saj združuje besede z enakimi pomeni v šope (clusters), seveda določene po posebnih pravilih v postopkih odstranjevanja nebistvenih delov besed. Prvi algoritmi so bili razviti za angleški jezik, ki glede morfološke strukture ne sodi med najbolj zapletene jezike. Tudi največ študij se iz razumljivih razlogov ukvarja z besedili v angleškem jeziku. Seveda pa obstajajo tudi poskusi razvijanja algoritmov za druge, celo neindoevropske jezike. Frakes in Baeza-Yates (1992) delita algoritme za krnjenje glede na postopke delovanja na "odstranjevalce pon", algoritme za ugotavljanje pestrosti nadaljevanja, algoritme, ki ugotavljajo ujemanje parov ali trojic sosednjih črk, in take, ki delujejo na podlagi predhodno v tabele shranjenih izrazov in njihovih krnov. Avtorja prispevka predlagata delitev na: 1. algoritme, ki zlivajo besede na osnovi soodvisnosti črk v besedi, 2. algoritme, ki združujejo semantično sorodne besede v šope na osnovi njihove statistične sorodnosti, 3. algoritme, ki zlivajo besede z odstranjevanjem pon, in 4. algoritme, ki pri zlivanju uporabljajo slovarje. 4.1 Vrste in delovanje algoritmov Pestrost nadaljevanja Tovrstni algoritmi sodijo v skupino, ki deluje na osnovi soodvisnosti črk, njihova osnova pa je strukturalno jezikoslovje. Strukturalni jezikoslovci poskušajo ugotavljati meje besed in morfemov na podlagi porazdelitve fonemov 6 v govorjenem jeziku oziroma fonetičnih zapisih govora. Podobnost med 5 S pomočjo inferenčnih pravil sklepamo, ali določen izraz sodi v množico sorodnih izrazov ali ne. 6 Fonemi so najmanjši sestavni deli besed, pravzaprav glasovi kot nosilci pomenskega razlikovanja. Sestavljajo morfeme, ti pa so najmanjši deli besed, ki nosijo pomen. Poznamo končniške, korenske, priponske morfeme. Besedo Lipica npr. sestavljajo trije morfemi (lip-ic-a) in šest fonemov. 14

9 Vilar, P.; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja strukturalnim jezikoslovjem in krnjenjem je v tem, da krnjenje namesto fonemov uporablja črke, namesto govora pa zbirko besedil. Pestrost nadaljevanja je torej število različnih črk, ki v besedah iz zbirke, ki imajo enako začetno zaporedje črk, lahko sledijo na mestu za tem zaporedjem. "Algoritem na temelju izpeljave Shannonove teorije informacije trdi, da posamezne črke v besedi ne nastopajo naključno, ampak so verjetnosti njihovega pojavljanja vezane na črke, ki stojijo v besedi pred njimi. Algoritem črko za črko (od leve proti desni) primerja vse besede v zbirki in na vsaki poziciji i ugotavlja za vse besede, ki se ujemajo na vseh pozicijah od 1 do i, koliko možnih nadaljevanj n kažejo besede v zbirki. Strukturalno jezikoslovje, na katerem temelji algoritem, trdi, da se v vsaki besedi n manjša z naraščajem i vse do začetka naslednjega segmenta, ko spet naraste. Segmenti besede so lahko predpona, krn ali končnica. Na temelju variabilnosti števila možnih nadaljevanj n algoritem pestrosti nadaljevanja identificira meje segmentov besede, v skladu z dodatnimi pravili pa med temi segmenti določi krn" (Dimec, 1995, str. 10). Namen raziskovalcev, ki so razvijali tovrstne algoritme, je bil ustvariti programe, ki ne potrebujejo človekovih posegov - v nasprotju z "odstranjevalci pon", pri katerih je potrebna ročna priprava seznamov končnic in pravil za njihovo odstranjevanje ter ponavadi tudi določeni posegi administratorja med delovanjem algoritma Ujemanje parov ali trojic sosednjih črk (n-gramov) Tako imenovani n-gram algoritmi spadajo v skupino, ki združuje besede v šope. Gre za izračunavanje podobnosti besed na osnovi ujemanja parov ali trojic sosednjih črk. Pravzaprav rezultat te metode niso krni, zato ga strogo gledano ne moremo uvrstiti med metode za krnjenje, vendar pa algoritem združuje besede v šope na osnovi izračuna njihove podobnosti oziroma nadomesti določeno besedo s šopom, v katerega ta spada Odstranjevanje končnic Brez dvoma je to najpogostejša metoda avtomatskega indeksiranja. Tudi tu obstaja nekaj pristopov. Najenostavnejši med njimi je odstranjevanje množinskih končnic (v angleščini pretežno -s) in "časovnih" končnic glagolov (-s, -ed, -ing), zahtevnejši postopki pa odstranjujejo tudi pripone za izpeljavo (npr. - ize, -ably in -ship). Večina algoritmov deluje po načelu ujemanja najdaljše končnice. Tak algoritem ob upoštevanju vrste pravil s konca besede odstrani najdaljše mogoče zaporedje znakov. Poznamo tudi iterativne algoritme, ki delujejo v korakih in uporabljajo sezname možnih delov sestavljenih končnic. V zaporednih korakih od desne proti levi odstranjujejo dele končnice, "pripete" k besedi. 15

10 Knjižnica 44(2000)4 Večina algoritmov ima še kontrolne mehanizme kvantitativne (pri odstranitvi določene končnice mora ostati minimalna dolžina krna) in kvalitativne narave (končnica mora zadostiti določenim kriterijem, npr. če zaporedje znakov ne ustreza določenemu vzorcu, se je ne sme uporabiti). Lahko so dodana tudi pravila za ponovno kodiranje oziroma popravljanje krna, s katerimi spremenimo dobljene krne in še izboljšamo zlivanje (npr. beseda želodec po opravljenem krnjenju ostane kot želod), enako se zgodi z besedama želodca in želodčnih, nikakor pa ne z besedo želod), ter pravila za popravljanje izjem, ki jih ne zajame nobeno od že uporabljenih pravil. 4.2 Kvaliteta algoritmov za krnjenje Kriteriji za kvaliteto algoritma so - sposobnost zmanjševanja obsega datotek, - učinkovitost poizvedovanja, - pravilno delovanje (Frakes, 1992). Eden od ciljev krnjenja, ki pa izgublja pomen, je tudi zmanjševanje besedne mase dokumenta v indeksnih datotekah zbirke. Prvič se število besed zmanjša že po opravljenem postopku blokiranja, drugič pa po opravljenem krnjenju. Torej potem, ko se različnim besedam pripiše določen krn, ki nadomesti vsako izmed teh besed, oziroma zastopa celotno množico. Učinkovitost poizvedovanja se navadno meri s priklicem in natančnostjo, hitrostjo delovanja, obsegom, dolžino oziroma kompleksnostjo algoritma in podobno. Velikega pomena je tudi pravilnost delovanja. Odstranjevanje nebistvenih delov besed ima namreč nekatere pomanjkljivosti, katerim se je v določeni meri nemogoče izogniti. Pogoste težave, povezane z njim, so na eni strani pretirano krnjenje (angl. overstemming) in na drugi premalo natančno krnjenje (angl. understemming). Pri prvem pride do pojava, da algoritem odstrani prevelik del besede, s tem besede različnih pomenov zreducira na isti krn in povzroči, da se kot rezultat iskalne zahteve pojavijo nerelevantni dokumenti. Primer sta besedi želodec in želod. Na prvi pogled se zdi, da je za želodec in njegove morfološke različice najustreznejši krn želod. Ta pa je hkrati tudi najustreznejši krn za želod in njemu pripadajoče morfološke različice. Rezultat iskalne zahteve bi v tem primeru vseboval tako dokumente, povezane z želodcem, kot tudi tiste, povezane z želodom, kljub temu, da uporabnika zanima npr. le prvo. Zato je najprimernejše, da krn želod pripišemo le eni izmed skupin, drugi pa določimo drugačnega, v tem primeru želode. 16

11 Vilar, P; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja Nasprotno pa premalo natančno krnjenje pomeni, da v zbirki ostanejo različne oblike besede z enakim semantičnim pomenom in zato relevantni dokumenti ostanejo nepoiskani. Primer sta potencialna krna želode in želode. Oba sta rezultat krnjenja besed iz dokumentov, ki govorijo o želodcu, le da za drugega nismo uporabili pravil za popravljanje krna. Posledica iskalne zahteve, ki vsebuje samo enega izmed njiju, so nepoiskani dokumenti, v katerih se nahaja drugi, kljub temu, da sodijo med relevantne. Evalvacija kvalitete krnjenja običajno poteka posredno, z metodami in merami, ki jih sicer uporabljamo za merjenje učinkovitosti kompletnih iskalnikov. Razlike med rezultati iskanja z dvema iskalnikoma (ali dvema algoritmoma za krnjenje pri istem iskalniku) prikažemo kot razlike v povprečjih meritev natančnosti pri vnaprej določenih vrednostih priklica za večje število iskalnih zahtev. Na tak način primerjamo celotne množice zadetkov in med večino algoritmov za krnjenje angleščine so razlike zelo majhne. Kritiki te metodologije trdijo, da tako posredno merjenje zabriše razlike v razvrstitvi relevantnih dokumentov znotraj poiskane množice. Pri različnih kvalitetah krnjenja so lahko mere priklica in natančnosti zelo podobne, kljub temu pa se izračuni relevantnosti posameznih dokumentov lahko občutno razlikujejo. Boljše krnjenje lahko povzroči, da bodo kot najrelevantnejši uvrščeni čisto drugi dokumenti, kar ima lahko močan vpliv na zadovoljstvo iskalca. Paice (1994) ter Fuller in Zobel (1998) med drugimi predlagajo neposrednejše metode razlikovanja uspešnosti algoritmov za krnjenje. Njihov skupni imenovalec je primerjanje skupin besed, ki jih algoritmi za krnjenje zlijejo v isti krn. Fuller in Zobel primerjata najbolj znane algoritme za angleščino glede na število različnih besed in besednih oblik, zlitih v isti krn; glede na število pravilnih in napačnih zlivanj med njimi ter glede na število besed in besednih oblik, ki bi morale biti zlite, pa algoritmom to ni uspelo. Pristop je intuitivno privlačen, njegova pomanjkljivost pa je velika količina intelektualnega dela, potrebnega za ročno zlivanje besed testnih korpusov, kar predstavlja referenčno vrednost za primerjanje algoritemskih postopkov. Obstaja precej študij, v katerih se avtorji sprašujejo, ali proces krnjenja sploh bistveno vpliva na uspešnost poizvedovanja. Potrebno je opozoriti, da govorimo o algoritmih za angleški jezik, ki jih je daleč največ. Frakes (1992) npr. omenja, da je nedokazano, ali krnjenje sploh pomaga pri poizvedovanju. Večinoma pozitivno vpliva na učinkovitost poizvedovanja, hkrati tudi ni poročil, da bi bil vpliv negativen. Je podobno učinkovito kot ročno zlivanje besed. Učinek krnjenja je odvisen od narave uporabljenega besedišča - specifično in homogeno besedišče se v procesu krnjenja obnaša drugače kot drugi tipi besedišča. Med različnimi algoritmi ni bistvenih razlik glede na njihovo učinkovitost. Ni pa nobenih dokazov, da bi relativno kvaliteten algoritem kakorkoli kvarno vplival na uspešnost poizvedovanja. Drugi (Krovetz, 1993) spet omenjajo, da je krnjenje 17

12 Knjižnica 44(2000)4 učinkovito le, kadar so tako iskalne zahteve kot tudi dokumenti zelo kratki, v primeru dolgih dokumentov in iskalnih zahtev ima le skromen učinek. V študiji Davida A. Hull-a (1996) so primerjali pet različnih algoritmov za krnjenje - dva, vključena v sistem SMART, ki sta pravzaprav zelo prirejeni verziji Lovinsinega algoritma, Porterjev 7 in dva malo prirejena algoritma, razvita pri podjetju Xerox (za pregibanje in izpeljavo) - ter neuporabo krnjenja pri poizvedovanju. Ugotavljajo, da daje pri poizvedovanju večina algoritmov za krnjenje za 4-6% boljše rezultate kot poizvedovanje brez krnjenja, kar pa ne pomeni bistvenega vpliva. Prav tako ugotavljajo, da med različnimi algoritmi obstajajo le zanemarljive razlike pri njihovem vplivu na uspešnost poizvedovanja. Uporabili so dva tipa iskalnih zahtev, dolge in kratke. Ugotavljajo, da krajšanje iskalne zahteve izrazito negativno vpliva na uspešnost poizvedovanja. Xerox-ov algoritem za pregibanje kaže malo manjšo učinkovitost pri kratkih iskalnih zahtevah, Porterjev pa malo prekaša ostale. Pomembna je tudi ugotovitev, da pri dobro oblikovani iskalni zahtevi in če uporabnik potrebuje le nekaj dokumentov, krnjenje ne predstavlja nobene prednosti. Če povzamemo: Algoritmi za krnjenje angleškega jezika so brez dvoma mehanizmi, s katerimi izboljšamo priklic sistema za poizvedovanje, ker omogočajo več zadetkov za vsak iskalni izraz. Krnjenje je nekoliko bolj učinkovito pri kratkih iskalnih zahtevah in še bolj kadar so kratki tudi dokumenti v podatkovni zbirki. V daljših dokumentih je namreč večja verjetnost, da se bo pojavila ravno tista morfološka oblika, ki jo je iskalec uporabil v iskalni zahtevi. Kompleksnejši algoritmi, ki vsebujejo več pravil in pogojev, dajejo boljše rezultate kot preprosto odstranjevanje množinskih končnic, vendar pa med posameznimi primeri ni bistvenih razlik. Odstranjevanje predpon, v nasprotju s priponami, ni učinkovito. Predpone namreč večinoma spreminjajo pomen besed, ne samo slovnične značilnosti (npr. znan - neznan). Tukaj torej ne gre za morfološke različice, temveč besede z različnimi pomeni, ki jih ne smemo zreducirati na isti krn. Velikokrat se omenja tudi jezikovna korektnost. Izrazi, ki jih "proizvedejo" tovrstni algoritmi, zelo pogosto niso prave besede ali koreni v jezikoslovnem smislu, zato so seveda neuporabni za karkoli drugega kot poizvedovanje. Iterativne tehnike, ki vključujejo sodelovanje uporabnika in se odvijajo v povratnih zankah 8, so zanj zelo zahtevne, če mora delati z umetno proizvedenimi krni besed, namesto s pravimi besedami. Prav tako je otežkočeno morebitno iskanje besed v slovarju. Kadar imamo npr. opravka z večjezičnim sistemom za poizvedovanje, je zelo pomembno, da je mogoče iskalno zahtevo čim 7 Gl. poglavje Uporabnik mora npr. izbrati ustrezen iskalni izraz izmed ponujenih, preoblikovati ali razširiti iskalno zahtevo, ipd., in nato ponovno sprožiti proces iskanja. 18

13 Vilar, P.; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja preprosteje avtomatsko prevesti v drugi jezik. To pomeni, da mora biti sistem sposoben poiskati vsako besedo v prevajalnem slovarju. 4.3 Jezikovna odvisnost in vpliv morfologije jezika na učinkovitost krnjenja Različne oblike besed, ki so posledica morfologije jezika, lahko bistveno vplivajo na uspešnost poizvedovanja. Zato je potrebno pri načrtovanju sistema za poizvedovanje po polnih besedilih nujno upoštevati tudi obnašanje naravnega jezika, katerega posledica so med drugim morfološke različice. Prav tako je pomembna jezikovna odvisnost tovrstnih algoritmov, ki vključuje nacionalno rabo jezika in njegovo profesionalno terminologijo (Popovič, 1990). To v praksi pomeni, da obstajajo znotraj določenega jezika tudi "podjeziki", vezani na določeno strokovno ali znanstveno področje. Zanje je značilna specifična terminologija, od katere je seveda odvisno tudi delovanje algoritma. Pri jezikih z zapleteno morfološko strukturo, primer je slovenščina, je situacija, ki zadeva krnjenje, precej drugačna. Popovič in VVillett (1992) npr. omenjata, da uporaba primernega algoritma za krnjenje, če jo primerjamo z ne-krnjenimi besedili, rezultira v občutnem in statistično pomembnem porastu učinkovitosti poizvedovanja, podobno velja za ročno desno krnjenje. Primerjava avtomatskega krnjenja angleških in slovenskih verzij istih dokumentov in iskalnih zahtev pokaže, da je učinkovitost algoritma za krnjenje veliko večja pri morfološko zahtevnejšem jeziku, v tem primeru slovenščini. Vendar pa Dimec in soavtorji (Dimec et. al., 1999) opozarjajo, da veliko število pravil, ki so potrebna pri modeliranju morfološko zahtevnih jezikov, lahko vodi k pretiranemu krnjenju, ki povzroči padec natančnosti. Zanimivo je, da se za nemščino, za katero so značilne mnoge zloženke, pravzaprav ne da uporabiti tehnik krnjenja, razvitih za angleščino, dobre rezultate pa daje morfološka segmentacija besed (Popovič, 1990), v nasprotju z večino jezikov je uporabno tudi odstranjevanje prednjih delov besed. 4.4 Angleški jezik Omenili smo že, da začetniki avtomatskega indeksiranja prihajajo iz anglosaškega sveta, saj se daleč največ algoritmov in študij ukvarja z besedili v angleškem jeziku. V tem poglavju na kratko predstavljamo nekatere od njih. Dva najpogosteje omenjena algoritma sta Lovinsin (1968) in Porterjev (1980), omenili pa bomo še nekatere druge. 19

14 Knjižnica 44(2000)4 Enega prvih algoritmov za krnjenje nasploh je sestavila J. B. Lovins že leta 1968 (cv: Popovič, 1991). Temelji na principu najdaljšega ujemanja in je kontekstno odvisen 9. Deluje na podlagi seznama 260-ih končnic. Ima 29 kontekstno odvisnih pravil in 34 pravil za popravljanje krnov. Lovinsin algoritem je osnova za mnoge, ki so se pojavili kasneje, npr. Dawsonov algoritem. Algoritem, ki ga je leta 1974 zasnoval J. L. Davvson (1974), za razliko od Lovinsinega uporablja precej daljši seznam končnic (okrog 1200) in pravila za odstranjevanje, ne uporablja pa pravil za popravljanje. Deluje po principu najdaljšega ujemanja, oziroma delnega ujemanja, ker krni tudi besede, ki si niso podobne v vseh podrobnostih, a so vsebinsko sorodne (npr. absorb - absorption). Da to doseže, so vanj vključene skupine korenskih zaključkov, ki jih najdemo pri pomensko sorodnih krnih (npr. -rb in -rpt), zaradi česar jih je mogoče okrniti na isti krn. Takih skupin je petdeset. Besedi absorb in absorption (ki sta dejansko morfološki različici) imata določeno število črk enakih, črke na koncu korena pa pripadajo isti korenski skupini, zato jima je mogoče pripisati isti krn. Martin F. Porter (Porter, 1980, 2000) je leta 1980 zasnoval drugega izmed največkrat uporabljenih algoritmov. Sam ga opisuje kot postopek odstranjevanja pogostejših oblikoslovnih in pregibnih končnic z angleških besed. Vpeljuje pa koncept dolžine, ki jo predstavi kot število trojic glasov (soglasnik-samoglasniksoglasnik) v besedi. Od dolžine je odvisno, ali se končnico odstrani, ali ne. Vsaki končnici, teh je okoli 60, so pripisana pravila, ki določajo pogoje, ki jim mora biti zadoščeno, da se jo lahko odstrani. Algoritem je iterativen, torej deluje v korakih in na vsakem koraku uporablja na kontekst občutljiva pravila za rekodiranje in pravila za popravljanje. Postopek obsega pet korakov, na prvi stopnji npr. odstrani množinske in deležniške končnice besed (-s, -es, -ed), če jih beseda vsebuje. Med pravili loči tri skupine: pravila za krn, pravila za končnico in pogoje za sama pravila. Istega leta kot Dawson sta svoj algoritem predstavila tudi M. A. Hafer in S. F. Weiss (cv: Popovič, 1991). Ta uporablja metodo pestrosti nadaljevanja, ki ji je dodana še metoda pestrosti predhodnih znakov. Algoritem deluje namreč tako, da vsako besedo pregleda dvakrat, od leve proti desni in v obratni smeri. Zato je časovno dokaj potraten. Njegova dobra lastnost pa je, da ne potrebuje vnaprej pripravljenega seznama končnic, s čimer odpade zamudno "ročno" delo administratorja sistema. 9 Posamezni izrazi imajo lahko v različnih kontekstih različen pomen (poglejmo npr. razliko v pomenu izraza odjemalec v besedilu o poslovanju kake trgovine in v besedilu o strukturi Interneta). Kontekstno odvisni algoritmi poskušajo takšne in podobne jezikovne podrobnosti upoštevati in jih modelirati z vnaprej pripravljenimi pravili. 20

15 Vilar, P; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja Algoritem, ki sta ga svetu predstavila Paice in Husk leta 1990, je iterativen, uporablja pa tudi seznam pravil za krnjenje, ki so razdeljena v skupine glede na zadnjo črko končnice. Deluje v štirih stopnjah. Za vsako besedo najprej izbere pravo skupino pravil, nato preveri ustreznost prvega pravila v tem odseku, ga bodisi uporabi, ali pa poišče naslednje pravilo. Postopek ponavlja toliko časa, da najde ustrezno pravilo za določeno besedo. Poleg omenjenih pravil obsega še pogoje, s katerimi preprečuje nepravilnosti pri krnjenju; gre za predpisovanje minimalne dolžine preostanka besede po opravljenem krnjenju. Nekateri algoritmi uporabljajo kot pomoč pri krnjenju slovarje ali kakšne druge leksične pripomočke. Praviloma gre za algoritme, ki le del postopkov krnjenja izvajajo s statističnimi sredstvi. Osnovna značilnost takih algoritmov izvira iz teze njihovih avtorjev, da nas pri uporabi besed za indeksiranje zanima predvsem njihov pomen in ne morfološke lastnosti. Trdijo, da bi učinkovitost algoritmov za krnjenje lahko izboljšali, če bi preprečili zlivanje morfološko sorodnih, vendar pomensko različnih besed, Algorotem Roberta Krovetza (Krovetz, 1993) temelji na Porterjevem, ima pa vgrajen elektronski slovar (Longman Dictionary of Contemporary English). Pred vsako Porterjevo fazo krnjenja Krovetzov algoritem preveri obstoj trenutne oblike krna med besedami v slovarju. Če se iskanje pozitivno izteče, je krnjenje končano. Za razlikovanje med različnimi pomenskimi variantami morfološko sorodnih besed Krovetz uporablja avtomatsko analizo slovarskih gesel in vodilk. Dvema morfološko sorodnima krnoma denimo pripiše pomensko različnost, če imata ločeni gesli v slovarju. Prednost takega pristopa je v zanesljivosti zlivanja besed, ki so tudi pomensko sorodne (seveda, če so v slovarju) in v dejstvu, da so rezultat krnjenja večinoma popolne besede in ne njihovi krni. S tem so zelo olajšane metode iskanja informacij, ki zahtevajo iskalčevo sodelovanje, predvsem nekatere oblike iskanja s povratno zanko. Pomanjkljivosti izvirajo iz nepopolnega prekrivanja vsebine slovarja in vsebine dokumentov. Delež besed iz različnih testnih zbirk dokumentov, ki v katerikoli fazi krnjenja ustrezajo slovarskim geslom, se giblje med 17% in 71%, odvisno od tematike zbirke. Tudi Xu in Croft (1998) poskušata ločevati krne morfološko sorodnih, a pomensko različnih besed, le da pri tem uporabljata dokaze, ki jih izpeljeta iz same zbirke dokumentov. Trdita, da so morfološke različice besede zelo verjetno semantično tesno povezane (in je njihovo zlivanje varno), če nastopajo v istih dokumentih. Tudi njun algoritem ima za osnovo Porterjev algoritem, skupine besed, ki jih algoritem zlije, pa dodatno modificirata s podatki o sopojavljanju v dokumentih. Avtorja opozarjata na dejstvo, da različni pomeni večpomenskih besed pridejo do izraza v različnih kontekstih, še posebno v različnih domenah rabe jezika, zato algoritmi, ki se pri zlivanju odločajo tudi na osnovi pomena besede, zlivanje na nek način prilagajajo podjezikom. 21

16 Knjižnica 44(2000)4 4.5 Algoritmi za krnjenje slovenščine Tvorba besed v slovenščini je sicer podobna angleščini v tem, da se različice tvorijo z dodajanjem končnic osnovnemu korenu. Dejstvo pa je, da je morfologija slovenskega jezika veliko bolj zapletena kot angleška, pozna šest sklonov namesto štirih, tri različna števila v nasprotju z dvema, kot ju pozna večina drugih jezikov, tri spole, po štiri sklanjatve za vsakega izmed spolov, itn. Pregibajo se tako samostalniki kot tudi pridevniki in zaimki, odnosi med besedami v stavku pa so pogosto določeni s samo obliko besed, ne, kot v angleščini, s pomočjo predlogov ali s položajem besed v povedi. Glagoli se ne pregibajo le glede na časovne kategorije, temveč sledijo tudi osebi, številu in spolu. Te in še druge značilnosti pomenijo, da mora biti algoritem za krnjenje slovenščine mnogo bolj kompleksen kot za angleščino. Hkrati pa obstaja velika verjetnost, da bo kvaliteten algoritem tudi zelo učinkovit. Prvi, avtorjem tega članka znani algoritem za krnjenje slovenskih besedil je bil razvit na Inštitutu za biomedicinsko informatiko Medicinske fakultete leta 1988 (Dimec, 1988). Šlo je za preprost algoritem, ki je uporabljal sezname končnic po načelu najdaljšega ujemanja. Učinkovitost algoritma, ki je bil namenjen predvsem pripravi besedil za preverjanje prikladnosti obstoječih "angleških" metod računanja povednih moči za slovenske besede, ni bila nikoli resno eksperimentalno ovrednotena. Popovič je v odmevnem članku (Popovič in Willett, 1992) opisal svoj algoritem za krnjenje slovenskih besedil. Tudi ta algoritem uporablja metodo ujemanja najdaljše končnice (v seznamu je 5276 končnic), njegovo jedro pa je osem pravil, ki usmerjajo uporabo končnic. Nekaj primerov teh pravil, ki delujejo v skladu z zaporedjem končnih znakov v potencialnem krnu, prikazuje slika la. Poleg omenjenih pravil uporablja Popovičev algoritem tudi pravila za popravljanje morfoloških izjem (primeri na sliki lb). Implementacija v sistemu za shranjevanje in iskanje informacij INSTRUCT (Hendry, 1986) je pokazala, da je tudi za slovenščino mogoče razviti algoritem za krnjenje, ki je po učinkovitosti primerljiv z algoritmi za angleščino. Širši pomen Popovičevih raziskav, ki je največ prispeval k njihovi odmevnosti, je bil predvsem v jasnem dokazu, da je krnjenje zelo pomembno za jezike s kompleksno morfologijo. Oba algoritma sodita v skupino t.i. statističnih algoritmov, ki režejo končnice na osnovi načela najdaljšega ujemanja in pri tem ne uporabljajo dodatnih leksičnih pripomočkov. Za take algoritme je v splošnem značilno premočno krnjenje. Popovičev algoritem je s svojimi pravili uporabe končnic do neke mere uspel modelirati jezikovne postopke oblikovanja morfoloških različic besed. Algoritem je bil razvit za splošni jezik in pravila so bila, razumljivo, prirejena le krnjenju pravih slovenskih besed. 22

17 Vilar, P; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja Razvoj algoritmov za krnjenje slovenščine se je nadaljeval na Medicinski fakulteti v okviru projekta Intelligent Information Storage and Retrieval ofslovenian and English Medical Documents on Internet, ki ga je v letih 1996 do 1999 financirala Evropska unija. Avtorji so se želeli izogniti premočnemu krnjenju, ki nujno vodi v zmanjšanje natančnosti iskanja, preveliki vezanosti na knjižno slovenščino in izdelati algoritem, ki bi bil dovolj hiter za uporabo v dinamičnem okolju zbirk spletnih dokumentov. V okviru projekta sta bila razvita dva algoritma za krnjenje, ki sta bila pozneje, v skladu z njuno vlogo, poimenovana generični in optimalni algoritem. Generični algoritem (Dimec et al., 1999) se je osredotočal predvsem na preprečevanje premočnega krnjenja. Načelo najdaljšega ujemanja že samo po sebi vzpodbuja uporabo daljših končnic in s tem nastajanje kratkih krnov. Če zanemarimo to začetno omejitev, lastno samemu postopku, avtorji menijo, da je poglavitni razlog premočnega krnjenja lahko tudi preveliko število pravil in končnic, ki poskušajo modelirati kompleksno morfologijo jezika. Veliko število končnic poveča možnost, da bo uporabljena predolga končnica pri besedi, kjer bi odrez krajše že dal ustrezen krn. Generični algoritem prinaša dve novosti: (a) manjše število končnic (v primerjavi s Popovičevim seznamom) in (b) pravilo, ki poskuša omejevati premočno krnjenje tako, da iz dolžine potecialnega krna izračuna dolžino najdaljše dovoljene končnice, ki bi z odrezom dala ta krn. Zmanjšani seznam končnic je nastal iz Popovičevega seznama, od katerega so avtorji ohranili (in deloma dopolnili) le tiste končnice, ki cepijo besedo na stiku soglasnika in samoglasnika. Pri tem jih je vodilo dejstvo, da nosijo v besedah soglasniki večjo količino informacije od samoglasnikov. Med praktična načela preprečevanja premočnega krnjenja zato sodi tudi ohranjanje čimvečjega števila soglasnikov na koncu krna, seveda do meje, ki bi že povzročila prešibko krnjenje. Soglasnike ali soglasniške skupine, ki po odrezu končnice ostanejo na krnu, selektivno reže posebna skupina pravil. Optimalni algoritem (Dimec et al., 1999) je nastal v želji, da bi (a) presegli omejitve, ki jih postavlja načelo najdaljšega ujemanja in da bi (b) krnjenje bolj prilagodili strokovnim podjezikom. Razmislek pokaže, da kot rezultat krnjenja v resnici potrebujemo najdaljši niz znakov, ki zastopa morfološke variante neke besede in samo variante te besede, in ne najkrajši niz, ki ustreza tem zahtevam (in kakršnega, v najboljšem primeru, da algoritem z najdaljšim ujemanjem). Jezik je živ organizem, algoritme za krnjenje pa vedno razvijamo v eksperimentalnem okolju in na omejenem korpusu. V svetu realnih dokumentov se prej ali slej zgodi, da pride v postopek krnjenja morfološko in semantično nova beseda, ki ji krnjenje z najdaljšim ujemanjem pripiše krn (kot najkrajši ustrezni niz znakov), enak krnu neke druge besede. Nasprotno pa bi krn kot najdaljši ustrezni niz znakov z večjo verjetnostjo predstavljal le oblike nove besede. Edini način, ki ne vključuje računalniškega razumevanja jezika, in ki lahko pripelje do najdaljšega krna, je algoritem, ki zaporedoma preizkuša končnice 23

18 Knjižnica 44(2000)4 od najkrajše proti daljšim, dokler ne najde take, ki bi, odrezana od besede, sprostila najdaljši krn, ki zastopa morfološke variante te besede in samo variante te besede. Zbirke dokumentov skoraj brez izjeme vključujejo dokumente strokovne narave, zato algoritmi za krnjenje obdelujejo strokovne podjezike. Strokovni podjeziki vsebujejo številne besede tujega izvora, v medicini predvsem grškega, latinskega in angleškega. Jasno je, da algoritmi za krnjenje, ki s svojimi pravili opisujejo splošni jezik, niso najprimernejši za krnjenje takih besed. Idealna rešitev bi bila programska oprema, ki bi bila sposobna krnjenja različnih jezikov, vanjo pa bi moral biti vključen tudi modul za prepoznavanje jezikov. Taki moduli pa potrebujejo za uspešno razločevanje jezikov segmente besedila, bistveno daljše od besede. Verjetno je najenostavnejši izhod iz te zagate splošen algoritem za krnjenje, ki pa se odloča s pomočjo računalniških besednjakov podjezikov. Nekateri "veliki" jeziki jih imajo že dolgo, za slovenščino pa takih besednjakov ni. Z razvojem optimalnega algoritma so avtorji želeli razrešiti opisane probleme in izdelati algoritem, ki bi besede krnil le do najdaljšega krna ter bil prilagodljiv strokovnim podjezikom. Osnova algoritma so seznami in postopki generičnega algoritma (od tod njegovo ime), z izjemo izračuna najdaljše dovoljene končnice, ki tu ni potreben. V sistemu sodelujejo tudi trije seznami krnov: veljavni krni, imenski krni in novi krni. V prvem seznamu se zbirajo optimalne oblike krnov podjezika, v drugem krni, ki ne sodijo v podjezik, vendar so pomembni kot vsebinski predstavniki dokumentov (osebna, geografska imena, kratice...), v tretjem pa vsi krni, ki nastanejo v postopku in jih še ni med veljavnimi in imenskimi. V nasprotju z algoritmi z najdaljšim ujemanjem, optimalni algoritem načne besedo na koncu. Od desne proti levi išče pare soglasniksamoglasnik. Pri vsakem paru opravi popolni postopek krnjenja - odrez končnice in obdelavo soglasniških parov. Krn, ki nastane, sistem poskuša najti v seznamih veljavnih in imenskih krnov. Če ga najde, je postopek opravljen, sicer poišče naslednji par soglasnik-samoglasnik v smeri proti začetku besede in ponovi krnjenje. Algoritem torej deluje iterativno, z vedno daljšimi in daljšimi končnicami. Če se iskanje krna v seznamih veljavnih in imenskih krnov nikoli ne izteče pozitivno, je rezultat zadnji krn, ki je nastal v postopku - tak, kot bi nastal z generičnim algoritmom. Ta krn in rezultati vseh vmesnih stopenj krnjenja se zapišejo v seznam novih krnov. Občasno administrator sistema pregleda seznam novih krnov in jih označi s tremi možnimi oznakami: krn je lahko optimalen (in se preslika v seznam veljavnih krnov), lahko izvira iz kratice, geografskega ali osebnega imena (in se preslika v seznam imenskih krnov), ali pa izvira iz napačno zapisane besede (takega sistem zavrže). Del programske opreme za krnjenje je tudi modul za procesiranje seznama novih krnov, ki do neke mere avtomatizira postopke ter vse spremembe takoj odslika v indeksni datoteki zbirke dokumentov. 24

19 Vilar, P.; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja Kritična faza postopka je vzdrževanje seznama veljavnih krnov, ki ima vlogo besednjaka krnov podjezika. Seznam raste s številom obdelanih dokumentov in tako nadomešča v slovenščini neobstoječe besednjake. Odločilnega pomena so odločitve administratorja sistema, ki določa najustreznejšo obliko krnov. Ni nujno, da pri pregledovanju seznama novih krnov administrator sprejme obliko krna, ki jo za besedo b predlaga algoritem za krnjenje. S pomočjo spiska vseh krnov, ki so nastali v zaporednih stopnjah krnjenja besede b, se odloči za tistega, ki je po njegovem najustreznejši. Pri administratorju sistema z občutkom za jezik obstaja velika verjetnost, da bo tak krn res optimalen. Od te faze dalje bo sistem vsakič, ko bo imel opravka z morfološko različico besede b, tej besedi pripisal njen optimalni krn (od tod ime algoritma). Jasno je, da optimalni algoritem zahteva precej dela pri vzdrževanju, vendar pa je tega dela, z naraščanjem zbirke dokumentov, vedno manj. Z rastjo seznamov veljavnih in imenskih krnov se sistem "uči" podjezika. Slika 2 prikazuje krivuljo učenja medicinskega podjezika v korpusu z besedami. V tem korpusu se je sistem naučil optimalnih krnov. Za razliko od algoritma za krnjenje, ki ga je za angleščino razvil Krovetz (Krovetz, 1993), sistem vedno okrni besedo, v najslabšem primeru tako, kot bi to storil algoritem z najdaljšim ujemanjem. (a) Pravilo: odreži končnico, osje v besedi znak pred njo soglasnik: končnica; -alna; ustreza; nacianalna - nacion; ne ustreza: socialna-social Pravilo: odreži končnico, vendar ne, če sta v besedi pred njo dva zaporedna soglasnika: končnica: -ata; ustreza: kandidata-kandid; ne ustreza: kolovrata-kolovrat Pravilo: odreži končnico, vendar ne, če sta v besedi pred njo "bi" ali "st": končnica: -em; ustreza; hitrem-hitr; ne ustreza: problem-problem (b) Splošna pravila za popravljanje, naprimen ~sež, ~seč - ~seg: presež, preseč - preseg -niš, -nič -> -nik: tehniš, tehnič - tehnik Pravila za popravljanje alteracij e -> 0, naprimen -soglasnik + ~r -> -soglasnik + -er: kadr -> kader Slika 1. Primeri pravil za krnjenje (a) in pravil za popravljanje krnov (b) v Popovičevem algoritmu. 25

20 Knjižnica 44(2000)4 Slika 2. Krivulja učenja medicinskega podjezika v korpusu z besedami. 12,54% besed prvega segmenta je po krnjenju pristalo v seznamu veljavnih krnov, v zadnjem segmentu pa je bil ta delež le še 0,81%. Puščice označujejo menjavo vira krnjenih besedil: a = ISIS, glasilo Slovenske zdravniške zbornice, b = JAMA, Journal of American Medical Association, Slovenska izdaja, c = Medicinski razgledi, d = Zdravniški vestnik. 4.6 Francoski jezik Ugotovljeno je, da so algoritmi za krnjenje mnogo učinkovitejši pri jezikih z zapleteno morfološko strukturo. Eden takih je tudi francoščina. Savoy (1999) poroča, da poleg zapletene slovnice v francoščini najdemo mnogo več nepravilnosti in odstopanj od siceršnjih pravil. Vključujejo pripone za pregibanje, ki se spreminjajo glede na spol samostalnika ali pridevnika (ženski in moški) in število (ednina in množina), pri glagolih pa francoščina podobno kot slovenščina pozna variacije v časih in osebi. Dodatno težavo predstavljajo tudi naglasna znamenja. Savoy (1999) poroča o poskusu priprave seznama blokiranih besed in preprostega postopka krnjenja, ki bi bil splošno uporaben za francoski jezik. Seznam obsega 215 besed in zmanjša obseg invertirane datoteke v primeru prve testne zbirke besedil za 21%, v primeru druge pa za 35%. Savoy meni, da bi bilo mogoče ta seznam z določenimi modifikacijami uporabiti tudi v specifični rabi jezika. Preprost algoritem za krnjenje, ki ga predstavlja, je zasnovan na nekaj splošnih morfoloških pravilih, kot npr. množinskih končnicah -s in -x, ne upošteva pa variacij v osebi in času ali morfoloških variacij v glagolih. Gre torej za preprosto zlivanje množinskih in edninskih oblik. Primerjava s kompleksnejšim algoritmom, ki odstranjuje tudi najpogostejše izpeljevalne pripone, pokaže, da med obema ni pomembne razlike v natančnosti. 26

21 Vilar, P.; Dimec, J. Krnjenje kot osnova nekaterih nekonvencionalnih metod poizvedovanja Savoy ugotavlja, da uporaba seznama blokiranih besed in krnjenja pomembno izboljša učinkovitost poizvedovanja, a predvsem v zbirkah kratkih dokumentov. Zaključuje, da boljše rezultate daje algoritem, ki upošteva le nekaj preprostih pravil, kot npr. odstranjevanje množinske končnice -s. Takšne rezultate pripisuje kompleksnosti morfologije francoskega jezika. Kompleksnejši algoritem, ki bi odstranjeval tudi izpeljevalne pripone, po njegovih navedbah naredi tudi več napak. Neupoštevanje naglasov ne prinese bistvenega izboljšanja natančnosti. 4.7 Neindoevropski jeziki Japonščina Izvor japonščine je nekoliko nejasen, po eni strani naj bi bil glede na slovnično zgradbo v sorodu z altajskimi jeziki, po drugi, glede na glasovno zgradbo, pa z jeziki na območju Indonezije in Polinezije. Japonski jezik je eden izmed aglutinacijskih jezikov 10. Za predikativne besedne vrste v japonščini je značilna pregibnost. Kazalni zaimki nimajo ne spola ne števila. Besedni red ohranja značilno zaporedje osebek - predmet - povedek in se ravna po pravilu, da stoji določena beseda pred določujočo. Načeloma pozna le odprte zloge. Soglasniški sklopi niso mogoči, značilne so številne enakozvočnice. Pozna veliko regionalnih in socialnih narečij (Veliki splošni leksikon, G-K, 1998, str. 1726). Fujii in Croft (1993) navajata, da ima japonski jezik dve poglavitni značilnosti, ki ovirata tehnike za poizvedovanje po besedilu, razvite npr. za angleščino. To sta 1) intenzivna uporaba kitajskega ideografskega sistema pisave Kanji, ki obsega znakov in 2) aglutinativna narava japonščine. Navajata tudi, da v japonščini uporabljajo heterogene razrede pisav, od katerih ima vsak razred zelo jasno lingvistično vlogo. Izrazi iz razreda kanji pretežno izražajo abstraktne ali kombinirane koncepte na ideografski način. Izrazi iz razreda katakana fonetično predstavljajo izposojenke iz drugih jezikov, pretežno angleščine. Izrazi iz razreda hiragana pa se uporabljajo za funkcionalne besede, členke, pomožne glagole in podobno. Poleg tega v besedilih pogosto najdemo črke latinske besede, na primer v kraticah (IBM). Vse to predstavlja z vidika sistemov za poizvedovanje precejšnje ovire. Fujii in Croft predlagata sistem JINQUERY, ki vsebuje dva načina indeksiranja: znakovno, ki obravnava vsak znak kot indeksni izraz, in besedno, ki kot 10 Aglutinacijski jeziki so takšni, pri katerih se sestavine za pregibanje in tvorbo besed ne združujejo z osnovo ali korenom kot pri fleksijskih jezikih, temveč se dodajajo, «lepijo» ena na drugo. To pomeni, da se besede pogosto sestavljajo v dolga zaporedja brez presledkov. Taka beseda ima kot celota popolnoma drugačen pomen kot njeni sestavni deli. 27

22 Knjižnica 44(2000)4 indeksni izraz obravnava vsako besedo oziroma krn. Znakovne metode prepoznavajo znake v dokumentih, nato izločijo vse znake hiragana, indeksirajo pa znake kanji in kombinacije znakov katakana in latiničnih črk. Besedne metode pa na podlagi postopka segmentacije določajo besede oziroma morfeme, ki služijo kot indeksni izrazi. Postopek blokiranja je nekoliko specifičen, ker sistem najprej razdeli besede na besedne vrste, nato pa izloča vse besede, ki pripadajo določeni besedni vrsti (npr. členki, pomožni glagoli). Kategorije kot glagoli, samostalniki, pridevniki, predpone/pripone in ostali izrazi, ki jih sistem ne prepozna, ostanejo kot indeksni izrazi. Postopki krnjenja se uporabljajo samo za glagole in pridevnike, ker japonščina ne pozna pregibanja samostalnikov. Fujii in Croft poročata, da daje znakovno indeksiranje boljše rezultate kot besedno, da pa so rezultati učinkovitosti poizvedovanja primerljivi s podobnimi sistemi za angleški jezik Arabščina Arabski jezik je jugozahodni semitski jezik, spada pa v hamitsko-semitsko jezikovno skupino, ki se govori v Mali Aziji, severni in vzhodni Afriki. Najpogostejše značilnosti hamitsko-semitskih jezikov so pregibnost in prevoj, lomljene množine, slovnični spol in skupna debla zaimkov. Je fleksijski jezik, kar pomeni, da pozna sklanjanje in spreganje, nosilci stvarnega pomena v besedi so soglasniki (večinoma trije), samoglasniki pa so nosilci oblikotvornega pomena. V glasovnem sestavu imajo t.i. emfatične soglasnike in vrsto goltnikov (Veliki splošni leksikon, S-T, 1998, str. 3819). Arabski jezik otežuje avtomatsko procesiranje, delno zaradi svoje desno-leve usmeritve, diakritičnih znakov, samoglasnikov, ki so lahko ali pa tudi ne prisotni v besedi in svoje zahtevne morfološke strukture. Abu-Salem, Al-Omari in Evansova (1999) omenjajo, da je osnovan na korenskih strukturah, ki jih je okoli Koren je gola glagolska oblika, večinoma so tričrkovni, nekaj pa je tudi štiri-, pet- ali šestčrkovnih. Iz njih se z dodajanjem izpeljevalnih pripon in predpon tvorijo glagolske in samostalniške besede. S stališča poizvedovanja jemljemo glagolske korene in njihove glagolske in samostalniške izpeljanke kot krne. Krn je kombinacija korena in izpeljevalnega morfema, ki mu je lahko dodana ena ali več predpon ali pripon. V preizkusu so primerjali besedno indeksiranje z uporabo binarnega tehtanja, besedno indeksiranje s tehtanjem besed na osnovi pogostosti izrazov in obratne pogostosti dokumentov in novo t.i. mešano metodo, ki izračunava pomembnost izraza s shemo obratne pogostosti dokumentov. S primerjanjem teh treh različnih metod indeksiranja so ugotovili, da so krni mnogo učinkovitejši indeksni izrazi kot cele besede. Metoda iskanja korenov se je obnesla bolje kot metoda iskanja besed, in pri višjih nivojih priklica tudi bolje kot metoda iskanja krnov (Abu-Salem, Al-Omari in Evans, 1999). 28

KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: Sprejeto: Izvleček Izvirni znanstveni

KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: Sprejeto: Izvleček Izvirni znanstveni KRNJENJE SLOVENSKIH BESEDIL S PODROČJA BIBLIOTEKARSTVA 1 Polona Vilar Jasna Maver Oddano: 11.04.2002 Sprejeto: 06.05.2002 Izvleček Izvirni znanstveni članek UDK 001.4 : 02 : 004.021 Prispevek predstavlja

Prikaži več

Microsoft Word - bibliografske-zbirke-medicina.doc

Microsoft Word - bibliografske-zbirke-medicina.doc Univerza v Ljubljani Filozofska fakulteta Oddelek za bibliotekarstvo, informacijsko znanost in knjigarstvo Sistemi za poizvedovanje Bibliografske zbirke področje medicine Mentor: doc.dr. Jure Dimec Avtorja:

Prikaži več

VSEBINSKI NASLOV SEMINARSKE NALOGE

VSEBINSKI NASLOV SEMINARSKE NALOGE Univerza v Ljubljani Naravoslovnoteniška fakulteta Oddelek za tekstilstvo VSEBINSKI NASLOV SEMINARSKE NALOGE TITLE IN ENGLISH Avtorja: Študijska smer: Predmet: Informatika in metodologija diplomskega dela

Prikaži več

Datum in kraj

Datum in kraj Ljubljana, 5. 4. 2017 Katalog znanj in vzorci nalog za izbirni izpit za vpis na magistrski študij Pedagoško računalništvo in informatika 2017/2018 0 KATALOG ZNANJ ZA IZBIRNI IZPIT ZA VPIS NA MAGISTRSKI

Prikaži več

Microsoft PowerPoint - Lapajne&Randl2015.pptx

Microsoft PowerPoint - Lapajne&Randl2015.pptx RAZISKAVA OB PREDVIDENI SELITVI KNJIŽNIC OHK Raziskava je potekala v okviru predmetov Raziskovalne metode in Uporabniki informacijskih virov in storitev pod mentorstvom treh profesorjev (dr. Pisanski,

Prikaži več

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: ksz@mf.uni-lj.si T: +386 1 543 7700 Režim študija Predmet: Uvod v medicino, modul Informatika Študijski program: EMŠ

Prikaži več

%

% OSNOVNA ŠOLA NARODNEGA HEROJA RAJKA HRASTNIK PODRUŽNIČNA ŠOLA DOL PRI HRASTNIKU PODRUŽNICA LOG AKTIV TJA IN NI KRITERIJ OCENJEVANJA 2018/2019 0-44 % nzd (1) 45-64 % zd (2) 65-79 % db (3) 80-89 % pdb (4)

Prikaži več

Podatkovni model ER

Podatkovni model ER Podatkovni model Entiteta- Razmerje Iztok Savnik, FAMNIT 2018/19 Pregled: Načrtovanje podatkovnih baz Konceptualno načtrovanje: (ER Model) Kaj so entite in razmerja v aplikacijskem okolju? Katere podatke

Prikaži več

Microsoft PowerPoint - Standardi znanja in kriteriji ocenjevanja 2 r.ppt [Samo za branje] [Združljivostni način]

Microsoft PowerPoint - Standardi znanja in kriteriji ocenjevanja 2  r.ppt [Samo za branje] [Združljivostni način] STANDARDI ZNANJA PO PREDMETIH IN KRITERIJI OCENJEVANJA 2. razred SLOVENŠČINA 1 KRITERIJI OCENJEVANJA PRI SLOVENŠČINI POSLUŠANJE -Poslušanje umetnostnega besedilo, določanja dogajalnega prostora in časa,

Prikaži več

Microsoft Word - Analiza rezultatov NPZ slovenscina 2018.docx

Microsoft Word - Analiza rezultatov NPZ slovenscina 2018.docx OSNOVNA ŠOLA SOSTRO POROČILO O ANALIZI DOSEŽKOV NACIONALNEGA PREVERJANJA ZNANJA IZ SLOVENŠČINE leta 2018 Pripravile učiteljice slovenščine: Renata More, Martina Golob, Petra Aškerc, Katarina Leban Škoda

Prikaži več

Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENO

Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko   ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENO Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko www.trojina.si ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENOSTI PISA 2009 TEMA POROČILA PISA (The Programme for

Prikaži več

08_03

08_03 OBVESTILO O RAZPISU ZA OBLIKOVANJE REZERVNEGA SEZNAMA Naziv delovnega mesta Funkcionalna skupina/razred AD 6 Vrsta pogodbe Sklic Rok za prijavo Kraj zaposlitve Veljavnost rezervnega seznama do Število

Prikaži več

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA KATALOG ZNANJA 1. IME PREDMETA ZBIRKE PODATKOV I ZBIRKE PODATKOV II 2. SPLOŠNI CILJI Splošni cilji predmeta so: razvijanje sposobnosti za uporabo znanstvenih metod in sredstev, razvijanje odgovornosti

Prikaži več

glava.dvi

glava.dvi Lastnosti verjetnosti 1. Za dogodka A in B velja: P(A B) = P(A) + P(B) P(A B) 2. Za dogodke A, B in C velja: P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C) Kako lahko to pravilo posplošimo

Prikaži več

POLA3

POLA3 Državni izpitni center *P173A22213* ZIMSKI IZPITNI ROK NEMŠČINA NAVODILA ZA OCENJEVANJE Ponedeljek, 5. februar 2018 POKLICNA MATURA Državni izpitni center Vse pravice pridržane. 2 P173-A222-1-3 IZPITNA

Prikaži več

Ko je izbira ovira v napredovanju Silva Novljan

Ko je izbira ovira v napredovanju Silva Novljan Ko je izbira ovira v napredovanju Silva Novljan Bralna pismenost v Sloveniji in Evropi Nacionalna konferenca, Brdo pri Kranju, 25. in 26. oktober 2011 Izhodišče razmišljanja Rezultati raziskav o povezanosti

Prikaži več

6.1 Uvod 6 Igra Chomp Marko Repše, Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru

6.1 Uvod 6 Igra Chomp Marko Repše, Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru 6.1 Uvod 6 Igra Chomp Marko Repše, 30.03.2009 Chomp je nepristranska igra dveh igralcev s popolno informacijo na dvo (ali vec) dimenzionalnem prostoru in na končni ali neskončni čokoladi. Igralca si izmenjujeta

Prikaži več

DODATEK_F8

DODATEK_F8 COMARC/B F.8 F.8 Tabela polj/podpolj s stopnjo obveznosti za posamezen bibliografski nivo V tabeli je podana obveznost polj/podpolj (o - obvezen podatek, p - obvezen podatek, če obstaja, in n - neobvezen

Prikaži več

POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u

POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo učbenik in delovni zvezek, ki sta obvezna učna pripomočka

Prikaži več

PowerPoint Presentation

PowerPoint Presentation Napovedno oglaševanje Kombiniranje internih in eksternih podatkov za boljšo učinkovitost oglaševanja Miloš Suša, iprom Andraž Zorko, Valicon Mojca Pesendorfer, Atlantic Grupa Ljubljana, 22.10.2018 PREDIKTIVNO

Prikaži več

Spletno raziskovanje

Spletno raziskovanje SPLETNO RAZISKOVANJE RM 2013/14 VRSTE SPLETNEGA RAZISKOVANJA RENKO, 2005 Spletne fokusne skupine Spletni eksperiment Spletno opazovanje Spletni poglobljeni intervjuji Spletna anketa 2 PREDNOSTI SPLETNIH

Prikaži več

COBISS3/Medknjižnična izposoja

COBISS3/Medknjižnična izposoja 3/Medknjižnična izposoja 2.2 KATALOG Katalog nam omogoča: iskanje gradiva prikaz izbranih bibliografskih zapisov ali pripadajočih podatkov o zalogi iz lokalne baze podatkov v formatu COMARC vpogled v stanje

Prikaži več

1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk

1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk 1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatkov in njihov prenos med spletnimi mesti. Obrazec v

Prikaži več

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij

Kazalo 1 DVOMESTNE RELACIJE Operacije z dvomestnimi relacijami Predstavitev relacij Kazalo 1 DVOMESTNE RELACIJE 1 1.1 Operacije z dvomestnimi relacijami...................... 2 1.2 Predstavitev relacij............................... 3 1.3 Lastnosti relacij na dani množici (R X X)................

Prikaži več

Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah

Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah Priloga k pravilniku o ocenjevanju za predmet LIKOVNA UMETNOST. Ocenjujemo v skladu s Pravilnikom o preverjanju in ocenjevanju znanja v srednjih šolah in Pravili ocenjevanja Gimnazije Novo mesto, veljavnim

Prikaži več

Osnove statistike v fizični geografiji 2

Osnove statistike v fizični geografiji 2 Osnove statistike v geografiji - Metodologija geografskega raziskovanja - dr. Gregor Kovačič, doc. Bivariantna analiza Lastnosti so med sabo odvisne (vzročnoposledično povezane), kadar ena lastnost (spremenljivka

Prikaži več

Microsoft Word - 021_01_13_Pravilnik_o_zakljucnem delu

Microsoft Word - 021_01_13_Pravilnik_o_zakljucnem delu Na podlagi 64. člena Pravil o organizaciji in delovanju Fakultete za humanistične študije, št. 011-01/13 z dne 27. 6. 2013, je Senat Univerze na Primorskem Fakultete za humanistične študije na svoji 4.

Prikaži več

c_ sl pdf

c_ sl pdf 3.12.2008 C 308/1 I (Resolucije, priporočila in mnenja) MNENJA EVROPSKI NADZORNIK ZA VARSTVO PODATKOV Mnenje Evropskega nadzornika za varstvo podatkov o predlogu uredbe Evropskega parlamenta in Sveta o

Prikaži več

STAVKI _5_

STAVKI _5_ 5. Stavki (Teoremi) Vsebina: Stavek superpozicije, stavek Thévenina in Nortona, maksimalna moč na bremenu (drugič), stavek Tellegena. 1. Stavek superpozicije Ta stavek določa, da lahko poljubno vezje sestavljeno

Prikaži več

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem Kaja Dobrovoljc Ljubljana, 3. 2. 2012 Kaj je leksikon besednih oblik (LBO)? podatkovna zbirka o oblikoslovnih lastnostih besedišča zdruţevanje

Prikaži več

DN5(Kor).dvi

DN5(Kor).dvi Koreni Število x, ki reši enačbo x n = a, imenujemo n-ti koren števila a in to označimo z n a. Pri tem je n naravno število, a pa poljubno realno število. x = n a x n = a. ( n a ) n = a. ( n a ) m = n

Prikaži več

Microsoft Word - CNC obdelava kazalo vsebine.doc

Microsoft Word - CNC obdelava kazalo vsebine.doc ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo mesto, april 2008 Ime in priimek študenta ŠOLSKI CENTER NOVO MESTO VIŠJA STROKOVNA ŠOLA STROJNIŠTVO DIPLOMSKA NALOGA Novo

Prikaži več

Microsoft PowerPoint - IPPU-V2.ppt

Microsoft PowerPoint - IPPU-V2.ppt Informatizacija poslovnih procesov v upravi VAJA 2 Procesni pogled Diagram aktivnosti IPPU vaja 2; stran: 1 Fakulteta za upravo, 2006/07 Procesni pogled Je osnova za razvoj programov Prikazuje algoritme

Prikaži več

Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / Uradni lis

Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / Uradni lis Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / 24. 5. 2019 Uradni list Republike Slovenije PRILOGA 1 PRAVILA ZA OBLIKOVANJE

Prikaži več

Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij.

Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij. Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij. Protokoli - uvod Protokol je pravilo ali zbirka pravil, ki določajo načine transporta sporočil po računalniškem omrežju

Prikaži več

KONTINGENČNI PRISTOP K OBLIKOVANJU SISTEMA STRATEŠKEGA POSLOVODNEGA RAČUNOVODSTVA: EMPIRIČNA PREVERBA V SLOVENSKIH PODJETJIH

KONTINGENČNI PRISTOP K OBLIKOVANJU SISTEMA STRATEŠKEGA POSLOVODNEGA RAČUNOVODSTVA:  EMPIRIČNA PREVERBA V SLOVENSKIH PODJETJIH Temelji poslovodnega računovodstva(1) Uvod v poslovodno računovodstvo (kontroling) Prof. dr. Simon Čadež simon.cadez@ef.uni-lj.si 2 CILJI PREDMETA Opredeliti vlogo managerjev in poslovodnega računovodstva

Prikaži več

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite

NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite NAJRAJE SE DRUŽIM S SVIČNIKOM, SAJ LAHKO VADIM ČRTE IN KRIVULJE, PA VELIKE TISKANE ČRKE IN ŠTEVILKE DO 20. Preizkusite znanje vaših otrok in natisnite vzorčne strani iz DELOVNIH LISTOV 1 v štirih delih

Prikaži več

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo Turingov stroj in programiranje Barbara Strniša 12. 4. 2010 1 Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolov (običajno Σ 2) Σ n = {s 1 s 2... s n ; s i Σ, i =

Prikaži več

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo

Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefo Poročilo za 1. del seminarske naloge- igrica Kača Opis igrice Kača (Snake) je klasična igrica, pogosto prednaložena na malce starejših mobilnih telefonih. Obstaja precej različic, sam pa sem sestavil meni

Prikaži več

Chapter 1

Chapter 1 - 1 - Poglavje 1 Uvod v podatkovne baze - 2 - Poglavje 1 Cilji (Teme).. Nekatere domene, kjer se uporabljajo podatkovne baze Značilnosti datotečnih sistemov Problemi vezani na datotečne sisteme Pomen izraza

Prikaži več

Opisni kriteriji ocenjevanja znanja slovenščina 3., 4., 5. R VOŠČILO, ČESTITKA pisno OCENJUJE SE Ustreznost besedilni vrsti kraj in datum, nagovor, vs

Opisni kriteriji ocenjevanja znanja slovenščina 3., 4., 5. R VOŠČILO, ČESTITKA pisno OCENJUJE SE Ustreznost besedilni vrsti kraj in datum, nagovor, vs Opisni kriteriji ocenjevanja znanja slovenščina 3., 4., 5. R VOŠČILO, ČESTITKA pisno OCENJUJE SE Ustreznost besedilni vrsti kraj in datum, nagovor, vsebina, podpis) izraženo voščilo/čestitka Pravopis in

Prikaži več

Microsoft Word - P043-A mod.doc

Microsoft Word - P043-A mod.doc Dr`avni izpitni center *P043A22213* ZIMSKI ROK NEM[^INA NAVODILA ZA OCENJEVANJE ^etrtek, 3. februar 2005 POKLICNA MATURA RIC 2003 2 P043-A222-1-3 IZPITNA POLA 1 1 A: BRALNO RAZUMEVANJE (20) Točke zapisujte

Prikaži več

Strojna oprema

Strojna oprema Asistenta: Mira Trebar, Miha Moškon UIKTNT 2 Uvod v programiranje Začeti moramo razmišljati algoritmično sestaviti recept = napisati algoritem Algoritem za uporabo poljubnega okenskega programa. UIKTNT

Prikaži več

Microsoft Word - P122-A _mod.doc

Microsoft Word - P122-A _mod.doc 2 P122-A302-1-3 IZPITNA POLA 1 Vsak pravilen odgovor je vreden eno (1) točko. Skupno je možno doseči trideset (30) točk. Opomba: Pri ocenjevanju te pole se ne upošteva kriterija jezikovne pravilnosti.

Prikaži več

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v

Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero v Učinkovita izvedba algoritma Goldberg-Tarjan Teja Peklaj 26. februar 2009 1 Definicije Definicija 1 Naj bo (G, u, s, t) omrežje, f : E(G) R, za katero velja 0 f(e) u(e) za e E(G). Za v V (G) definiramo presežek

Prikaži več

AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna

AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna AKCIJSKO RAZISKOVANJE INOVACIJSKI PROJEKT ZA ZNANJE IN SPOŠTOVANJE Udeleženci: Učenci 2. c Razredničarka: Irena Železnik, prof. Učni predmet: MAT Učna vsebina: Ustno seštevanje in odštevanje do 20 sprehodom

Prikaži več

Diapozitiv 1

Diapozitiv 1 Ključne kompetence za uspešno delo knjižničarja Kako jih razvijati? Dr. Vlasta Zabukovec Oddelek za bibliotekarstvo, informacijsko znanost in knjigarstvo FF, UL Kompetence Študij, vseživljenjsko učenje

Prikaži več

Document ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov

Document ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov Gospodarski subjekti Definicija: V skladu z 2. členom Izvedbene uredbe Komisije (EU) 2018/574

Prikaži več

LaTeX slides

LaTeX slides Statistični modeli - interakcija - Milena Kovač 23. november 2007 Biometrija 2007/08 1 Število živorojenih pujskov Biometrija 2007/08 2 Sestavimo model! Vplivi: leto, farma Odvisna spremenljivka: število

Prikaži več

Orodje za izvoz podatkov

Orodje za izvoz podatkov Pomoč uporabnikom -NA-SI-200, V6.13-00 IZUM, 2018 COBISS, COMARC, COBIB, COLIB, IZUM so zaščitene znamke v lasti javnega zavoda IZUM. KAZALO VSEBINE 1 Uvod... 1 2 Predstavitev orodja za izvoz podatkov...

Prikaži več

KRITERIJI ZA PREVERJANJE IN OCENJEVANJE ZNANJA – SLOVENŠČINA

KRITERIJI ZA PREVERJANJE IN OCENJEVANJE ZNANJA – SLOVENŠČINA KRITERIJI ZA PREVERJANJE IN OCENJEVANJE ZNANJA SLOVENŠČINA Obvezni učbeniki Berilo Branja 1, 2, 3, 4 Na pragu besedila 1, 2, 3, 4 (učbenik in delovni zvezek); Če dijak pri pouku nima ustreznega učbenika,

Prikaži več

Microsoft Word - UP_Lekcija04_2014.docx

Microsoft Word - UP_Lekcija04_2014.docx 4. Zanka while Zanke pri programiranju uporabljamo, kadar moramo stavek ali skupino stavkov izvršiti večkrat zaporedoma. Namesto, da iste (ali podobne) stavke pišemo n-krat, jih napišemo samo enkrat in

Prikaži več

Primer obetavne prakse za dejavnost-i z uporabo IKT 1 Učitelj: MARIJA VOK LIPOVŠEK Šola: OŠ Hruševec-Šentjur Predmet: Biologija 8 Razred: 8.b Št. ur:

Primer obetavne prakse za dejavnost-i z uporabo IKT 1 Učitelj: MARIJA VOK LIPOVŠEK Šola: OŠ Hruševec-Šentjur Predmet: Biologija 8 Razred: 8.b Št. ur: Primer obetavne prakse za dejavnost-i z uporabo IKT 1 Učitelj: MARIJA VOK LIPOVŠEK Šola: OŠ Hruševec-Šentjur Predmet: Biologija 8 Razred: 8.b Št. ur: 1 Vsebinski sklop: OGRODJE Tema: VRSTE IN NALOGE KOSTI

Prikaži več

7. VAJA A. ENAČBA ZBIRALNE LEČE

7. VAJA A. ENAČBA ZBIRALNE LEČE 7. VAJA A. ENAČBA ZBIRALNE LEČE 1. UVOD Enačbo leče dobimo navadno s pomočjo geometrijskih konstrukcij. V našem primeru bomo do te enačbe prišli eksperimentalno, z merjenjem razdalj a in b. 2. NALOGA Izračunaj

Prikaži več

Diapozitiv 1

Diapozitiv 1 FOUND POETRY Found poetry se ustvarja, piše z uporabo besedišča iz nepoetičnih kontekstov, ki se uporabi v pesniškem besedilu. Kot temeljno besedilo se lahko uporabijo teksti iz različnih virov: časopisov,

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev INFORMATIKA Tečaj za višjega gasilca OGZ PTUJ 2017 PRIPRAVIL: ANTON KUHAR BOMBEK, GČ VSEBINA TEORETIČNA PREDAVANJA INFORMACIJSKI SISTEMI SISTEM OSEBNIH GESEL IN HIERARHIJA PRISTOJNOSTI PRAKTIČNE VAJE ISKANJE

Prikaži več

Priloga II Modul A: Izjava o skladnosti na podlagi notranje kontrole proizvodnje 1. Izjava o skladnosti na podlagi notranje kontrole proizvodnje je po

Priloga II Modul A: Izjava o skladnosti na podlagi notranje kontrole proizvodnje 1. Izjava o skladnosti na podlagi notranje kontrole proizvodnje je po Priloga II Modul A: Izjava o skladnosti na podlagi notranje kontrole proizvodnje 1. Izjava o skladnosti na podlagi notranje kontrole proizvodnje je postopek ugotavljanja skladnosti, s katerim proizvajalec

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev U K 20 P K U P M 2 0 1 2 12 M OBLIKOVANJE POJMA ŠTEVILO PRI OTROKU V 1. RAZREDU Sonja Flere, Mladen Kopasid Konferenca o učenju in poučevanju matematike, M a r i b o r, 2 3. i n 2 4. avgusta 2 0 1 2 Oblikovanje

Prikaži več

2019 QA_Final SL

2019 QA_Final SL Predhodni prispevki v enotni sklad za reševanje za leto 2019 Vprašanja in odgovori Splošne informacije o metodologiji izračuna 1. Zakaj se je metoda izračuna, ki je za mojo institucijo veljala v prispevnem

Prikaži več

Govorne in slikovne tehnologije

Govorne in slikovne tehnologije Uvod GOVORNE TEHNOLOGIJE prof. dr. France Mihelič PREGLED PREDSTAVITVE Osnovni pojmi Uporaba Zahtevnost raziskovalnega področja Variabilnost govora Razumevanje govora Interdisciplinarnost Govorne podatkovne

Prikaži več

PORAJAJOČA SE PISMENOST

PORAJAJOČA SE PISMENOST PORAJAJOČA SE PISMENOST v sklopu Šole za starše, dne 22. oktobra 2003 v Marjetici, predavateljica: dr. Branka Jurišić Predavanje se je začelo s komentarjem predavateljice, da nekateri starši forsirajo

Prikaži več

Microsoft PowerPoint - 07-bostjan_tavcar.ppt

Microsoft PowerPoint - 07-bostjan_tavcar.ppt MINISTRSTVO ZA OBRAMBO Uprava Republike Slovenije za zaščito in reševanje VARNOST V ZASEBNIH SISTEMIH RADIJSKIH ZVEZ B.T.v1.0 Brdo, 19. in 20. MAJ 2003 ZASEBNI SISTEMI RADIJSKIH ZVEZ (PMR) IN VARNOST Zasebni

Prikaži več

KRITERIJI OCENJEVANJA PRI ANGLEŠČINI Programi: SPLOŠNA GIMNAZIJA (splošni in športni oddelki) UMETNIŠKA GIMNAZIJA (likovna in dramsko-gledališka smer)

KRITERIJI OCENJEVANJA PRI ANGLEŠČINI Programi: SPLOŠNA GIMNAZIJA (splošni in športni oddelki) UMETNIŠKA GIMNAZIJA (likovna in dramsko-gledališka smer) KRITERIJI OCENJEVANJA PRI ANGLEŠČINI Programi: SPLOŠNA GIMNAZIJA (splošni in športni oddelki) UMETNIŠKA GIMNAZIJA (likovna in dramsko-gledališka smer) Aktiv učiteljev angleščine Gimnazije Nova Gorica (sprejeto

Prikaži več

Microsoft Word - P113-A _mod.docx

Microsoft Word - P113-A _mod.docx Državni izpitni center *P113A22213* ZIMSKI IZPITNI ROK NEMŠČINA NAVODILA ZA OCENJEVANJE Torek, 7. februar 2012 POKLICNA MATURA RIC 2012 2 P113-A222-1-3 IZPITNA POLA 1 Vsak pravilen odgovor je vreden eno

Prikaži več

(Microsoft Word - Merila, metode in pravila - \350istopis )

(Microsoft Word - Merila, metode in pravila - \350istopis ) DRŽAVNOTOŽILSKI SVET Trg OF 13, 1000 LJUBLJANA Tel.: 01 434 19 63 E-pošta: dts@dt-rs.si Številka: Dts 5/15-12 Datum: 27. 10. 2016 Državnotožilski svet (v nadaljevanju: Svet) je na svoji 64. seji dne 27.

Prikaži več

Microsoft Word - 13-Selekcijski intervju.docx

Microsoft Word - 13-Selekcijski intervju.docx številka 13, 15. dec.2004, ISSN 1581-6451, urednik:radovan Kragelj Pozdravljeni! Danes nadaljujemo z vprašanji, s katerimi vrednotite konkretne lastnosti in sposobnosti posameznega kandidata. V prejšnjih

Prikaži več

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije Univerza v Ljubljani Fakulteta za matematiko in fiziko Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije 2. junij 2011 Koncept PSO Motivacija: vedenje organizmov v naravi Ideja: koordinirano

Prikaži več

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx

Microsoft Word - Analiza rezultatov NPZ matematika 2018.docx Analiza dosežkov pri predmetu matematika za NPZ 28 6. razred NPZ matematika 28 Dosežek šole Povprečno število točk v % Državno povprečje Povprečno število točk v % Odstopanje v % 49,55 52,52 2,97 Povprečni

Prikaži več

PowerPointova predstavitev

PowerPointova predstavitev INFORMACIJSKA PISMENOST Tomaž Bešter Center za informacijske storitve NUK 01/2001-200 tomaz.bester@nuk.uni.lj.si Dnevni red Podatek informacija znanje; vrste pismenosti Zakaj je informacijska pismenost

Prikaži več

Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa

Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa znanja slovenskega jezika (Ur. l. RS št. 47/1994),

Prikaži več

SLOVENŠČINA TVORJENKE: So besede, ki jih tvorimo iz drugih besed. Levo obrazilo/predpona: Za pis Desno obrazilo/pripona: pis atelj Podstava/koren: pis

SLOVENŠČINA TVORJENKE: So besede, ki jih tvorimo iz drugih besed. Levo obrazilo/predpona: Za pis Desno obrazilo/pripona: pis atelj Podstava/koren: pis SLOVENŠČINA TVORJENKE: So besede, ki jih tvorimo iz drugih besed. Levo obrazilo/predpona: Za pis Desno obrazilo/pripona: pis atelj Podstava/koren: pis mo Vmesno obrazilo/medpona: pot o pis BESEDOTVORNI

Prikaži več

KRATEK POVZETEK ANALIZE NPZ V ŠOLSKEM LETU REZULTATI ZA 6. IN 9.RAZRED RAZRED/PREDMET OŠ JOŽETA MOŠKRIČA REPUBLIŠKO ODSTOPANJE POVPREČJE 6. RA

KRATEK POVZETEK ANALIZE NPZ V ŠOLSKEM LETU REZULTATI ZA 6. IN 9.RAZRED RAZRED/PREDMET OŠ JOŽETA MOŠKRIČA REPUBLIŠKO ODSTOPANJE POVPREČJE 6. RA KRATEK POVZETEK ANALIZE NPZ V ŠOLSKEM LETU 2012-13 REZULTATI ZA 6. IN 9.RAZRED RAZRED/PREDMET OŠ JOŽETA MOŠKRIČA REPUBLIŠKO POVPREČJE 6. RAZRED Slovenščina 45,45% 49,79% -4,34% Matematika 57,95% 67,91%

Prikaži več

Predmetnik programa Družboslovna informatika, smer Digitalne tehnologije in družba (DI-DTID) 1. letnik Zimski semester Poletni semester # Naziv predme

Predmetnik programa Družboslovna informatika, smer Digitalne tehnologije in družba (DI-DTID) 1. letnik Zimski semester Poletni semester # Naziv predme Predmetnik programa Družboslovna informatika, smer Digitalne tehnologije in družba (DI-DTID) 1. letnik 1 Statistika 60 6 6 Uvod v metode družboslovnega raziskovanja 60 6 2 Uvod v družboslovno informatiko

Prikaži več

RAZPIS ŠOLSKEGA IN DRŽAVNEGA TEKMOVANJA IZ ZNANJA ANGLEŠČINE Spoštovane kolegice in kolegi, Slovensko društvo učiteljev angleškega jezika IATEFL Slove

RAZPIS ŠOLSKEGA IN DRŽAVNEGA TEKMOVANJA IZ ZNANJA ANGLEŠČINE Spoštovane kolegice in kolegi, Slovensko društvo učiteljev angleškega jezika IATEFL Slove RAZPIS ŠOLSKEGA IN DRŽAVNEGA TEKMOVANJA IZ ZNANJA ANGLEŠČINE Spoštovane kolegice in kolegi, Slovensko društvo učiteljev angleškega jezika IATEFL Slovenia (v nadaljnjem besedilu IATEFL Slovenia) skladno

Prikaži več

Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar Prirejeno po: Brcar, F. (2016). Pi

Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar   Prirejeno po: Brcar, F. (2016). Pi Pisanje strokovnih in znanstvenih del doc. dr. Franc Brcar franc.brcar@gmail.com http://www.uporabna-statistika.si/ Prirejeno po: Brcar, F. (2016). Pisanje strokovnih in znanstvenih del. Novo mesto: 1

Prikaži več

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni RAM stroj Nataša Naglič 4. junij 2009 1 RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni trak, pomnilnik ter program. Bralni trak- zaporedje

Prikaži več

Microsoft Word - M doc

Microsoft Word - M doc Državni izpitni center *M11145113* INFORMATIKA SPOMLADANSKI IZPITNI ROK NAVODILA ZA OCENJEVANJE Petek, 10. junij 2011 SPLOŠNA MATURA RIC 2011 2 M111-451-1-3 IZPITNA POLA 1 1. b 2. a 3. Pojem se povezuje

Prikaži več

Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se

Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se Urejevalna razdalja Avtorji: Nino Cajnkar, Gregor Kikelj Mentorica: Anja Petković 1 Motivacija Tajnica v posadki MARS - a je pridna delavka, ampak se velikokrat zmoti. Na srečo piše v programu Microsoft

Prikaži več

VPRAŠALNIK BRALNE MOTIVACIJE ZA MLAJŠE UČENCE –

VPRAŠALNIK BRALNE MOTIVACIJE ZA MLAJŠE UČENCE – PRAŠALNIK BRALNE MOTIACIJE ZA STAREJŠE UČENCE BM-st Pred teboj je vprašalnik o branju. Prosimo te, da nanj odgovoriš tako, kot velja zate. vprašalniku ni pravilnih oz. napačnih odgovorov. Na posamezne

Prikaži več

N

N Državni izpitni center *N19141132* 9. razred FIZIKA Ponedeljek, 13. maj 2019 NAVODILA ZA VREDNOTENJE NACIONALNO PREVERJANJE ZNANJA v 9. razredu Državni izpitni center Vse pravice pridržane. 2 N191-411-3-2

Prikaži več

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA Navdih Poizvedovanje po BD podatkovnih virih, ki imajo časovno dimenzijo in so dostopni. Večji promet pomeni večje število dobrin in močnejšo

Prikaži več

Microsoft Word - polensek-1.doc

Microsoft Word - polensek-1.doc Spletna učilnica športne vzgoje res deluje? Janja Polenšek OŠ Dobje janja.polensek@gmail.com Povzetek S pospešenim uvajanjem informacijsko-komunikacijske tehnologije v proces izobraževanja na OŠ Slivnica

Prikaži več

EVRO.dvi

EVRO.dvi Management tehnologije dr. Cene Bavec Management tehnologije postaja v gospodarsko in tehnološko razvitih državah eno temeljnih managerskih znanj. V Sloveniji nimamo visokošolskih in univerzitetnih programov

Prikaži več

INFORMATIKA TEČAJ ZA VIŠJEGA GASILCA

INFORMATIKA TEČAJ ZA VIŠJEGA GASILCA INFORMATIKA TEČAJ ZA VIŠJEGA GASILCA Damjan Munda, GČ, II.st. VSEBINA PREDMETA INFORMACIJSKI SISTEMI SISTEM OSEBNIH GESEL IN HIERARHIJA PRISTOJNOSTI GASILSKI INFORMACIJSKI SISTEM KAJ JE INFORMATIKA? Informatika

Prikaži več

ARS1

ARS1 Nepredznačena in predznačena cela števila Dvojiški zapis Nepredznačeno Predznačeno 0000 0 0 0001 1 1 0010 2 2 0011 3 3 Pri odštevanju je stanje C obratno (posebnost ARM)! - če ne prekoračimo 0 => C=1 -

Prikaži več

Svet Evropske unije Bruselj, 11. avgust 2017 (OR. en) Medinstitucionalna zadeva: 2017/0188 (NLE) 11653/17 FISC 173 PREDLOG Pošiljatelj: Datum prejema:

Svet Evropske unije Bruselj, 11. avgust 2017 (OR. en) Medinstitucionalna zadeva: 2017/0188 (NLE) 11653/17 FISC 173 PREDLOG Pošiljatelj: Datum prejema: Svet Evropske unije Bruselj, 11. avgust 2017 (OR. en) Medinstitucionalna zadeva: 2017/0188 (NLE) 11653/17 FISC 173 PREDLOG Pošiljatelj: Datum prejema: 9. avgust 2017 Prejemnik: Št. dok. Kom.: Zadeva: za

Prikaži več

Šolski center Rudolfa Maistra, Srednja ekonomska šola, program predšolska vzgoja Medpredmetna povezava Informatika-Igre za otroke-Knjižnica

Šolski center Rudolfa Maistra, Srednja ekonomska šola, program predšolska vzgoja  Medpredmetna povezava Informatika-Igre za otroke-Knjižnica Šolski center Rudolfa Maistra, Srednja ekonomska šola, program Predšolska vzgoja Medpredmetna povezava Informatika-Igre za otroke-knjižnica Vsebinski sklop: Uradno komuniciranje preko elektronske pošte

Prikaži več

PowerPoint Presentation

PowerPoint Presentation Zapisovanje učnih izidov Bled, 21.1.2016 Darko Mali ECVET ekspert, CPI Pojmi: Kvalifikacija Kompetenca Učni cilji Učni izidi Enote učnih izidov Kreditne točke Programi usposabljanja NE! 2 Učni cilji kompetence

Prikaži več

Da bo komunikacija z gluho osebo hitreje stekla

Da bo komunikacija z gluho osebo hitreje stekla Da bo komunikacija z gluho osebo hitreje stekla Komu je knjižica namenjena? Pričujoča knjižica je namenjena javnim uslužbencem, zdravstvenemu osebju, ki pri svojem delu stopa v stik z gluho osebo, in tudi

Prikaži več

NAVODILA AVTORJEM PRISPEVKOV

NAVODILA AVTORJEM PRISPEVKOV Predmetna komisija za nižji izobrazbeni standard matematika Opisi dosežkov učencev 6. razreda na nacionalnem preverjanju znanja Slika: Porazdelitev točk pri matematiki (NIS), 6. razred 1 ZELENO OBMOČJE

Prikaži več

Microsoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode]

Microsoft PowerPoint - p_TK_inzeniring_1_dan_v5_shortTS.ppt [Compatibility Mode] Telekomunikacijski inženiring dr. Iztok Humar Vsebina Značilnosti TK prometa, preprosti modeli, uporaba Uvod Značilnosti telekomunikacijskega prometa Modeliranje vodovno komutiranih zvez Erlang B Erlang

Prikaži več

DELEGIRANA UREDBA KOMISIJE (EU) 2017/ z dne julija o dopolnitvi Direktive 2014/ 65/ EU Evropskega parlamenta in S

DELEGIRANA  UREDBA  KOMISIJE  (EU)  2017/ z dne julija o dopolnitvi  Direktive  2014/  65/  EU  Evropskega  parlamenta  in  S 31.3.2017 L 87/411 DELEGIRANA UREDBA KOMISIJE (EU) 2017/588 z dne 14. julija 2016 o dopolnitvi Direktive 2014/65/EU Evropskega parlamenta in Sveta v zvezi z regulativnimi tehničnimi standardi glede režima

Prikaži več

ELEKTRIČNI NIHAJNI KROG TEORIJA Električni nihajni krog je električno vezje, ki služi za generacijo visokofrekvenče izmenične napetosti. V osnovi je "

ELEKTRIČNI NIHAJNI KROG TEORIJA Električni nihajni krog je električno vezje, ki služi za generacijo visokofrekvenče izmenične napetosti. V osnovi je ELEKTRIČNI NIHAJNI KROG TEORIJA Električni nihajni krog je električno vezje, ki služi za generacijo visokofrekvenče izmenične napetosti. V osnovi je "električno" nihalo, sestavljeno iz vzporedne vezave

Prikaži več

Slide 1

Slide 1 Projektno vodenje PREDAVANJE 7 doc. dr. M. Zajc matej.zajc@fe.uni-lj.si Projektno vodenje z orodjem Excel Predstavitev Najbolj razširjeno orodje za delo s preglednicami Dva sklopa funkcij: Obdelava številk

Prikaži več

Splošni pogoji poslovanja 1. Uvodna določba 1) Splošni pogoji poslovanja so pravni dogovor med končnim uporabnikom (fizična ali pravna oseba, v nadalj

Splošni pogoji poslovanja 1. Uvodna določba 1) Splošni pogoji poslovanja so pravni dogovor med končnim uporabnikom (fizična ali pravna oseba, v nadalj Splošni pogoji poslovanja 1. Uvodna določba 1) Splošni pogoji poslovanja so pravni dogovor med končnim uporabnikom (fizična ali pravna oseba, v nadaljevanju»naročnik«) in družbo VI NOVA d.o.o. (v nadaljevanje»ponudnik«).

Prikaži več

Vzpostavitev več nivojske varnostne infrastrukture S pomočjo Elektro Maribor, McAfee SIEM, CISCO ISE, NGFW Zorna Varga, Sfera IT d.o.o in Klemen Bačak

Vzpostavitev več nivojske varnostne infrastrukture S pomočjo Elektro Maribor, McAfee SIEM, CISCO ISE, NGFW Zorna Varga, Sfera IT d.o.o in Klemen Bačak Vzpostavitev več nivojske varnostne infrastrukture S pomočjo Elektro Maribor, McAfee SIEM, CISCO ISE, NGFW Zorna Varga, Sfera IT d.o.o in Klemen Bačak, Sfera IT d.o.o. 1 Priprava na: Vzpostavitev več nivojske

Prikaži več

Microsoft PowerPoint - Mocnik.pptx

Microsoft PowerPoint - Mocnik.pptx MATEMATIČNA PISMENOST IN MATEMATIČNI PROBLEMI Metoda Močnik in Alenka Podbrežnik KAJ NAS JE ZANIMALO? ugotoviti, v kolikšni meri so učenci uspešni pri samostojnem, nevodenemreševanju matematičnih besedilnih,

Prikaži več

Arial 26 pt, bold

Arial 26 pt, bold 3 G MATEMATIKA Milan Černel Osnovna šola Brežice POUČEVANJE MATEMATIKE temeljni in zahtevnejši šolski predmet, pomembna pri razvoju celovite osebnosti učenca, prilagajanje oblik in metod poučevanja učencem

Prikaži več

N E O B V E Z N I I Z B I R N I P R E D M E T I O s n o v n a š o l a P o l z e l a P o l z e l a, a p r i l

N E O B V E Z N I I Z B I R N I P R E D M E T I O s n o v n a š o l a P o l z e l a P o l z e l a, a p r i l N E O B V E Z N I I Z B I R N I P R E D M E T I O s n o v n a š o l a P o l z e l a P o l z e l a, a p r i l 2 0 1 7 Dragi učenci, spoštovani starši! V šolskem letu 2017/18 bomo učencem 4., 5. in 6. razredov

Prikaži več