Standardi za označevanje dokumentov Razlogi za standardizacijo označevanja dokumentov, označevalni jeziki: MARC, RTF, Teχ, LaTeχ, SGML.

Podobni dokumenti
Delavnica Načrtovanje digitalnih vezij

DODATEK_F8

Microsoft Word - M doc

PowerPointova predstavitev

PMJ, XML

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

POROČILO

Poročilo o delu šolske knjižnice za šolsko leto 2018/19 Poročilo o delu šolske knjižnice za šolsko leto 2018/2019 Poročevalsko obdobje je od

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem

PRIPOROČILA ZA OBLIKOVANJE KATALOGOV ZNANJA ZA MODULE V PROGRAMIH VIŠJEGA STROKOVNEGA IZOBRAŽEVANJA

VAJE RID 1 (4), program PTI, šol

Gimnazija Bežigrad Peričeva Ljubljana OPERACIJSKI SISTEM Predmet: informatika

COBISS3/Medknjižnična izposoja

Priloga 1: Pravila za oblikovanje in uporabo standardiziranih referenc pri opravljanju plačilnih storitev Stran 4012 / Št. 34 / Uradni lis

Microsoft Word - bibliografske-zbirke-medicina.doc

Chapter 1

PROJECT OVERVIEW page 1

GROBI KURIKUL ZA 3. letnik program administrator TEMELJI GOSPODARSTVA KOMUNICIRANJE MODUL: KOMUNICIRANJE UČITELJ: SKLOP Predvideni časovni okvir CILJI

GHOSTBUSTERS navodila za učitelje O PROJEKTU S tem projektom se učenci sami naučijo izdelati igro. Ustvariti morajo več ikon (duhcov ali kaj drugega)

Diapozitiv 1

%

Protokoli v računalniškem komuniciranju TCP, IP, nivojski model, paket informacij.

PowerPoint Presentation

Osnovna šola Hinka Smrekarja Gorazdova 16, Ljubljana NEOBVEZNI IZBIRNI PREDMETI ZA UČENCE 4. RAZREDA ŠOL. LETO 2018/2019 Ljubljana, april 2018

Microsoft Word - Seštevamo stotice.doc

Slide 1

COBISS COBISS3/Katalogizacija 7.3 VNOS PODATKOV Podatke vnašamo ali spreminjamo z vpisom v vnosno polje, z izbiro iz šifranta ali spustnega seznama. 7

Microsoft Word - CNC obdelava kazalo vsebine.doc

NASLOV PREDAVANJA IME IN PRIIMEK PREDAVATELJA

1 MMK - Spletne tehnologije Vaja 5: Spletni obrazci Vaja 5 : Spletni obrazci 1. Element form Spletni obrazci so namenjeni zbiranju uporabniških podatk

VARIMOT® in pribor

PowerPoint Presentation

Predlog navodil članicam za pripravo predstavitve novih študijskih programov, namenjene objavi v predstavitvenem zborniku in na spletnih straneh člani

PowerPointova predstavitev

1. IDENTIFIKACIJA PODATKOVNEGA NIZA 1.1 Naslov Strukturno-tektonska karta Slovenije 1: Alternativni naslov Strukturno-tektonska karta Slove

Razvoj javnega knjižničarstva na Slovenskem dr. Eva Kodrič-Dačić

11_RomanaMuhvic

NAVODILA ZA PISANJE PROJEKTNIH DIPLOMSKIH DEL 1 KAJ JE PROJEKT? Projekt je enkraten glede na način izvedbe, vsebuje nove in neznane naloge, ima svoj z

Microsoft PowerPoint - seminar_ pptx

Gradbeništvo kot Industrija 4.0

Brezplačno učenje zaposlenim in brezposelnim od 2018 do 2022 omogočata Ministrstvo za izobraževanje, znanost in šport ter Evropska unija iz Evropskega

Programska sprememba oddelka šole

DES

Microsoft Word - ARRS-TURAZ doc

INDUSTRIJA 4.0: PRILOŽNOSTI DIGITALNE PREOBRAZBE PROCESA RAZVOJA BARV IN PREMAZOV TOMAŽ KERN, BENJAMIN URH, MARJAN SENEGAČNIK, EVA KRHAČ

VISOKOŠOLSKI STROKOVNI ŠTUDIJ Računalništvo in informatika informatika POROČILO PRAKTIČNEGA IZOBRAŽEVANJA V podjetju Oblikovanje.com d.o.o. Murska Sob

Vaja 2 Virtualizacija fizičnih strežnikov in virtualni PC A. Strežnik Vmware ESX Namestitev strežnika VMware ESX 3.5 na fizični strežnik 2. Nas

VSEBINSKI NASLOV SEMINARSKE NALOGE

Diapozitiv 1

COMARC/H Format

PowerPoint Presentation

Diapozitiv 1

Microsoft Word - M docx

EU-TPD 1 PODROBNOSTI KODIRANJA Informacije za trgovino JB za DCTA, (Final 1.2) Obveznost kodiranja izdelka, urejena s predpisom EU-TPD se n

Slide 1

ISOFT , računalniški inženiring

MATEMATIKA Zbirka nalog za nacionalno preverjanje znanja Jana Draksler in Marjana Robič 9+ znam za več

IZGRADNJA PREDSTAVITVENE SPLETNE STRANI GLUCOWATCH Avtor: Marko Zajko Projekt delno financira Evropska unija, in sicer iz Evropskega socialnega sklada

Uradni list RS - 12(71)/2005, Mednarodne pogodbe

ZAHTEVA ZA UVELJAVLJANE PRAVIC POSAMEZNIKA V POVEZAVI Z NJEGOVIMI OSEBNIMI PODATKI Pošta Slovenije skladno z veljavno zakonodajo na področju varstva o

Microsoft Word - DGSF - Preverjanje veljavnosti ZPIZ e-dokumentov - V.1.0

PMJ, XPath

Microsoft PowerPoint - CAD sistemi - pletenje za pdf

Turingov stroj in programiranje Barbara Strniša Opis in definicija Definirajmo nekaj oznak: Σ abeceda... končna neprazna množica simbolo

Microsoft Word - katalog informacij javnega znaēaja TRŽIŀĄE 2019

Upravljanje sistema COBISS Navodila za uporabo tiskalnika CITIZEN S310II V1.0 VIF-NA-27-SI

N

4.Racionalna števila Ulomek je zapis oblike. Sestavljen je iz števila a (a ), ki ga imenujemo števec, in iz števila b (b, b 0), ki ga imenujemo imenov

PowerPointova predstavitev

Microsoft Word - vprasalnik_AZU2007.doc

ACAD-BAU-Analiza-prostorov

Navodila za uporabo

Microsoft Word - Brosura neobvezni IP

Microsoft Word - M docx

Prirocnik2.indd

Microsoft Word - Brosura neobvezni IP 2018

(Microsoft PowerPoint _IZS_izobraevanje ZK_1_del.ppt [Zdru\236ljivostni na\350in])

Microsoft Word - IRDO doc

Komisija za študijske zadeve UL Medicinske fakultete Vrazov trg 2 SI-1000 Ljubljana E: T: Režim študija Predmet: Uvod

Izvedbena uredba Komisije (EU) št. 1249/2012 z dne 19. decembra 2012 o določitvi izvedbenih tehničnih standardov glede oblike evidenc, ki jih morajo v

Microsoft PowerPoint - Navodila za izdajo kartic.pptx

Orodje za izvoz podatkov

ARRS-TURAZ-JR-Prijava/2010 Stran 1 od 7 Oznaka prijave: Javni razpis za (so)financiranje uveljavljenih raziskovalcev iz tujine v letu 2011 (Uradni lis

DELOVNI LIST 2 – TRG

TNUV Lab

RAČUNALNIŠKA ORODJA V MATEMATIKI

Šolski center Rudolfa Maistra, Srednja ekonomska šola, program predšolska vzgoja Medpredmetna povezava Informatika-Igre za otroke-Knjižnica

Ali je varno kupovati ponarejeno blago?

Kovinska protipoplavna KD vrata Življenje je kot reka, včasih mirna, drugič deroča a vedno polna presenečenj. Če vas v življenju p

Microsoft PowerPoint - Predstavitev novosti COBISS_OPAC_V60_17-18_06_2010_za objavo.ppt

Navodila za pripravo oglasov na strani Med.Over.Net v 2.2 Statistično najboljši odziv uporabnikov je na oglase, ki hitro in neposredno prenesejo osnov

Microsoft PowerPoint - 9 Trzenje bancnih storitev ppt

Microsoft Word - N _moderacija.docx

Osnove matematicne analize 2018/19

GOALS

EVROPSKA KOMISIJA Bruselj, C(2018) 7597 final IZVEDBENA UREDBA KOMISIJE (EU) / z dne o vzpostavitvi začasnega neposrednega stati

Microsoft Word - 021_01_13_Pravilnik_o_zakljucnem delu

Microsoft PowerPoint - krstulovic

Transkripcija:

Standardi za označevanje dokumentov Razlogi za standardizacijo označevanja dokumentov, označevalni jeziki: MARC, RTF, Teχ, LaTeχ, SGML.

Ponudba e-dokumentov v preteklosti Značilnosti ponudnikov e-dokumentov nekdaj: majhno število, pretežno ponudniki bibliografskih zbirk, med seboj neodvisni, samostojen razvoj zbirk e-dokumentov.

Ponudba e-dokumentov v preteklosti Značilnosti e-dokumentov nekdaj: majhno število v primerjavi s številom fizičnih dokumentov, enostavna oblika in relativno enostavna struktura (npr. bibliografski zapisi),

Ponudba e-dokumentov v preteklosti Značilnosti e-dokumentov nekdaj: za prikaz takih e-dokumentov ni potrebna zmogljiva strojna in programska oprema, dokler so bili e-dokumenti le ASCII besedila, je zadoščala skoraj vsaka strojna oprema. Posamezni ponudniki so samostojno razvijali programsko opremo za ponudbo e-dokumentov. Načini označevanja strukture e-dokumentov prilagojeni potrebam, možnostim posameznih ponudnikov in lastnostim njihovih e-dokumentov.

Posledice razvoja e-dokumentov Razvoj ponudbe e-dokumentov: hitro povečevanje količine e-dokumentov, razvoj zapletenejših oblik, predvsem nebesedilnih (multimedijskih) dokumentov, programska in strojna oprema je morala slediti razvoju e-dokumentov.

Posledice razvoja e-dokumentov Posledica: zaradi nestandardnih oblik e-dokumentov ti niso bili uporabni na različnih računalniških platformah, ponudniki so morali izdelovati različne verzije e-dokumentov (in njihovih zbirk) za različne strojne in programske platforme edini možni izhod - standardizacija. Zaradi ekonomskih razlogov ni bilo pričakovati poenotenja proizvajalcev računalnikov. Edini možni izhod: standardizacija načinov zapisovanja e-dokumentov.

Posledice razvoja e-dokumentov Nastali so označevalni jeziki. Označevalni jeziki (mark-up languages) omogočajo označevanje strukturnih in/ali oblikovnih elementov e-dokumentov. Načeloma tako označeni e-dokumenti funkcionirajo enako na različnih strojnih in programskih platformah.

Kdaj bomo zadovoljni z e-dokumenti? Če hočemo, da bodo informacije v elektronski obliki vsaj deloma nadomestile papir, morajo biti berljive na enak prostorsko in časovno neodvisen način.

Kdaj bomo zadovoljni z e-dokumenti? Prostorska neodvisnost e-dokumentov: dokumenti morajo biti enako uporabni v poljubnih okoliščinah. Časovna neodvisnost e-dokumentov: dokumenti morajo biti uporabni, dokler obstajajo bralci.

Kdaj bomo zadovoljni z e-dokumenti? Izpolnitev omenjenih zahtev je deloma odvisna od razvoja strojne opreme (energetsko avtonomni bralniki velikosti knjige, brezžično povezani s ponudniki e- dokumentov). Bralniki so postali ekonomska kategorija šele z razvojem kontrastnega in energetsko nepotratnega e-črnila. Brez standardizacije e-dokumentov tak razvoj ne bi bil mogoč.

Kdaj bomo zadovoljni z e-dokumenti? Standardi za označevanje e-dokumentov morajo torej omogočati: prenosljivost med različnimi tipi računalnikov, prenosljivost med različnimi programi za uporabo dokumentov, enostavno in ekonomično prenosljivost po računalniških omrežjih, dolgoživost dokumentov (problem e- arhiviranja).

Kdaj bomo zadovoljni z e-dokumenti? Uveljavi se lahko samo tak standard, ki omogoča uporabniku nove investicije v strojno in programsko opremo, ohrani pa investicije v informacije.

Zgodovina označevalnih jezikov Označevalni jeziki so se razvili v založništvu in tiskarstvu iz oznak, ki so na krtačnih odtisih opisovale potrebne popravke. Izrazno moč so dobili z uvajanjem elektronskega stavljenja besedil (navodila fotostavčnemu stroju).

Zgodovina označevalnih jezikov Označevalni jeziki so umetni jeziki, sestavljeni iz: Primer: oznak za delitev dokumenta na strukturne dele, oznak, ki opisujejo videz teh strukturnih delov, ter slovnice, ki določa pravilno rabo oznak. najosnovnejše slovnično pravilo določa, kaj je oznaka označevalnega jezika in kaj označeno besedilo.

MARC in izpeljanke MARC (Machine Readable Catalog): Predvsem format, ki definira strukturo kataložnega zapisa, vendar tudi eden prvih označevalnih jezikov, ki omogoča označevanje strukturnih elementov. Namenjen je izmenjavi informacij med računalniškimi knjižničnimi katalogi. Načeloma je uspešno rešil problem prenosljivosti dokumentov med različnimi računalniškimi sistemi.

MARC in izpeljanke Razvile so se izpeljanke (USMARC, UKMARC, UNIMARC...), kar zmanjšuje popolno prenosljivost zapisov.

MARC: izmišljen primer 001 2 0055 010 $a92-2-106396-8 100 $a19890208d1988 f0engy103a 101 0 $aeng 200 1 $asgml comes of age$ftony Smith 210 $ageneve$cinternational Standards Organization$d1988 215 $axii, 180 p 225 2 $Documents of the Text Encoding Initiative$x0257-3415$v6 461 1 $100120054$12001 $v6 700 1 $asmith$btony oznake strukture MARC določa samo strukturo zapisa.

struktura : videz Če označevalni jezik določa le strukturo zapisa, je predstavitev zapisa, njegov videz na zaslonu ali papirju popolnoma prepuščena programom, s katerimi zapis uporabljamo. Struktura zapisa je v takem primeru ločena od definicij za tipe pisave, razmike med vrsticami ipd, s čimer se (v svetu tiskanih publikacij) ukvarjajo tiskarski označevalni jeziki.

RTF: razlogi za uvajanje Zelo pogosta oblika informacij, ki jih ne moremo učinkovito opisati z jeziki, kakršen je MARC, je videz in struktura polnih dokumentov, ki nastajajo v urejevalnikih besedil. Struktura in videz dokumenta sta neločljivo povezana - zelo majhna možnost prenosljivosti med različnimi računalniki in urejevalniki besedil.

V splošnem velja: RTF : razlogi za uvajanje bolj ko je zmogljiv urejevalnik glede oblikovanja besedila, bolj zaprt sistem je. Tudi pri dokumentih v formatih urejevalnikov besedil obstaja močna potreba po prenosljivosti. Proizvajalci urejevalnikov besedil so se dogovorili za skupen transportni označevalni jezik, ki ga razume večina najpomembnejših urejevalnikov. Ta jezik je RTF (Rich Text Format).

RTF Del predavanja o označevalnih jezikih, zapisan v RTF. {\rtf1\ansi\deff20\deflang1033{\fonttbl{\f4\froman\fchars et0\fprq2 Times New Roman;}{\f5\fswiss\fcharset0\fprq2 Arial;}{\f20\fnil\fcharset0\fprq2 SLOHelvetica;}} {\colortbl;\red0\green0\blue0;\red0\green0\blue255;... sledi še nekaj deset vrstic splošnega opisa tipov pisav, zamikov... \pard\plain \qr\sb40\sa40\tx357 \f20\fs20\lang2057 {\fs18 Bib: Računalniško komuniciranje, Informatika 2} \par \pard\plain \s18\sb40\sa40\tx357 b\f20\fs30\lang2057 {\i\fs32 Predavanje: Standardi za označevanje dokumentov \par }\pard\plain \s1\fi-360\li360\sb240\sa40\tx357 \b\f20\fs28\lang2057 1.\tab oznake Razlogi za tipe in barve za standardizacijo pisav oznake označevanja za pozicioniraje besedila informacij RTF označuje izključno videz dokumenta!

Postscript in PDF Postscript (Adobe): označevalni jezik za krmiljenje laserskih tiskalnikov, označuje izključno videz dokumenta, razume tudi zapis slik.

Postscript in PDF PDF (Portable Document Format (Adobe)): označevalni jezik, ki omogoča prikaz originalnega videza dokumenta na WWW in na papirju, poenostavljena in dopolnjena različica Postscripta, omogoča prikazovanje člankov iz strokovnih revij v natančno taki obliki, kot jo imajo v reviji, pretežno označuje videz dokumenta, le delno tudi strukturo (hipertekstni kazalci).

Teχ, LaTeχ Označevalni jezik za elektronsko stavljenje besedil, predvsem takih, ki vsebujejo veliko matematičnih izrazov. Na začetku namenjen krmiljenju fotostavčnih strojev Linotype. Avtor Donald E. Knuth s Stanfordske univerze, skupaj s študenti (10 let dela). V uporabi od l. 1970.

Teχ, LaTeχ Označevalni jezik, ki definira tako strukturo, kot tudi videz dokumenta, na način, ki omogoča prenosljivost. Zaradi izredne učinkovitosti so bili narejeni prevajalniki za vse pomembnejše modele računalnikov. Teχ se drži vseh grafičnih standardov v tiskarski industriji in še vedno presega najsodobnejše urejevalnike besedil.

Teχ, LaTeχ \documentstyle[12pt,slovene]{article} \addtolength{\topmargin}{-1cm} \addtolength{\textheight}{2.5cm} \input yuset \def\boxm{\framebox[13.7cm]{\rule[-75mm]{0cm}{7.5cm}}} \def\boxv{\framebox[13.7cm]{\rule[-160mm]{0cm}{16cm}}} \def\noparsk{\medskip \noindent} \begin{document} \pagebreak \markright{\hfill {\rm Bib: Ra{\ch}unalni{\sh}ko komuniciranje, Informatika 2}} \title {\bf Predavanje: Standardi za ozna{\ch}evanje dokumentov} \section {\bf 1. razlogi za standardizacijo ozna{\ch}evanja informacij} \setcounter{page}{1}... sledi besedilo, označeno v LaTEXu... \end{document} strukturne oznake

Teχ, LaTeχ Teχ ni v splošni rabi predvsem, ker je prezapleten, le redki urejevalniki so WYSIWYG, je namenjen pretežno označevanjem specialnih besedil in ni zelo primeren za označevanje multimedijskih dokumentov. Teχ je še vedno široko uporabljan v nekaterih naravoslovnih strokah, kjer dokumenti temeljijo na matematičnem izrazju.

SGML SGML (Standard Generalised Markup Language): Standardni splošni označevalni jezik. Mednarodni standard, ki ga je sprejela ISO leta 1986 in je bil od takrat že nekajkrat dopolnjen. Gre pravzaprav za družino standardov, ki urejajo označevanje vseh znanih zvrsti elektronskih informacij.

SGML Prednost SGML je v njegovi splošnosti, ker sta logična struktura in videz dokumenta povsem ločena. Videz dokumenta prepušča programski opremi za oblikovanje in tiskanje dokumenta. V tej lastnosti je SGML zelo podoben MARC.

Osnovna filozofija SGML: SGML obstaja končno število različnih tipov dokumentov (razredi dokumentov), razrede dokumentov je mogoče definirati v SGML, vsak dokument sodi v enega od razredov dokumentov, če nekega dokumenta ne moremo uvrstiti v nobenega od razredov, mora SGML omogočiti definiranje novega ustreznega razreda.

SGML Dokument v SGML, je sestavljen iz treh delov: Deklaracije, ki določi nabor znakov, ki ga uporablja dokument (znaki latinice, cirilice...) in znake, ki imajo poseben pomen za SGML in torej niso del vsebine dokumenta.

SGML Definicije: (DTD, Document Type Definition) definira pomen strukturnih delov dokumenta opiše oznake (tage), ki označujejo strukturne dele. DTD definira tudi hierarhične odnose med strukturni deli dokumenta. Vsebine dokumenta, označene z oznakami, naštetimi v DTD.

SGML Primer dela DTD za tip dokumenta memo. Primer vsebuje opis elementov dokumenta in njegovih lastnosti (atributov).

SGML <!ENTITY %doctype MEMO --> Opis najvišjega elementa (doctype). <!ELEMENT MEMO - - ((TO&FROM), BODY, CLOSE?) > - - uporaba začetne in končne značke je obvezna, (TO&FROM), BODY, CLOSE elementi, iz katerih je sestavljen tip dokumenta MEMO, TO&FROM elementa se morata pojaviti enkrat v poljubnem zaporedju, CLOSE? Element se pojavi nič- ali večkrat.

SGML <!ATTLIST %doctype STATUS (CONFIDENT PUBLIC) PUBLIC > Lastnost STATUS ima možni vrednosti CONFIDENT in PUBLIC. Privzeta lastnost je PUBLIC.

SGML SGML je spremenil razmišljanje o nujnih lastnostih sodobnih označevalnih jezikov. Vsi označevalni jeziki v rabi na spletu sledijo načelom, ki jih je uveljavil SGML. To velja tudi za HTML in XML.