standardi za zapisovanje dokumentov v d knji nici n.
Download
Skip this Video
Download Presentation
Standardi za zapisovanje dokumentov v d-knjižnici

Loading in 2 Seconds...

play fullscreen
1 / 39

Standardi za zapisovanje dokumentov v d-knjižnici - PowerPoint PPT Presentation


  • 133 Views
  • Uploaded on

Standardi za zapisovanje dokumentov v d-knjižnici. Standardi za besedila, slike in video, zvok. Pomen standardov za zapisovanje e-dok. Pri gradnji d-knj. si nasprotujeta dve načeli:

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Standardi za zapisovanje dokumentov v d-knjižnici' - odelia


Download Now An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
standardi za zapisovanje dokumentov v d knji nici

Standardi za zapisovanje dokumentov v d-knjižnici

Standardi za besedila,

slike in video,

zvok.

pomen standardov za zapisovanje e dok
Pomen standardov za zapisovanje e-dok.
  • Pri gradnji d-knj. si nasprotujeta dve načeli:
    • hiter razvoj tehnologije povzroča hitre spremembe pri produkciji in lastnostih e-dokumentov, ki jim mora d-knj. slediti;
    • vsaka pomembna odločitev v d-knj.ima dolgoročne posledice.
  • Odločitev o uporabljenih standardih za zapisovanje e-dok. je fundamentalna odločitev.
  • Standardni načini zapisovanja e-dok.
    • omogočajo njihovo rabo danes in
    • povečujejo možnost dolgoročnega ohranjanja.
pomen standardov za zapisovanje e dok1
Pomen standardov za zapisovanje e-dok.
  • Standardizacija je potrebna na dveh nivojih:
    • standardi za zapisovanje znakov (standardno poimenovanje – oštevilčenje – znakov), ki omogočajo uporabo različnih pisav,
    • standardi za zapisovanje dokumentov (standardni formati), ki omogočajo predvidljivo rabo dokumentov.
pomen standardov za zapisovanje e dok2
Pomen standardov za zapisovanje e-dok.
  • Od načina zapisovanja dokumentov v d-knj je odvisna tudi uporabnost uporabnikove programske opreme za rabo dokumentov.
  • Za d-knjižnico je enostavneje, da se omeji na en standard zapisovanja znakov in nekaj standardnih formatov zapisovanja dokumentov.
  • S tem si poenostavi najpomembnejše postopke gradnje zbirk, posredovanja dokumentov in njihovega ohranjanja.
  • Najbrž je ceneje, če dokumente v ostalih “pisavah” in formatih pretvori v izbrane standarde.
pomen standardov za zapisovanje e dok3
Pomen standardov za zapisovanje e-dok.
  • Mednarodne org. za standardizacijo podpirajo standarde in standardne postopke, ki ne vključujejo programske kode s komercialnimi licencami.
  • To ne gre vedno; standardi GIF, JPEG in MPEG vključujejo tudi lastniško programsko kodo, česar pa lastniki licenc zaenkrat ne izkoriščajo.
standardi za zapis besedil
Standardi za zapis besedil
  • V d-knj. lahko funkcionira le besedilo, ki je enako berljivo v poljubnem računalniškem okolju.
  • Na začetku razvoja ni bilo standarda, ki bi urejal zapisovanje besedil, ki zato niso bila prenosljiva med različnimi operacijskimi sistemi.
  • Standard določa predvsem kateri znaki sodijo v pisavo in katere kode (zaporedne številke) jih določajo.
  • Standard za zapis besedila ne določa oblike črk.
standardi za zapis besedil1
Standardi za zapis besedil
  • Prva standarda: ASCII in EBCDIC. ASCII prevladal (standard iz 1963).
  • Osnovni ASCII: 128 kod za znake angleške pisave, interpunkcije in kontrolne znake.
  • ASCII je bil velik napredek z nesluteno dolgoročnimi posledicami, vendar je omejeval neangleške pisce.
  • Razširitev ASCII na 256 kod je omogočila kodiranje precejšnjega števila neangleških znakov.
standardi za zapis besedil2
Standardi za zapis besedil

Razširjen ASCII:

  • ISO-8859-1: zahodnoevropske pisave,
  • ISO-8859-2 srednje in vzhodnoevropske latinične pisave.
  • Problem ISO-8859-n je v tem, da iste kode v podstandardih kodirajo različne znake .
  • Besedila je sicer mogoče zapisati z vsemi znaki, pravilno berljivo pa je le v okolju, ki uporablja isti podstandard.
standardi za zapis besedil3
Standardi za zapis besedil
  • Za slovenska besedila so obstajali do sedaj vsaj 3 načini:
    • “YUSCII” – prilagoditev izvornega 7-bitnega ASCII, ki je nadomestil z našimi znaki nekatere manj uporabljane znake v ASCII:
    • WIN-1250 – Microsoftov “standard”
    • ISO-8859-2 (latin-2) - mednarodni standard.

~ = č ^ = Č } = ć ] = Ć

{ = š [ = Š | = đ \ = Đ

´ = ž @ = Ž

standardi za zapis besedil4
Standardi za zapis besedil
  • Neevropske pisave imajo druge, popolnoma različne standarde, ali pa so brez njih.
  • D-knjižnica bi morala biti neodvisna od načinov zapisovanja besedil.
  • Naravno stanje zbirk dokumentov je večjezičnost, ki lahko pomeni tudi različne pisave.
  • Neobstoj globalnega standarda za zapisovanje besedil je otežkočal gradnjo mednarodnih d-knjižnic.
unicode
Unicode
  • Idealen standard bi kodiral vse svetovne pisave – problem zapisovanja besedil bi s tem izginil.
  • Od 1988 razvoj takega standarda– Unicode.
  • Na začetku konzorcij Apple in Xerox, kasneje velik konzorcij komercialnih in vladnih organizacij.
  • L. 1993 standard – ISO-10646.
unicode1
Unicode
  • Trenutno Unicode pokriva vse svetovne jezike, ki so zdaj v rabi.
  • Poteka vključevanje zgodovinskih pisav (egipčanski hieroglifi...), znakov glasbene notacije in zelo redkih kitajskih ideogramov.
  • Zaenkrat Unicode kodira 94.000 različnih znakov.
unicode2
Unicode

Unicode podpirajo

  • vse zadnje verzije pomembnih OS,
  • vsi pomembnejši programski jeziki (vsaj kot dodatne knjižnice funkcij) in, zelo pomembno,
  • zadnje verzije spletnih brskalnikov. Unicode je privzet nabor v zadnjih verzijah HTML in XML.
unicode3
Unicode
  • Sodobna d-knj bi morala imeti dokumente zapisane v Unicode.
  • To seveda pomeni, da mora biti vsa programska oprema, ki dela z dokumenti (zbirke, iskalniki, uporabniški vmesniki, klasifikacijski sistemi...), prilagojena Unicode.
  • Unicode omogoča tudi svobodno mešanje zelo različnih pisav v istem dokumentu.
me anje pisav testni dokument
Mešanje pisav: testni dokument

http://www.windspun.com/unicode-test/unicode.xml

formati za zapis dokumentov
Formati za zapis dokumentov
  • V široki rabi so številni formati, le redke med njimi so standardizirale mednarodne inštitucije:
  • Bolj standardno se obnašajo formati, ki določajo strukturo dokumenta, kot tisti, ki določajo obliko.
  • Skrajno nestandarden: Word za Windows,
  • Bolj standardni: RTF, LaTeχ, Postscript, PDF,
  • Standardni: HTML, XML.
  • O standardnih formatih več v predavanju o označevalnih jezikih.
standardi za zapisovanje mirujo ih slik
Standardi za zapisovanje mirujočih slik
  • Standardi za zapisovanje nebesedilnih podatkov združujejo zapisovanje podatkovnih elementov in formatiranje (nebesedilnih) dokumentov.
  • Zapis slike na zaslonu ali papirju je sestavljen iz opisov posameznih slikovnih elementov (picture elements, pixels).
  • Kvaliteta slike odvisna predvsem od dveh parametrov:
    • ločljivosti ali števila pikslov na dolžinsko enoto (običajno na colo – dots per inch – dpi) in
    • števila bitov, porabljenih za opis posameznega piksla.
standardi za zapisovanje mirujo ih slik1
Standardi za zapisovanje mirujočih slik

Tipične ločljivosti

  • Rač. zaslon s slabo ločljivostjo: 72*72 dpi,
  • rač. zaslon z običajno ločljivostjo: 92*92 dpi,
  • fax: 200*200 dpi,
  • skener: 300*300 dpi do 600*600 dpi,
  • laserski tiskalnik: 600*600 dpi,
  • zadovoljiva kvaliteta tiska: 1200*1200 dpi,
  • fotostavčni stroj: 4800*4800 dpi.
standardi za zapisovanje mirujo ih slik2
Standardi za zapisovanje mirujočih slik

Število bitov na piksel:

  • za črno-bele slike brez sivin: 1,
  • za črno-bele slike s sivinami: 8,
  • za barvne slike: 8 – 32.
standardi za zapisovanje mirujo ih slik3
Standardi za zapisovanje mirujočih slik

Velikosti datotek:

  • Slika velikosti A4, ločljivost 300 dpi:
    • 1 bit/piksel:>1 Mb,
    • 8 bit/piksel: 9 Mb,
    • 24 bit/piksel: 28 Mb.
  • Slika velikosti A4, ločljivost600 dpi:
    • 24 bit/piksel:>100 Mb (šele to je solidna kvaliteta slike za resnejše aplikacije).
  • Te velikosti veljajo za nestisnjene slike.
stiskanje datotek s slikami
Stiskanje datotek s slikami
  • Slike so vedno shranjene v stisnjeni (komprimirani) obliki.
  • Dva načina stiskanja:
    • brez izgube in
    • z izgubo informacije.
  • Izbira načina bi morala biti odvisna le od načina rabe slike; v praksi je velikokrat odvisna od kapacitete pomnilnika, ki je na voljo.
stiskanje datotek s slikami1
Stiskanje datotek s slikami
  • Stiskanje brez izgube: raztegnjenje (dekomprimiranje) vedno da originalno sliko, piksel za pikslom.
  • Vedno uporabljeno za stiskanje besedila.
  • Vedno uporabljeno kadar mora biti vsaka kopija enaka originalu:
    • medicinske aplikacije,
    • pomembni dokumenti,
    • pravno veljavni dokumenti,
    • arhiviranje...
stiskanje datotek s slikami2
Stiskanje datotek s slikami
  • Stiskanje z izgubo: prihranki prostora so lahko zelo veliki, vendar raztegnjena slika nikoli ni enaka originalu.
  • Uporablja se pri aplikacijah, kjer manjše spremembe niso usodne; sem sodi tudi večina načinov rabe dokumentov v d-knj.
  • Če pričakujemo rabo slik tudi v bodočnosti, stiskanje z izgubo ni upravičeno.
  • Stiskanje najuspešnejše pri fotografskih sivih in barvnih slikah.
kaj je stiskanje
Kaj je stiskanje

Načelo stiskanja:

  • če si je več zaporednih pikslov dovolj podobnih, jih lahko predstavimo kot eno vrednost.
  • Naenostavnejša varianta: piksle primerjamo kot zaporeden bitni niz – tako kot so v datoteki.
  • Boljši rezultati: piksle primerjamo dvodimenzionalno – kot površine dovolj podobnih pikslov.
kaj je stiskanje1
Kaj je stiskanje
  • Pogosto uporabljan algoritem pri stiskanju je LZW (Lempel, Ziv, Welch).
  • V osnovi je bil razvit za besedila.
  • Med branjem besedila poišče vzorce, ki se pogosto ponavljajo – zaporedja črk ali besed.
  • Vzorce uvrsti v tabelo, ponavljajoč se niz v besedilu pa predstavi le kot indeks celice tabele.
  • Tudi ponavljajoče se zaporedje pikslov je vzorec.
stiskanje brez izgube gif png tiff
Stiskanje brez izgube: GIF, PNG, TIFF

GIF (Graphical Interchange Format), 1987.

  • V prvih letih spleta zelo razširjen za omrežno izmenjavo slik, ki jih lahko prikaže poljubna programska in strojna oprema.
  • Primeren za slike, pri katerih je vsak piksel opisan z 8 ali manj biti (sive ali barvne slike z manjšim številom različnih barv).
stiskanje brez izgube gif png tiff1
Stiskanje brez izgube: GIF, PNG, TIFF

GIF (nadaljevanje)

  • Vsaka slika ima tabelo z identifikacijami 256 različnih barv
  • V sliki je vsak piksel opisan z indeksom celice v tej tabeli.
  • Zaporedje indeksov je stisnjeno z algoritmom LZW.
stiskanje brez izgube gif png tiff2
Stiskanje brez izgube: GIF, PNG, TIFF

PNG (Portable Network Graphics).

  • Boljši od GIF, ker lahko kodira in stiska slike s piksli, opisanimi z 48 biti (ali manj).
  • Stiska površine pikslov in ne linearnih zaporedij z algoritmom gzip (varianta algoritma LZ77).
  • Manj razširjen, ker ga stare verzije spletnih brskalnikov ne znajo prikazati.
stiskanje z izgubo jpeg
Stiskanje z izgubo: JPEG
  • JPEG (Joint Photographic Expert Group).
  • Namenjen stiskanju slik s postopnimi prehodi vrednosti. Take so običajno fotografije.
  • Slabo se obnese (malo stisne) pri slikah s ponavljajočim se vzorcem (opečnat zid, travne bilke...).
  • Daleč najbolj razširjen format na katerem temelji večina spletnih in ne-spletnih aplikacij za vizualne informacije.
  • Je tudi osnovni format večine strojne opreme, ki producira slike (digitalne kamere...).
stiskanje z izgubo jpeg1
Stiskanje z izgubo: JPEG
  • Zelo učinkovito stiskanje: piksel, opisan z 32 biti, zasede 1 bit.
  • Kvaliteta slike odlična za človeško oko.
  • Izgube so izbrane tako, da se pojavljajo predvsem pri lastnostih slik, ki jih človeški možgani najmanj zaznajo.
  • Subjektivno izguba informacije pogosto ni zaznavna, objektivno pa taka slika seveda ni enaka originalu.
  • Algoritem za kodiranje in stiskanje zapleten.
standardi za zapisovanje zvokov in gibljivih slik
Standardi za zapisovanje zvokov in gibljivih slik
  • Podatkovni tipi s časovno komponento zahtevajo še za nekaj redov velikosti večje datotekeod statičnih slik.
  • Kvaliteta podatkov (in velikost datotek) odvisna od gostote vzorčenja in števila bitov, porabljenih za en vzorec.
  • Absolutno nujno je stiskanje datotek, večinoma z izgubo.
standardi za zapisovanje zvokov in gibljivih slik1
Standardi za zapisovanje zvokov in gibljivih slik

Vzorčenje:

  • telefonski pogovor – 8000 vzorcev/sek., 8 bitov/vzorec;
  • Zvok na CD – 44.000 vzorcev/sek., 16 bitov/vzorec;
  • video posnetek: najmanj 24 slik/sek.
standardi za zapisovanje zvokov in gibljivih slik2
Standardi za zapisovanje zvokov in gibljivih slik
  • Program, namenjen kodiranju in dekodiranju, se imenuje codec.
  • Codec je lahko standarden za nek tip podatkov, ali pa nestandarden in se prenese skupaj s podatki.
  • Uporabnikova oprema lahko prikaže podatke, le če ima ustrezen codec, sicer ga mora dobiti in instalirati.
mpeg 1
MPEG-1
  • Prevladujoči standardi za zvočne in video posnetke sodijo v družino MPEG (Moving Picture Experts Group).
  • MPEG-1 je nastal 1988 z namenom, da bi standardizirali odprt digitalen format, primerljiv z VHS.
  • Kodira slike 352*240 pikslov, po 30/s.
  • Stisnjen tok slik zasede 1,5 Mb/s, mogoče pa ga je raztegniti v realnem času z opremo, ki ima le 512 Kb pomnilnika.
mpeg 11
MPEG-1
  • MPEG-1 lahko kodira avdio in video skupaj ali posamič.
  • Del standarda za avdio zapis ima več nivojev, odvisnih od kvalitete in tipa posnetka (govor, glasba različnih kvalitet...).
  • Tretji nivo, MP3, je splošno razširjen za zapisovanje digitalizirane glasbe.
mpeg 2
MPEG-2
  • MPEG-2 zapisuje video posnetke visoke kvalitete.
  • Uporablja se za zapisovanje na DVD.
  • Način zapisa je zelo primeren tudi za predvajanje na TV s prenosom podatkov v realnem času, zato bo uporabljen tudi pri HDTV (High Definition TV).
mpeg 4 7
MPEG-4, -7
  • MPEG-4 je namenjen prenosu zvokov in slik po komunikacijskih kanalih z majhno prepustnostjo, npr. mobilnih telefonih.
  • MPEG-7 je namenjen standardnemu zapisu metapodatkov o podatkih, kodiranih z MPEG-1, 2 ali 4.
nestandardni formati
Nestandardni formati
  • Nestandardni načini zapisovanja slik, zvoka in videaizvirajo iz časov, ko interoperabilnost (in s tem standardizacija) ni bila tako pomembna.
  • Še vedno se precej uporabljajo ker jih zna dekodirati večina predvajalnikov in kodirati večina programov za oblikovanje multimedijskih dokumentov.
  • AVI (Audio Video Interleave) – Microsoft,
  • QuickTime – Apple: zelo zmogljiv sistem, soroden MPEG.
predvajanje s prenosom v realnem asu
Predvajanje s prenosom v realnem času
  • Prepustnejše komunikacijske linije omogočajo predvajanje multimedijskih podatkov v realnem času – streaming delivery.
  • Najbolj znan je RealSystems, uporabljan tudi ločeno kot RealAudio in RealVideo.
  • Podatke predvajalnik dobiva preko omrežja, dekodira in predvaja sproti, z manjšo vmesno shrambozaradi morebitnih zakasnitev prenosa.
  • RealSystems vključuje codece za večino obstoječih formatov, tudi MPEG.