1 / 43

Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme)

Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme). Zoran Svrtan, viši informatičar voditelj Informatičke službe Muzeja za umjetnost i obrt, Zagreb. Repozitorij – definicija. AKM repozitorij. Čuvanje i zaštita. Za kraj. vrlo popularna riječ

rania
Download Presentation

Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme) Zoran Svrtan, viši informatičarvoditelj Informatičke službeMuzeja za umjetnost i obrt, Zagreb

  2. Repozitorij – definicija AKM repozitorij Čuvanje i zaštita Za kraj ...

  3. vrlo popularna riječ • repository – 51 milijun odgovora • repositories – 10 milijuna • repozitorij – 91 tisuća • za usporedbu • museum – 224 milijuna • culture – 600 milijuna • library – 700 milijuna • sex – 663 milijuna 3/150

  4. Repozitorij je spremište • digitalnog, elektroničkog materijala. • sužena definicija, primijenjena na specifični predmet prikupljanja: • Repozitorij je zbirka digitalnog materijala koja omogućuje sustavno upravljanje procesima objavljivanja, pristupa i pohrane (tog specifičnog) sadržaja. 4/150

  5. brojni repozitoriji prisutni na mreži – Internetu • prikupljaju i daju mogućnost korištenja različitih sadržaja • knjižničari, informacijske znanosti • sadržaj • institucijski, orijentirani na arhive pojedinih institucija ili organizacija • tematski, okupljaju najrazličitije dokumente vezane uz određeno interesno područje. • dostupnost • mrežni, manje ili više javno dostupni repozitoriji • institucijski, lokalno dostupni repozitoriji, obično bogatiji sadržajima, najčešće nisu javno dostupni 5/150

  6. Pitanja koja bi se mogla postaviti:  • Trebaju li nam AKM repozitoriji? • Imamo li AKM repozitorije? • Što učiniti da bismo ih (i dalje) imali? 6/150

  7. repozitoriji - vodeća uloga u nastupajućem informacijskom društvu • repozitorijske platforme mijenjaju samu prirodu obrazovnih procesa • "ex katedra" vs proces stalnog dopunjavanja znanja i samopoučavanja iz raznih izvora • klasični izvori znanja vs digitalni sadržaji • digitalni sadržaji dostupni na medijima za lokalnu upotrebu - CD, DVD ili na Internetu • Internet - medij koji svima daje podjednaku mogućnost pristupa informacijama 7/150

  8. AKM zajednica, kao jedan od najvećih imaoca raznih kulturnih, povijesnih, arhivskih, itd. podataka idealni je izvor znanja, a znanje je "roba" koja se sve više cijeni. • Sumnje nema - trebaju nam - repozitoriji mogu pružiti mnoge potrebne informacije velikom broju korisnika. 8/150

  9. pogledamo li na Internetu, naći ćemo: • repozitorij hrvatskih školskih knjižničara • Instituta Ruđer Bošković • raznih fakulteta • razne informatičarske stranice koje spominju repozitorije • ni traga muzejskim ili arhivskim repozitorijima • ne znači da ih nema ... samo ih nisam našao ili nisu imenovani repozitorijima, nego bazama podataka, arhivima i slično. 9/150

  10. u smislu spremišta digitalnog materijala - sva naša računala i podaci na njima mogla bi se shvatiti kao repozitorij, malo neorganiziran, ali ipak - repozitorij. 10/150

  11. stvaranje repozitorija • ozbiljan proces definiranja podataka koji se pohranjuju, • odabira softvera za realizaciju projekta, • definiranja formata i metapodataka, • razrješavanja autorskih prava, • popunjavanje početnim podacima, • objava (puštanje u rad) • onda možemo reći da imamo repozitorij. 11/150

  12. Ministarstvo kulture RH pokrenulo je 2005. Nacionalni program digitalizacije arhivske, knjižnične i muzejske građe. • Prijedlog programa završen je u listopadu 2006. • u 2007. godini pokrenut je projekt "Hrvatska kulturna baština" • u 2008. javnosti je prikazan portal projekta www.kultura.hr 12/150

  13. kooperativnost - zajednički rad na prezentaciji hrvatske baštine • svaka AKM institucija pomaže u slaganju mozaika hrvatske kulture • da bi se digitalizacija mogla provoditi standardizirano, osnovane su radne grupe za definiranje smjernica za pripremu projekta, odabir građe, odabir formata itd. 13/150

  14. Zašto se uopće materijalna građa digitalizira? • digitalizacija radi zaštite izvornika • digitalizacija radi poboljšanja dostupnosti • digitalizacija radi stvaranja nove ponude • digitalizacija radi upotpunjavanja fonda 14/150

  15. rezultat projekta – repozitorij (pa i ako se tako ne bude zvao) • preporučeno štivo: • Nacionalni program digitalizacije arhivske, knjižnične i muzejske građe • smjernice za • odabir i pripremu građe • norme i postupke u digitalizaciji • formate za dugoročnu pohranu • oblikovanje digitalnih zbirki 15/150

  16. Uloga je repozitorija da pruži pouzdan, dugotrajan pristup digitalnim resursima, sada i u budućnosti. • brojni autori zabrinuti čuvanjem, održavanjem, pouzdanošću i trajnošću repozitorija • nakon stvaranja – održavanje i očuvanje 16/150

  17. digitalna građa – lagana za čuvanje i multipliciranje, može se lako izgubiti, oštetiti ili nepovratno uništiti • kvar opreme (računala ili medija) bez odgovarajuće, unaprijed promišljene strategije čuvanja može dovesti do katastrofalnih posljedica • jednostavno rješenje - redovna izrada pričuvnih kopija može uspješno vratiti podatke. 17/150

  18. Što je s promjenama tehnologije? • Što kada se pokvare uređaji? • Što kada mediji ne budu čitljivi? 18/150

  19. Koji su mogući scenariji gubitka podataka u računalnom svijetu? • Ljudski faktor – neodržavanje, slučajno brisanje • Zastarijevanje • Zastarijevanje hardvera • Zastarijevanje softvera • Zastarijevanje formata • Zastarijevanje medija • Kvarovi • Kvar hardvera (izuzev diskovnog podsustava) • Kvar diskova • Kvar kontrolera • Kvar medija za backup 19/150

  20. ljudski faktor - stalna edukacija i kontrola • bez obzira na uloženi trud greške uzrokovane ljudskim faktorom ne mogu se izbjeći • zastarijevanje - trajno investiranje i usvajanje najnovijih tehnologija • stalni veliki tehnološki napredak • oprema koja je danas nova i u pogonu, zapravo je već na rubu zastarjelosti • zastarjevanje softvera • zastarjevanje formata 20/150

  21. mediji za pohranu • diskete • ZIP drive diskete • magneto-optički diskovi - WORM (Write Once Read Many) • CD i DVD • potreba za sve većim kapacitetima medija, razvijaju su novi mediji i standardi • nasljednik DVD-a - Blu-ray disk • u razvoju su holografski mediji • gdje je granica ? 21/150

  22. nove tehnologije, glad za sve većim i boljim digitalnim fotografijama, dovode do potrebe za pohranjivanjem sve većih količina podataka • digitalizacija materijalne građe • danas uobičajeni, lako dostupni, ne preskupi, fotoaparati, sa slikom od 10 megapixela proizvode TIFF fotografiju od 28,5 MB. • 24 fotografije popuniti će jedan CD 22/150

  23. Glavni “krivac” za rast količine podatakanesretan spoj dobre digitalne kamere i neobuzdanog korisnika

  24. mediji za pohranu sve više i više nedostatni, bez obzira na svoj kapacitet. • Problem količine podataka, s tehničke strane, nije nerješiv. • Progres u elektronici dozvoljava stalno širenje kapaciteta za pohranu uz sve manju i manju cijenu po megabajtu podataka. 24/150

  25. odabir medija za pohranu • repozitorij dostupan preko weba mora biti negdje pohranjen • naš poslužitelj • poslužitelj nekog od pružatelja internetskih usluga • Za pretpostaviti je da se podaci na tim poslužiteljima (bilo našim ili tuđim) redovito spremaju (bekapiraju) na odgovarajući način. • spremanje podataka našeg „neurednog repozitorija“ • svatko na računalu ima važnih podataka • trenutak spremanja na neki medij i odlaganje • odabir medija jednostavan i lagan – CD ili DVD • razočaranje – spremljeni podaci ne mogu se pročitati s medija! • Zašto? • Kupili smo najpovoljniji (čitaj: najjeftiniji) medij, snimili smo ga maksimalnom brzinom, na gornju površinu napisali smo sadržaj, ostavili medij u košuljici na stolu nekoliko dana i nakon toga ugurali u kutiju u nekom ormaru ili ladici. 25/150

  26. početne tvrdnje proizvođača – 50 - 100 godina • korisnici često istiću kako su mediji koje su snimili već nakon kraćeg vremena (nekoliko mjeseci do nekoliko godina) postali djelomično nečitljivi, i to unatoč, naoko, besprijekornom stanju i pažljivom rukovanju • OSTA (Optical Storage Technology Association) ne preporuča vrijeme skladištenja nesnimljenih medija duže od 5 do 10 godina • pretpostavka - niti snimljeni medij ne bi trebao biti skladišten duži period 26/150

  27. najnovija istraživanja trajnost procjenjuju na samo godinu dana • ne znači da će svaki medij potpuno propasti nakon godinu dana, ali statistički gledano povećana je vjerojatnost pojave grešaka na mediju • trajnost medija može se povećati odgovarajućim skladištenjem - potrebna je posebna prostorija, s klimatizacijom, kontrolom vlage ... ali garancije nema. 27/150

  28. Zašto tako drastični pad procijenjene trajnosti CD i DVD medija? • vjerojatno je zbog smanjivanja cijene proizvodnje došlo do promjena u tehnologiji proizvodnje i materijalima koji se koriste što je rezultiralo smanjenom trajnosti medija • pokazalo se da su jeftini mediji znatno nepouzdaniji od skupljih medija, što bi trebalo potvrditi prethodnu tvrdnju 28/150

  29. preporuka – koristiti “zlatne” medije • snimljene medije redovito kontrolirati • nakon godinu dana presnimiti (ako je potrebno i ranije) • očuvanje digitalnog sadržaja ne ovisi o mediju na kojem se čuva, tj. o očekivanom vijeku trajanja medija, nego o mogućnosti transfera sadržaja s jednog medija na drugi, i to što je češće moguće 29/150

  30. kvar CD ili DVD medija, ili hard diska – postoje razni programi koji su u stanju pročitati sve ili dio podataka i sa oštećenih medija i uspješno ih spremiti • usluge poduzeća za spašavanje podataka s oštećenih medija • vrlo spor i mukotrpan posao • potrebno je procijeniti da li se isplati spašavanje podataka • u Hrvatskoj postoji samo jedno poduzeće koje se bavi ovim vrlo skupim i osjetljivim poslom 30/150

  31. kvar računala • investicija u novo računalo • instalacija softvera • rekonstrukcija podataka • kvar diskovnog podsustava (diskova ili kontrolera) • problem pronalaženja odgovarajućih komponenti 31/150

  32. poslužiteljska računala - SCSI (Small Computer Serial Interface) diskovi spojeni na odgovarajuće kontrolere • RAID (Redundant Array of Independent Disks) funkcije • diskovi povezani, podaci se zapisuju tako da se podatak razdijeli i istovremeno spremi na više diskova koristeći usput i algoritme za zaštitu i povrat podatka u slučaju kvara bilo kojeg od diskova • moguće su razne RAID konfiguracije, najčešće su: RAID 0, RAID 1, RAID 5 32/150

  33. SCSI standard - mnoge revizije i unaprijeđenja. • postoji i nekoliko različitih vrsta konektora na diskovima. • ukoliko se pokvari kontroler na vašem 5 godina starom poslužiteljskom računalu i želite ga zamijeniti – bad luck • ako nemate sreće (niti backup) – podaci su izgubljeni. 33/150

  34. ako se pokvari disk u istom takvom računalu – ista priča • potreban vam je disk istog ili većeg kapaciteta, ali obavezno istog konektora. • u današnje vrijeme brzog napretka elektronike, teško je nabaviti novi, ispravan, tehnološki nekoliko godina star uređaj • danas se u elektronici uređaji proizvode godinu dana (ako i toliko) i nakon toga se prodaju - kako to vole reći - do isteka zaliha. 34/150

  35. do gubljenja podataka vrlo često dolazi zbog nepažnje • pazite da u „velikom spremanju“ ne obrišete i ono što niste namjeravali • ono što vam ne treba nemojte brisati – radije to preselite u mapu koju ćete nazvati Staro ili Nepotrebno ili Arhiva • ako vam treba još diskovnog prostora – kupite dodatni disk, kapaciteti diskova danas su dovoljno veliki, a diskovi su jeftini 35/150

  36. jedini siguran način zaštite od gubitka podataka je izrada sigurnosnih kopija – backupa • backup je ime za redoviti periodični postupak izrade sigurnosnih kopija pomoću nekog od za tu svrhu namijenjenih programa ili za ručno kopiranje podataka • backupova ima nekoliko vrsta – Normal, Copy, Incremental, Differential, Daily 36/150

  37. Normalni backup spremiti će odabrane datoteke i označiti ih kao spremljene, • copy će ih spremiti, ali ih neće označiti kao spremljene, • inkrementalni način će pogledati što se promijenilo od prošlog backupa, spremiti samo promjene i te datoteke će označiti kao spremljene, • diferencijalni backup će učiniti isto, ali neće obilježiti datoteke, • dnevni backup će spremiti samo ono što se promijenilo ili dodalo danas. 37/150

  38. datoteke spremljene nekim od programa za backup, obično su spremljene u pakiranom obliku (zbog uštede prostora, poboljšane kontrole spremanja na medij i slično) i nisu direktno čitljive, nego ih istim alatom treba vratiti natrag (restore) • potreban velik oprez - da ne bi vratili i ono što nam ne treba - recimo starije verzije datoteka na kojima smo u međuvremenu radili 38/150

  39. za naša poslovna računala možemo pojednostaviti stvar - uzmimo potpuni ili djelomični backup • potpuni backup će presnimiti kompletni sadržaj diska. To najčešće nije nužno, jer možda nije sve podjednako važno. • djelomični backup će presnimiti samo odabrane dijelove diska – recimo samo mapu s dokumentima • najjednostavnije učiniti običnim kopiranjem - postupak je jednostavan, a podaci su uvijek dostupni u obliku u kakvom su bili i na našem disku. Još jedna korist - ne trebaju nam posebni programi za backup. 39/150

  40. preporučljiva minimalna strategija – kad osjetite potrebu (dakle ne radi se o redovnom postupku), napravite kopiju onoga za što mislite da vam je izuzetno važno (ne kopija svega i ne kopija cijelog određenog dijela) • srednja strategija bila bi redovito, periodično (ovisno o tempu stvaranja sadržaja) spremanje kompletne mape s podacima (ili svih mapa s podacima, ovisno o strukturiranosti spremanja podataka na disku). • maksimalna strategija, svakodnevno spremanje svega, ali taj pristup nema (uvijek) svoje opravdanje 40/150

  41. da bi naši podaci bili sigurni, trajno dostupni i zaštićeni, potrebna je: • unaprijed promišljena strategija čuvanja i održavanja, kako podataka, tako i softverske i hardverske opreme • unaprijed osigurati sredstva dostatna za provedbu te strategije • potrebno se te strategije i pridržavati. • To je jedini način na koji možemo biti sigurni da će naši podaci, naši repozitoriji biti trajno dostupni nama i drugim korisnicima. A jel ima još puno ?

  42. PP

More Related