KONCEPTI IN METODE
Alenka Kavčič - Čolić
Oddano: 26. 2. 2010 – Sprejeto: 19. 3. 2010
Pregledni znanstveni članek UDK 02:004:005.921.1"746"
Izvleček
Prispevek je pregled teorije in prakse na področju trajnega ohranjanja digitalnih vi- rov. V njem so prikazani najpomembnejši koncepti, standardi in priporočila na tem področju ter različne veljavne metode, ki jih uveljavljajo digitalni arhivi (knjižnice in arhivi, ki so zadolženi za trajno ohranjanje digitalnih virov). Kljub tem da je področje trajnega ohranjanja digitalnih virov šele v razvoju in ne vemo, ali so izbrane metode zanesljive, velja načelo, da lahko z doslednim izvajanjem katerekoli metode med ob- stoječimi precej pripomoremo k ohranjanju dostopa do arhiviranih digitalnih vsebin.
Ključne besede: trajno ohranjanje digitalnih virov, metode, koncepti
Review article UDC 02:004:005.921.1"746"
Abstract
The paper is a review of digital preservation theory and practice. Main concepts, stan- dards and recommendations in this field as well methods implemented by digital ar- chives (libraries and archival institutions responsible for digital preservation) are pre- sented. Although digital preservation is still evolving and we do not know whether the selected methods are reliable, it is generally known that implementing any met- hod with consistency, we can considerably contribute to the preservation of the access to the archived digital contents.
Key words: digital preservation, methods, concepts
KAVČIČ - ČOLIĆ, Alenka. Digital preservation: concepts and methods. Knjižnica, 54(2010)1–2, p. 99–119
1 Uvod
Leta 2007 je vodilna ameriška korporacija na področju informacijske tehnolo- gije EMC Corporation naročila IDC raziskavo o količinah ustvarjenih informacij v svetu (Gantz, et al., 2007; Barnett, 2007). Z razliko od študije, ki je nastala na Univerzi v Kaliforniji, Berkeley (How, 2003) in upošteva le izvirno ustvarjene informacije (brez podvajanj) in po tipih zapisov, zajema študija EMC/IDC celot- no količino informacij, ki jih človeštvo ustvari (digitalne in analogne), in jih vred- noti z digitalnim zapisom. Po njihovih ocenah proizvodnja vseh informacij na- rašča vsako leto za 57 %. Količina vseh informacij, ki so bile ustvarjene v svetu, je leta 2006 znašala 161 eksabajtov1 (161 milijard GB), leta 2008 pa 486 eksabaj- tov informacij. V grobem to pomeni 3 milijone krat informacije, ki nam jih ponu- jajo vse knjige, ki so bile kdajkoli napisane. Po njihovih predvidevanjih naj bi v letu 2010 ustvarili šestkrat več informacij kot leta 2006 oziroma 988 eksabajtov, kar bi znašalo 70 % vseh do takrat ustvarjenih digitalnih informacij.
Dejstvo je, da je digitalno okolje prevzelo pomembno vlogo v naših življenjih in delovanju. Pri tem se poraja vprašanje, kako ohraniti informacije, ki so pomem- bne za prihodnost. Zato se v zadnjih letih veliko več pozornosti namenja trajne- mu ohranjanju digitalnih virov, vendar pa nihče ne more z gotovostjo reči, da so strategije in metode, uporabljene v mnogih digitalnih arhivih, povsem zanesljive.
Bodočega razvoja informacijske tehnologije ter sprememb v digitalnih zapisih in nosilcih ne moremo predvideti. Od izuma svetovnega spleta je minilo manj kot 20 let in vsebine na njem so se začele ohranjati šele pred kratkim. Digitalna dediščina komaj nastaja in zato se praksa trajnega ohranjanja šele razvija. Prak- so trajnega ohranjanja razvijajo večje depozitne ustanove, kot so nacionalne knjižnice, nacionalni arhivi in raziskovalne organizacije, pa tudi vse večje števi- lo univerz. Morda so strategije in metode, ki jih zagovarjajo različni digitalni arhivi, na prvi pogled zelo različne, imajo vendarle skupna izhodišča in cilje. Poleg tega strokovnjaki na tem področju ugotavljajo, da nikakor ne zadostuje, da se s trajnim ohranjanjem digitalnih virov ukvarjajo le organizacije, ki so za to poz- vane, ampak bi morali pri tem sodelovati tudi drugi deležniki v življenjskem ciklusu digitalnih virov. Med njimi najprej njihovi ustvarjalci. V trenutku, ko nastane digitalni objekt, se začne proces trajnega ohranjanja2. Ta proces se na-
1 1 eksabajt (exabyte) znaša 1018 bajtov. Barnett v svojem blogu navaja primerjavo: 5 eksabajtov predstavlja količino informacij v 37.000 knjižnicah, velikosti Kongresne knjižnice.
2 Ni vseeno, kateri datotečni format bo avtor uporabil pri ustvarjanju svojega dela. Obenem je zelo pomembno, kdo so vsi nosilci tega dela, kdo je odgovoren za njihovo hranjenje. Za vzdrževanje dostopnosti do vsebine dela je potrebno delo rešiti vseh mogočih ovir (licenc, zaščite) in spremljati njegov življenjski ciklus skozi čas v primeru poznejših pretvorb v standardizirane formate. Zato težko rečemo, da se po končanem digitalnem delu to dejansko loči od avtorja. Nasprotno, delo
daljuje pri posrednikih v njegovem življenjskem ciklusu in nazadnje v digital- nih arhivih, ki so odgovorni za hrambo teh virov.
Teorija in praksa trajnega ohranjanja digitalnih virov sta se v knjižničarstvu za- čeli razvijati šele pred desetimi leti. Metodologija, značilna za to področje, skuša vgraditi določene procese pri ravnanju z digitalnimi viri. V teh procesih so bistve- nega pomena metapodatki, ki nam bodo omogočili ohraniti informacije o digital- nem objektu, ter postopki, ki so predvideni za ohranjanje dostopa do digitalnih vsebin.
Namen tega prispevka je podati povzetek konceptov in metod, ki bodo pomagali razumeti to področje in bodo, upamo, spodbudili kolege v stroki, da so pozorni na nekatere vidike trajnega ohranjanja digitalne dediščine že v začetni fazi njihove življenjske dobe. Prispevek temelji na analizi najnovejše strokovne literature in priprave strategije trajnega ohranjanja v Narodni in univerzitetni knjižnici (NUK).
To problematiko v NUK spremljamo od začetka, pa smo vendar šele v zadnjih nekaj letih uspeli doseči nekaj pomembnejših rezultatov. Zelo pomemben vidik pri traj- nem ohranjanju digitalnih virov je upravljanje z avtorsko in sorodnimi pravicami.
Zaradi obsežnosti tega področja ga v tem prispevku ne bomo obravnavali.
Čeprav se terminologija na področju trajnega ohranjanja hitro spreminja, pogo- sto se za isti pomen uporablja več izrazov, bomo poskušali najprej opredeliti tri temeljne pojme: digitalni arhiv in digitalni vir ter digitalni objekt. V strokovni literaturi je mogoče zaslediti več terminov in pomenov digitalnega arhiva. Biblio- tekarski terminološki slovar (Kanič et al., 2009, str. 72) podaja dva pomena.
Digitalni arhiv je arhiv digitalnih dokumentov, lahko je tudi zbirka vsebinsko, logično povezanih elektronskih dokumentov (npr. starejših letnikov elektron- skih časopisov). Mednarodni standard za odprt arhivski informacijski sistem – OAIS (Open archival information system) (ISO 14721, 2003) uporablja termin digitalni arhiv, medtem ko ameriških skupina znanstvenih knjižnic – RLG (Re- search Libraries Group) in OCLC (Online Computer Library Center) govorita o zaupanja vrednih repozitorijih. Na začetku je to bilo vezano na koncept skladi- ščenja, ki se je izvajalo v posebnih, za to organiziranih enotah izven knjižnice. S tem konceptom so univerze in raziskovalni inštituti imenovali digitalne zbirke, ki jih ustvarjajo akademsko osebje in študentje. Večinoma te zbirke razvijajo in vzdržujejo računalniški oddelki ali druge enote izven knjižnice in ne predvidevajo trajnega ohranjanja. Zato so tudi bile glavne pobudnice za razvoj tovrstnih siste- mov ravno univerze. V prispevku uporabljamo termin digitalni arhiv za poime- novanje organizacije, ki je zadolžena za trajno ohranjanje nacionalne digitalne dediščine (npr. knjižnice, arhivi ali druge sorodne ustanove) in izvaja dejavnosti, ki so potrebne za ohranjanje in zagotavljanje dostopnosti digitalnih virov, medtem ko repozitorij predstavlja programsko rešitev, ki avtomatizira vse procese pri- dobivanja, trajnega ohranjanja in dostopa do digitalnih vsebin v digitalnem arhi- vu. Digitalni repozitoriji so torej sistemi za digitalno skladiščenje.
Pojem digitalni (informacijski) viri (ang. digital resources) v našem primeru us- treza tudi izrazom digitalno gradivo (ang. digital material), digitalna publikacija (ang. digital publication), digitalna informacija (ang. digital information), tudi spletne publikacije ipd. Gre za dokumente, ki so zapisani v obliki digitalnega zapisa (običajno dvojiškem), nastali z digitalizacijo ali že izvorno z računalnikom in so dostopni na elektronskem mediju.
Pojem digitalni objekt je izposojen iz sistemske analize. Pomeni katerokoli digital- no vsebino, ki predstavlja zaokroženo intelektualno enoto. To je lahko digitalna slika, besedilo, knjiga, dokument, publikacija, glasbeni posnetek itd. Sestavljajo ga podatki, metapodatki in označevalec (identifikator). V prispevku je digitalni objekt uporabljen kot sinonim za digitalno vsebino, elektronsko publikacijo in elektronski oziroma digitalni vir. Razlika je v kontekstu. Sestavljajo ga podatki, metapodatki in označevalec (identifikator).
2 Kaj je trajno ohranjanje digitalnih virov?
V slovenski strokovni literaturi se srečujemo z različnimi prevodi angleškega termina »long-term preservation of digital materials« ali »digital preservation«.
Različni strokovnjaki uporabljajo dobesedni prevod besede »long-term« v smis- lu dolgoročno ali dolgodobno ohranjanje oziroma dolgoročna ali dolgodobna hramba (npr. Novak, 2002; Novak, 2007; Kodrič - Dačić, 2005)3. Vendar ima v arhivski stroki dolgoročna hramba nekoliko drugačen pomen. Dolgoročna ali dolgodobna hramba časovno pomeni hrambo nad štirimi do desetimi leti. To gradivo ni nujno arhivsko, ki bi ga bilo potrebno trajno hraniti. Namreč, arhivisti ločijo kratkoročno hrambo (do 5–10 let) od dolgoročne (več kot 5–10 let). Po določenem obdobju postane gradivo arhivsko4. Zato smo se v knjižničarski stroki odločili za termin trajno ohranjanje digitalnih virov, ker dostopa do digitalnega gradiva ne smemo omejevati na določeno obdobje, ampak ga moramo trajno ohranjati, to pa seveda ne pomeni neskončno. Termin je tudi bližji prevodu (ang.)
»digital preservation«, ki v zadnjih letih vse bolj nadomešča uporabo angleške različice (ang.) »long-term preservation«.
3 V drugih jezikih se izraz »long-term preservation« prevaja dobesedno: v španščini »conservación a largo plazo«, v italijanščini »conservazione a lungo termine«, v francoščini »préservation à long terme«, v srbščini in hrvaščini »dugoročno čuvanje«.
4 Novak (2007) razlaga, da kljub 52 zakonom, ki določajo roke hranjenja v Sloveniji, roki hranjenja za posamične vrste dokumentarnega gradiva še niso jasno določeni. Nadalje ugotavlja, da imajo pri posameznem dokumentarnem gradivu različne ustanove (Arhiv RS, Ministrstvo za javno upravo in Centralni arhiv Evropskega sveta) določene različne roke kratkotrajne hrambe. Tudi pri dolgoročni hrambi ni dovolj jasnih določil, čeprav je tudi ta omejena. V Centralnem arhivu Ev-
Poleg izraza trajno ohranjanje digitalnih virov se v angleško govorečih deželah v zadnjem desetletju uporabljajo tudi drugi sorodni termini, kot je npr. digitalno skrbništvo (ang. digital curation) ali digitalno arhiviranje (ang. digital archiving).
Razlika med temi tremi izrazi je odnos do gradiva, ki ga trajno ohranjamo. Digital- no skrbništvo zajema vsa dejanja, ki so potrebna za vzdrževanje digitalnih virov skozi čas in za prihodnje generacije, med njimi tudi dodajanje informacij trajno hranjenim vsebinam (Beagrie, 2006). Trajno ohranjanje digitalnih virov pomeni ohranjanje dostopnosti do digitalne vsebine skozi čas. Zajema različne dejavnosti, kot so načrtovanje, zagotavljanje virov, uporabo metod in tehnologij, ki omogoča- jo, da elektronski viri ostanejo dostopni in uporabni v prihodnosti. Pri digital- nem arhiviranju pa je poudarek na skladiščenju digitalnih virov in njihovem ohranjanju za prihodnost (Beagrie, 2006).
Obstaja več definicij koncepta trajnega ohranjanja. RLG opredeljuje trajno ohra- njanje digitalnih virov kot upravljanje z aktivnostmi, ki so potrebne za trajno vzdrževanje bitnega toka (vključno z metapodatki), kar zadostuje za ustrezno reproduciranje izvirnega dokumenta, in zagotavljanje dostopnosti do njegove vsebine skozi čas, kljub tehnološkim spremembam (Trusted, 2002). Ameriško združenje knjižnic (American Library Association – ALA) pa definira trajno ohra- njanje digitalnih virov kot skup strategij in dejavnosti, ki so usmerjene na ust- varjanje digitalnih vsebin, ohranjanje njihove celovitosti ter njihovo vzdrževanje (Definitions, 2007).
Če povzamemo obe definiciji, trajno ohranjanje pomeni ohranjanje dostopnosti do digitalne vsebine skozi čas. Zajema različne dejavnosti, kot so načrtovanje, zagotavljanje virov, uporabo metod in tehnologij, ki omogočajo, da elektronski viri ostanejo dostopni in uporabni v prihodnosti.
3 Zgodovina trajnega ohranjanja digitalnih virov in različne pobude
Strokovnjaki so v začetku 90. let ugotovili, da nihče ne skrbi za ustvarjene digitalne vsebine in da so te prepuščene nestrokovnemu ravnanju različnih or- ganizacij. Potrebno je bilo določiti nekaj pogojev, ki bi jih prav ustanove, name- njene skladiščenju in trajnemu ohranjanju tega gradiva, morale izpolnjevati. S tem se je začela zgodovina trajnega ohranjanja digitalnih virov. Leta 1994 sta ame- riška Komisija za trajno ohranjanje in dostop (Commission on Preservation &
Access) in posebna delovna skupina za arhiviranje digitalnih virov pri RGL (RLG Task Force on Archiving of Digital Information) izrazili potrebo po definiciji pogojev, ki jih morajo izpolnjevati zanesljivi digitalni arhivi. Hkrati je bilo ob- likovano besedilo referenčnega modela za odprt arhivski informacijski sistem
(OAIS), sprejet leta 2003 kot mednarodni standard ISO 14721 (2003), ki ga je v letu 2009 revidirala ustanova Consultative Committee for Space Data Systems (CCSDS) (Reference, 2009).
Leta 2002 sta RLG in konzorcij OCLC pripravila skupno poročilo Trusted digital repositories: attributes and responsibilities (2007), v katerem so bile opredeljene značil- nosti in vse odgovornosti na podlagi OAIS, ki jih morajo prevzeti zaupanja vred- ni digitalni arhivi. Vendar pa nihče ni preverjal, ali digitalni arhivi in njihovi re- pozitoriji dejansko izpolnjujejo te osnovne pogoje. Da bi zagotovili zanesljivost, so se nemški strokovnjaki odločili, da pravim digitalnim arhivom dodelijo cer- tifikate, ki bi zagotavljali, da digitalni arhivi in njihova skladišča v različnih or- ganizacijah sledijo obstoječim standardom in zahtevanim postopkom. Prvi tak- šen je DINI-jev (Deutsche Initiative fur Netzwerkinformation) certifikat. Ta v svojem začetku leta 2003 ni bil preveč zahteven, saj so bile definicije po stan- dardu OAIS zelo fleksibilne. DINI je pozneje doživel nekoliko redakcij, zadnje leta 2006. Namenjen je predvsem trajnemu ohranjanju znanstvenih publikacij, ki so shranjene v digitalnih repozitorijih nemških univerz. Seveda pa DINI-jev certifikat lahko pridobijo tudi tuje organizacije (DINI, 2006).
RLG in NARA (National Archives and Records Adminstration), sta nadaljevali delo RLG in OCLC iz leta 2002 in v letu 2005 objavila publikacijo An audit for the certification of trusted digital repositories. Slednjo sta Center za ameriške razisko- valne knjižnice (CRL – Center for Research Libraries) in OCLC dopolnila in leta 2007 objavila Trustworthy repositories audit & certification (TRAC). TRAC je natančne- je specificiral publikaciji iz leta 2002 in 2005 in je bil napisan kot kontrolni seznam pogojev, ki jih morajo izpolnjevati digitalni arhivi. Predstavljal je nekakšno merilo pri ocenjevanju njihove zanesljivosti.
Zavedajoč se velikega pomena trajnega ohranjanja digitalnih virov je UNESCO naročil izdelavo smernic za digitalne arhive, ki jih je leta 2003 pripravila Avstral- ska nacionalna knjižnica (Guidelines, 2003). Pri tem so pod vodstvom Colina Webba sodelovali največji svetovni strokovnjaki na področju trajnega ohranjanja digitalnih virov. Smernice obravnavajo postopke trajnega ohranjanja od ustvar- jenja digitalnega vira, in sicer določanje odgovornosti, kriterijev izbire ter izbire metod in potrebnih informacij, ki naj bi olajšali dostop do digitalnega vira v pri- hodnosti.
Pri vseh omenjenih prizadevanjih je dosledno upoštevan referenčni model za OAIS, trajno ohranjanje digitalnih virov pa je razumljeno kot medsebojna odvis- nost trajnega ohranjanja in organizacije (podpora vodstva in strategije organiza- cije), tehnologije (repozitorij) in drugih virov (kadrovski, finančni itd.). To McGo- vern (2007) predstavlja kot »trinožni stol« trajnega ohranjanja digitalnih virov (Slika 1).
Slika 1: Trinožni stol trajnega ohranjanja digitalnih virov (prirejeno po McGo- vern, 2007)
Poleg omenjenih prizadevanj so se po svetu pojavile različne pobude in se izva- jali pomembni raziskovalni projekti, ki so skušali prispevati k razvoju področja trajnega ohranjanja digitalnih virov. Naj omenimo le nekaj od njih:
- Preserving Access to Digital Information (PADI, http://www.nla.gov.au/padi/
index.html) je spletno mesto, ki ga od leta 1996 vzdržuje Nacionalna knjižnica Avstralije. Zaradi skupnih mednarodnih projektov od leta 2003 dalje združuje informacije iz celega sveta na različnih področjih trajnega ohranjanja digital- nih virov, kot so arhiviranje spleta, metapodatki, standardi in drugo.
- Internet Archive (http://www.archive.org/) je neprofitna organizacija, ki od leta 1996 zajema celotni svetovni splet. Njihovo poslanstvo pri ohranjanju digitalne dediščine na spletu se nadaljuje v okviru konzorcija IIPC, katerega ustanovitelj je med drugimi tudi Internet Archive.
- International Internet Preservation Consortium (IIPC, http://netpreserve.org/).
Konzorcij je nastal leta 2003, ko se je 12 ustanov odločilo, da skupaj razvija- jo orodja za zajemanje spleta. Danes deluje konzorcij predvsem na štirih po- dročjih: razvoj orodja za zajemanje spleta Heritrix, razvoj orodij za dostop in trajno ohranjanje spletnih strani. Leta 2007 je NUK postal član tega konzor- cija in uporablja njihova orodja za zajemanje spleta.
- Digital Curator Centre (DCC, http://www.dcc.ac.uk/) je rezultat skupne pobude med Joint Information Systems Committee (JISC)5 in britanskim nacionalnim programom za e-znanost. Ustanovljen je bil leta 2004. Na njihovih spletnih straneh redno objavljajo najnovejše novice z različnih področij prakse traj- nega ohranjanja v Veliki Britaniji.
- DigitalPreservationEurope (DPE, http://www.digitalpreservationeurope.eu/) je nastal iz evropskega projekta ERPANET in ima namen ozaveščati na področju trajnega ohranjanja digitalnih virov. Na njihovih straneh so objavljeni pris-
5 Joint Information Systems Committee - JISC (http://www.jisc.ac.uk/).
pevki partnerjev in videoposnetki predavanj eminentnih strokovnjakov na tem področju. V sodelovanju z DCC so izvedli evropski projekt DRAMBO- RA (Digital depository audit method based on risk assessment, http://
www.repositoryaudit.eu/), kjer so razvili metodologijo za samostojno eval- vacijo digitalnih repozitorijev. Cilj te metodologije je pomagati organizaci- jam, ki upravljajo z digitalnimi arhivi, da se v celoti zavejo ciljev, aktivnosti in virov, preden ocenijo možna tveganja pri trajnem ohranjanju digitalnih virov v organizaciji.
Poleg različnih združenj in pobud nekatere nacionalne ustanove, kot je nacional- ni arhiv v Veliki Britaniji (http://www.nationalarchives.gov.uk/), ki spremljajo področje trajnega ohranjanja in objavljajo zanimive analize in priporočila na področju trajnega ohranjanja digitalnih virov. V britanskem nacionalnem arhivu so npr. razvili register formatov PRONOM in orodje za prepoznavo datotečnih formatov DROID. K razvoju področja so veliko prispevali tudi nacionalni in evropski projekti. Med njimi je vredno omeniti nemška projekta NESTOR in KOPAL ter evropske projekte iz okvirnih programov, npr. CASPAR, PLANETS, LIWA in LOCKSS.
Značilnosti najnovejšega razvoja na področju trajnega ohranjanja digitalnih vi- rov so naslednje:
- po desetih letih imamo prvo generacijo delujočih repozitorijev za skladiš- čenje digitalnih virov;
- v ospredju so odprtokodne rešitve, ki jih razvija mednarodna skupina razis- kovalcev in univerzitetnih institucij;
- v uporabi so različne metodologije za evalvacijo zanesljivosti repozitorijev za trajno ohranjanje;
- nastaja potreba po ustvarjanju arhivov publiciranih elektronskih revij, ki so bile dosegljive le z licenco;
- razvite države (ZDA, Kanada, Evropa in Avstralija) vlagajo vse več sredstev v razvoj tehnologij, programske opreme in rešitev za trajno ohranjanje;
- v letu 2008 se je začelo preučevati različne možnosti ohranjanja digitalnih virov v domeni tehnologij spleta 2.0 (virtualni interaktivni dostopi, socialno mreženje ipd.).
Pri tem je opaziti različne pristope med Evropo in ZDA. ZDA dajejo prednost raziskovanju pred samim procesom trajnega ohranjanja. Večje fundacije, kot je npr. Andrew Mellon Fundation, so glavni viri financiranja. V Evropi pa je večji poudarek na mreženju in podpornih dejavnostih v okviru področja trajnega ohra- njanja, zlasti digitalnem skrbništvu, ki se ukvarja z upravljanjem življenjskega ciklusa digitalnih virov oz. dejavnosti, in zagotavljanju dostopa do vsebin v pri- hodnosti.
4 Standardi in priporočila
Namen standardizacije na področju trajnega ohranjanja je uvajanje minimalnih zahtev in pogojev za ohranjanje dostopnosti do digitalnih vsebin. Najpomem- bnejši mednarodni standard je že omenjen referenčni model za odprt informa- cijski arhivski sistem – OAIS (ISO 14721, 2003). Referenčni model OAIS opre- deljuje procese, ki naj bi se izvajali v digitalnih arhivih, da bi se zagotovilo trajno ohranjanje digitalnih vsebin. Te procese spremlja tudi informacijski model, ki zajema informacije o digitalnem objektu, kontekstu njegovega delovanja in po- datke o njegovi verodostojnosti. Po nekaj letih teoretiziranja o procesih v mo- delu, smo končno dobili sisteme za digitalno skladiščenje (repozitorije), ki lahko izvajajo vse procese, navedene v referenčnem modelu (Kavčič - Čolić, 2004a;
Kavčič - Čolić in Kragelj, 2008). Problem, ki se v zadnjem letu poraja, je, kako integrirati procese trajnega ohranjanja digitalnih virov v obstoječe knjižnične procese. Torej, kako preiti iz teorije v prakso.
Standardizacija se izvaja tudi na področju datotečnih formatov. Da bi se preprečila izguba podatkov, je priporočena uporaba formatov brez ali z minimalnim zgoščevanjem. Tako na primer za arhivsko skladiščenje strokovnjaki priporoča- jo datotečni format TIFF (ISO 12234-2, 2001) in TIFF/IT (ISO 12639, 2004), pred- vsem za barvne slike in podobe z bogatimi detajli. Ker datoteke v TIFF zahtevajo veliko pomnilniškega prostora, se v zadnjih dveh letih za besedila vse bolj uvelja- vlja standard JPEG 2000 (ISO 15444, 2004)6. JPEG 2000 ali JP2 zahteva do 50 % manj pomnilniškega prostora od formata TIFF. Razlika je v potencialni izgubi v barvnem spektru RGB, ki je našim očem nevidna. Poleg tega JP2 sprejme – z ra- zliko od TIFF – tudi predelavo z optično prepoznavo besedil (uveljavljena kra- tica OCR). Ta standard, kot standard za trajno ohranjanje je prevzel tudi Xerox Research Center. Za dokumente v PDF je priporočena uporaba različice PDF/A (ISO 19005-1, 2005).
Poleg omenjenih so v uporabi tudi drugi formati, ki imajo, čeprav niso standar- dizirani, obsežno dokumentacijo in se zato priporočajo za trajno ohranjanje digital- nih virov. Med njimi so WAVE (Broadcast WAVE Format – BWF) za glasbene posnetke, ICC.1 (International Color Consortium – color profile format) za na- tančno prepoznavo barv, ki je enak standardu ISO 15076-1 (2005), GeoTIFF za georeferencirane in geokodirane rastrske slike ter SPIFF (Still Picture Interchange File format (ISO/IEC 10918-1, 1994) in JFIF (JPEG File Interchange Format) za slikovno gradivo.
Med raziskavami na področju pomnilniških medijev so za knjižničarje zanimi- va poročila Adriana Browna, vodje oddelka za raziskave na področju trajnega
6 Ker TIFF zavzame preveč pomnilniškega prostora, je Kanadska nacionalna knjižnica leta 2008 določila JPEG2000 za standardni format pri digitalizaciji vseh vsebin.
ohranjanja digitalnih virov v britanskem nacionalnem arhivu. Brown od leta 2003 analizira lastnosti (trajnost, kapaciteto, trdnost, zastarevanje, ceno in občutljivost) različnih optičnih in magnetnih pomnilniških medijev in ugotavlja, da so naj- primernejši za skladiščenje podatkovnega toka magnetni trakovi LTO (Linear Tape Open) (Brown, 2008a). Brown ugotavlja tudi idealne pogoje za dolgoročno hram- bo, ki so v povprečju 18–22 stopinj C in 20–45 % relativne vlage, odvisno od pomnilniškega medija (Brown, 2008b). Na straneh britanskega nacionalnega arhi- va je Brown objavil še priporočila za grafične formate in zgoščevanje slikovnih formatov.
Poleg Unescovih priporočil so na spletu objavljeni različni priročniki in smer- nice za trajno ohranjanje, ki se nenehno prenavljajo, ker je tudi področje še v razvoju. Med boljšimi je priročnik Digital preservation handbook (2008), ki ga vzdržuje Digital Preservation Coalition in je nadgradnja priročnika avtorjev Bea- grie in Jones (2001). Evropski projekti in različna združenja na svojih spletnih mestih omogočajo bogat vir informacij s področja trajnega ohranjanja digitalnih virov. Poleg tega so tu še navodila in priporočila specializiranih ustanov, kot so video in glasbeni arhivi7.
5 Zakaj so metapodatki tako pomembni?
Ko odločamo o trajnem ohranjanju digitalnih virov, je treba imeti v mislih, kako bodo jutrišnji strokovnjaki ali uporabniki razumeli shranjene vsebine. Denimo, da želimo samostojno ohraniti celotno strukturo in vsebino na primeru tabele, ki je bila ustvarjena za moj prispevek v letu 1996 (Preglednica 1).
Preglednica 1: Primer tabele, ki jo želimo trajno ohraniti (povzeta po Kavčič - Čolić, 1996, str. 84)
a b z a r b o z i a k s m e d a k
A 1992 1995–96
j i r e t s i g a
M 5 11
a b z a r b o z i a j { i
V 85 78
a b z a r b o z i a j { i
V 53 54
a b z a r b o z i a j n d e r
S 61 50
o g u r
D 17 23
J A P U K
S 221 216
7 Primer je londonski AHDA (Arts and Humanities Data Service), ki izdaja publikacije, namenjene različnim vidikom trajnega ohranjanja. Več na spletni strani http://ahds.ac.uk/preservation/
Ko bo uporabnik čez 50 let odprl tabelo, bo iz besedila lahko razbral, da je bila napisana v slovenščini. Poleg tega bo ugotovil, da so v levem stolpcu različne stopnje akademske izobrazbe, v desnih stolpcih pa so navedena števila za dva različna obdobja. Glavni problem je, da iz same tabele ne bo mogel ugotoviti, kakšen je namen teh podatkov, niti v kakšnih okoliščinah, je bila tabela ustvarje- na. Zato bo potreboval dodatne informacije, ki mu bodo pomagale razumeti, da podatki predstavljajo izobrazbeno strukturo zaposlenih v anketiranih special- nih knjižnicah v letih 1992 in 1995–96 in da je tabela del analize stanja v special- nih knjižnicah, ki jo je spisala Alenka Kavčič - Čolić leta 1996.
Nosilci teh informacij, ne le vsebinskih (o digitalnem objektu), kot v navedenem primeru, ampak tudi tehničnih, administrativnih, informacij o strukturi, prove- nienci, verodostojnosti, avtentičnosti itd., so metapodatki. Iz njih izvemo, kdo je imetnik avtorskih pravic, katero aplikacijo potrebujemo za dostop do vsebine dokumenta, kaj se nam mora prikazati ob odpiranju dokumenta, ali je bila izvir- na datoteka pretvorjena v drug format, zakaj je bila pretvorba izvedena itd. Refe- renčni model za OAIS je v zvezi s tem določil informacijski model, ki naj bi zajel vse relevantne informacije, potrebne za to, da bi bodoči uporabniki pravilno ra- zumeli digitalni objekt in ga znali tudi pravilno odpreti in uporabiti (Kavčič - Čolić, 2004b). Poleg mnogih obstoječih naborov metapodatkov, ki so nastali bodisi pod različnimi vplivi evropsko-ameriškega ali novozelandskega modela (Metadata, 2002), npr. NEDLIB (Lupovici in Masanès, 2000) in LMER (Steinke, 2005), se v zadnjih letih vse bolj uveljavlja nabor metapodatkov za trajno ohranjanje PREMIS, ki je rezultat skupnega projekta RLG in OCLC, trenutno pa ga vzdržuje Kongres- na knjižnica (PREMIS, 2010). Mnoge evropske knjižnice zato pri trajnem ohra- njanju digitalnih virov že razmišljajo o uporabi nabora PREMIS.
Posebna zvrst metapodatkov so trajni identifikatorji (trajni označevalci) digital- nih objektov, ki so pomembni predvsem v spletnem okolju. Povprečna življe- njska doba spletne strani je 40 dni. Poleg tega se informacijska tehnologija, na katerih slonijo, prenavlja vsake 2,5–3 leta. Zato so spremembe strežnikov in posledično tudi njihovih URL naslovov zelo pogoste. Velikokrat se dogaja, da je strežnik, na katerem smo dostopali do določene publikacije, prenehal delovati, in je ta bila prenesena na drugega. S tem je publikacija dobila nov URL naslov. Z navadno poizvedbo s spletnim brskalnikom bomo to publikacijo morda našli, vendar nikoli ne bomo vedeli, ali je to bila ravno tista, ki smo jo uporabili v pre- teklosti. Zato potrebujemo trajne identifikatorje ali trajne označevalce vira. Ti nam lahko pomagajo, da nedvomno identificiramo elektronski vir in ga lokalizira- mo, kjerkoli je ta shranjen.
Obstajajo različne zvrsti trajnih identifikatorjev. Med založniki je najpopularnejši DOI (Digital Object Identifier, http://www.doi.org/),ki se izdaja enako kot ISSN.
Nacionalne knjižnice pogosteje uporabljajo URN (Uniform Resource Name) ozi- roma enotno ime vira, ki je z razliko od DOI brezplačen, njegovo sintakso pa
lahko knjižnice določijo same. Trajni označevalec vira URN je lahko avtomatsko dodeljena številka ali je sestavljen iz šifriranih informacij o viru. Navadno traj- ne označevalce vira spremlja podatkovna baza (razreševalec), kjer so ustrezno navedene lokacije URL, ki se nenehno prenavljajo. Ko uporabnik v razreševalcu vtipka URN, dobi pravo lokacijo vira. Poleg tega trajni označevalci vira zagotav- ljajo avtentičnost vira in se zato uporabljajo tudi pri bibliografskih referencah.
URN uporabljamo tudi v Nuku.
6 Metode za trajno ohranjanje digitalnih virov
Cilji različnih metod za trajno ohranjanje so predvsem naslednji:
- ohranjanje dostopnosti do vsebine digitalnega vira;
- ohranjanje identitete digitalnih objektov (s pomočjo metapodatkov, trajnih identifikatorjev itd.);
- ohranjanje razumljivosti digitalnega objekta (vsebinski kontekst, odnos do drugih objektov, okolje delovanja itd.);
- ohranjanje izvirnosti podatkov – nespremenljivosti – zaščita proti virusom, varno shranjevanje podatkov, ohranjanje nosilcev, primerni pogoji shran- jevanja, kontrola kakovosti podatkov itd.;
- ohranjanje avtentičnosti digitalnih virov – možno je preveriti vir (provenien- co) in vsebino dokumenta;
- ohranjanje obstojnosti podatkov in nosilcev – pomembno pri migraciji nosil- cev;
- ohranjanje sposobnosti prikazovanja podatkov – vezano na obstojnost SW.
Ko se odločamo o metodi za trajno ohranjanje, se moramo vprašati, kaj želimo ohraniti: dostop do vsebine digitalnega objekta in njegov logični zapis ali le dostop do njegove vsebine, ne glede na njegov logični zapis? Pri tem je treba razumeti strukturo digitalnega objekta.
Digitalne objekte sestavljajo štiri osnovne ravni (glej Preglednico 2). Najnižja je fizična raven, ki predstavlja zapis podatkov na fizičnem nosilcu. Druga, logična raven, predstavlja format ali sintakso zapisa (programski jezik, aplikacija itd.).
Tretja, konceptualna raven, nam omogoča razumevanje vsebine digitalnega ob- jekta. V tej ravni izvemo, ali je pred nami slika, besedilo, tabela itd. Zadnja, četrta raven, predstavlja vse lastnosti, ki so specifične za digitalni objekt: zvočni pos- netek, določena barva, če gre za podobo, funkcionalnost pri dostopu itd.
Preglednica 2: Struktura digitalnega objekta
)
… k o v z , a v r a b , a p o t s o d n i
~ a n ( I T S O N T S A L H I N
^ I F I C E P S T E K A P
) a k i l s , o l i d e s e b : a n i b e s v ( N E V A R A N L A U T P E C N O K
) a m e r p o a k s m a r g o r p – a s i p a z a s k a t n i s ( N E V A R A N
^ I G O L
) u c l i s o n m e k e n a n s i p a z ( N E V A R A N
^ I Z I F
Thibudeau (2002) je zelo nazorno predstavil razliko med dvema logičnima ravne- ma. Na Sliki 2 je predstavljeno isto besedilo v MS Wordu in v PDF. Z rdečo sta označeni enaki vrstici v besedilu. Razlika je očitna.
Slika 2: Razlika med dvema logičnima ravnema (Thibodeau, 2002)
V tem primeru je konceptualna raven nespremenjena. Različna logična raven vpliva tudi na specifične lastnosti digitalnega objekta, saj funkcionalnosti v MS Wordu niso enake kot v datoteki v PDF.
Pri izbiri metode za trajno ohranjanje moramo vedeti, da elektronskih virov ne moremo ohranjati enako kot analogne. Njihova avtentičnost je odvisna od infor- macijske tehnologije, logične strukture in vsebinskega konteksta (namen, za katerega je bil dokument ustvarjen).
Thibodeau (2002) našteva 4 kriterije za izbiro ustrezne metode ohranjanja:
- izvedljivost metode – za njeno izvajanje mora obstajati ustrezna programska oz. računalniška oprema (SW/HW);
- trajnost metode – mora se prilagajati tehnološkim spremembam in drugim metodam;
- praktičnost – njena zahtevnost in cena morata biti primerni vrednosti vse- bine;
- ustreznost – metoda mora ustrezati zvrsti digitalnih objektov, ki naj bi se traj- no ohranili.
Pri trajnem ohranjanju digitalnih virov je treba upoštevati dva različna vidika, ki se med seboj dopolnjujeta, in sicer: skladiščenje podatkovnega toka in ohranja- nje trajnega dostopa do digitalnih vsebin.
6.1 Skladiščenje podatkovnega toka
Skladiščenje podatkovnega toka (ang. bitstream) zadeva predvsem fizično raven digitalnega objekta. Pri skladiščenju podatkovnega toka je zelo pomembno, da nam sistem za skladiščenje zagotavlja naslednje pogoje:
- zadostne pomnilniške in funkcionalne kapacitete;
- tehnično podporo za hitro reagiranje v primeru nesreč;
- sistem mora upoštevati granularnost digitalnih objektov ter hierarhične odnose med datotekami oz. digitalnimi objekti. Pri tem je pomembna tudi sposobnost različnega preimenovanja datotek, ki naj ne bi vplivalo na obsto- ječe hierarhične odnose. Razviden mora biti odnos med fizično, logično in konceptualno ravnjo digitalnega objekta;
- sposobnost za upravljanje z redundantnim arhivom – omogočiti mora up- ravljanje s podvojenimi vsebinami v različnih formatih in različnimi verzi- jami enega digitalnega objekta;
- na drugi strani pa mora točno zaznati identične kopije digitalnega objekta;
- sposobnost avtomatskega preverjanja napak.
Primera rešitve za skladiščenje digitalnih objektov, ki izpolnjujejo vse omenjene zahteve, sta npr. komercialni DigiTool od exLibrisa in odprtokodna rešitev FE- DORA, ki je nastala v sodelovanju med Cornell University in University of Vir- ginia, in jo naprej razvija mednarodni konzorcij (Kavčič - Čolić in Kragelj, 2008).
Poleg tega se priporoča, da se osvežitev ali migracija na nove fizične nosilce opravi vsaki dve leti. Za fizične nosilce se priporočajo magnetni trakovi, čeprav je pri njih skladiščenje linearno in imajo omejeno pomnilniško kapaciteto (njihova življenjska doba je do 30 let). Druga možnost so magnetni (trdi) diski, ki omogoča- jo hiter dostop do podatkov in prenašajo večje kapacitete. Problem je, da je nji- hova povprečna življenjska doba 5 let (Brown, 2008a).
6.2 Ohranjanje dostopa do vsebin digitalnega objekta
Ohranjanje trajnega dostopa do digitalnega objekta zadeva logično in konceptua- lno raven ter raven specifičnih lastnosti digitalnega objekta. Težava je v tem, da danes še ni enotnih rešitev. Vedno obstaja nevarnost izgube podatkov, predvsem na ravni specifičnih lastnosti. Pri oblikovanju strategije za trajno ohranjanje digitalnih virov moramo vsekakor upoštevati, da je ne glede na izbrano metodo, potrebno vlagati veliko sredstev.
Glede na osredotočenost trajnega ohranjanja digitalnih virov delimo metode za trajno ohranjanje v dve skupini (Preglednica 3): metode, ki so namenjene ohra- njanju logične ravni digitalnega objekta, in metode, ki so namenjene ohranjanju konceptualne ravni digitalnega objekta.
Preglednica 3: Metode za trajno ohranjanje dostopa do elektronskih virov
a j n a j n a r h o s u k o
F Metode
a t k e j b o a g e n l a t i g i d i n v a r e n
~ i g o l e j n a j n a r h
O -muzejskipristop
v e j o r t s h i r a t s a j i c a n r a k n i e r -
a j i c a l u m e -
-softverskiineniring(VERS,UVC…) a
t k e j b o a g e n l a t i g i d i n v a r e n l a u t p e c n o k e l e j n a j n a r h
O -migracije
) l e d o M t c e j b O d e p y T ( M O T -
« e t t e s o R z i n e m a k
» -
Metode, ki so namenjene ohranjanju logične ravni digitalnega objekta, zavračajo vse mogoče spremembe v digitalnem objektu. Najbolj znan je muzejski pristop, pri katerem se ohranja stara tehnologija. Vendar težave nastanejo pri njihovem vzdrževanju oziroma okvarah. Poleg tega je vsaka informacijska tehnologija vezana na generacijsko znanje. Pri muzejskem pristopu so zato strokovnjaki, ki bi lahko pomagali pri odpravi okvar, zelo redki in dragi. So pa zato možne druge rešitve, kot npr. reinkarnacija starih strojev z dodajanjem novih čipov, ki naj bi oponašali delovanje starih strojev, ali uporaba emulatorjev, ki omogočajo, da se določena tehnologija obnaša kot druga (npr. novi operacijski sistem). Vendar je emulatorje treba napisati in so zato zelo dragi. S tako vrtoglavimi spremembami informacijske tehnologije bi bilo potrebno za vsako novo platformo ali tehnologijo izdelati nov emulator. Pri zapletenih sistemih in sestavljenih tehnologijah (Java, različne platforme, aplikacije, ki integrirajo strežnike in odjemalce ipd.) je pro- gramiranje emulatorjev zelo zahtevno. Poleg tega dodajanje čipov in emulator- jev predvideva tudi njihovo dodatno vzdrževanje.
Tu so še druge metode, kot je npr. tiskanje na papir v kombinaciji z drugimi vzporednimi metodami. Raymond Lorie (2002) je predlagal metodo abstrakcije
podatkov, pri kateri bi se v strojnem jeziku opisala pravila kodiranja in dekodira- nja podatkov v formatih, v katerih so napisani dokumenti. Strojni jezik je tako enostaven, da ga v prihodnosti lahko prebere vsak računalnik. Slabost metode je, da ima omejeno število funkcij. Zato bi bile mnoge specifične značilnosti digital- nih objektov izgubljene.
Metode, ki so namenjene ohranjanju konceptualne ravni digitalnega objekta, temeljijo na pretvorbi logičnih formatov v novejše. Najbolj znana metoda je migracija, ki se lahko odvija na ravni formata (npr. Word > PDF), na ravni verzije formata (npr. SGML>HTML>XML) ali na strojni ravni (migracija dostopnosti s pomočjo pregledovalnikov ali orodij za upravljanje in izvajanje postopkov). V vsakem primeru pride do kakšne izgube podatkov ali funkcionalnosti (raven specifičnih lastnosti) digitalnega objekta.
Večina nacionalnih knjižnic, ki imajo poseben program trajnega ohranjanja digital- nih virov, ohranjajo dve kopiji digitalnega objekta, in sicer: izvirni digitalni ob- jekt in digitalni objekt v arhivskem formatu (tj. formatu, ki najbolj ustreza arhi- viranju in je lahko enak izvirnemu). Pri tem si pomagajo tudi s seznami forma- tov, npr. PRONOM, GDFR (Global Digital Format Registry8), kjer dobijo infor- macije o lastnosti podobnih formatov. Težko je predvideti, kako se bo razvijala tehnologija v prihodnosti. Zato je pomembno, da se ohrani tudi izvirni digitalni objekt, v primeru, da se bo potrebno vrniti na začetek pred migracijo.
V San Diego Supercomputer Center, ZDA, izvajajo tudi metodo, imenovano »ka- men iz Rosette«, ki temelji na seznamu reprezentativnih vzorcev podatkovnih tipov z vsemi značilnostmi (Heminger in Robertson, 1998). Vzorci se podvajajo v drugih formatih, ki jih lahko prebere trenutna računalniška tehnologija, in pred- stavljajo skupino referenc za morebitno dekodiranje starejših formatov.
Alternativne metode, ki se bodo mogoče v prihodnosti uporabljale, so arheolo- gija podatkov, torej raziskave za povrnitev podatkov iz starejših zapisov in po- dobno.
7 Kje smo v Sloveniji na področju trajnega ohranjanja digitalnih virov?
V Sloveniji se večja pozornost področju trajnega ohranjanja digitalnih virov posveča šele v zadnjih nekaj letih. Tako je v Resoluciji o Nacionalnem programu za
8 Skupni projekt Univerzitetne knjižnice Harvard, OCLC in NARA. Njihov glavni sponzor je Andrew W. Mellon Foundation. V letu 2008 so se združili z britanskim nacionalnim arhivom, ki razvija
kulturo 2008–2011 (2008) zapisano, da »kulturna politika pojmuje e-kulturo ozi- roma digitalne kulturne vsebine kot eno od najpomembnejših splošnih prioritet, ki naj prežema – horizontalno prepleta – celotno kulturno sfero. Razumeti jo je treba kot vključevanje informacijsko-komunikacijske tehnologije v osnovne procese ustvarjanja, shranjevanja, razširjanja, predstavljanja javnosti, zaščite in ponovne uporabe digitalnih kulturnih vsebin tako pri neposrednih ustvarjalcih kulturnih dobrin kot tudi v knjižnicah, muzejih, galerijah, arhivih, medijih ter drugih kulturnih institucijah.«
Digitalne vsebine so že pomemben sestavni del slovenske kulturne dediščine, so del slovenike, zato je NUK odgovoren za njihovo hranjenje. V Nuku od leta 2002 z različnimi viri financiranja preko domačih in tujih projektov razvijamo digitalni arhiv, ki bo zagotovil trajno ohranjanje digitalnih virov. Kljub temu, da se zavedamo pomena trajnega ohranjanja digitalnih virov, se v Nuku pojavljajo naslednje težave:
- imamo premalo strokovnjakov, ki bi lahko pokrivali celotno področje;
- sledimo prakso v tujini, vendar je ta zelo različna od okolja do okolja, saj se v zadnjih letih področje trajnega ohranjanja digitalnih virov nenehno razvija;
- nimamo dovolj izkušenj iz prakse;
- v slovenskem okolju opažamo, da se tudi druge kulturne institucije (arhivi in muzeji) in pomembne javne institucije, kot je RTV, posvečajo enakim prob- lemom;
- manjše knjižnice in arhivi se ne poglabljajo v to problematiko, saj ni v nji- hovi pristojnosti;
- institucije, ki s svojimi vsebinami sodelujejo pri gradnji Nukovih digitalnih zbirk, zaradi pomanjkanja znanj in sredstev ustvarjajo digitalne vire slabše kvalitete, kar ni dobro izhodišče za trajno ohranjanje;
- raziskovalci in avtorji nimajo nobenih priporočil, ki bi jim lahko pri svojem ustvarjanju sledili.
Da bi dosegli optimalne rezultate, je nujno potrebno interdisciplinarno sodelova- nje med knjižničarji in arhivisti. V ta namen smo raziskovalci NUK v okviru pro- jekta Nove vsebine in storitve Digitalne knjižnice Slovenije – dLibsiPlus (2009- 2010)9 stopili v stik z arhivisti iz Arhiva Republike Slovenije, Pokrajinskega arhiva Maribor in Arhiva družboslovnih podatkov Fakultete za družbene vede Univerze v Ljubljani, da bi skupaj pripravili spletno mesto, ki bo namenjeno sodelovanju in razširjanju prakse in izkušenj s področja trajnega ohranjanja digitalnih virov.
Pričakujemo, da bo spletna stran dostopna že septembra 2010. Takrat bomo iz- vedli strokovno posvetovanje, ki naj bi postavilo temelje za sodelovanje na tem
9 Projekt je financiran s sredstvi Strukturnih skladov za EU preko Ministrstva za visoko šolstvo, znanost in tehnologijo.
področju. Čeprav se praksa trajnega ohranjanja digitalnih virov v knjižničarstvu in arhivistiki10 zaradi različnih ciljev razlikuje, je pri obeh vendarle precej skup- nih točk, pri katerih je sodelovanje mogoče in prepotrebno.
8 Zaključek
V prispevku smo predstavili osnovne koncepte pri trajnem ohranjanju digital- nih virov, nastanek ter razvoj teorije in prakse, pomembne iniciative, standarde in priporočila na tem področju. Pojasnili smo pomen metapodatkov in predstavili različne metode, ki jih večji digitalni arhivi uporabljajo pri izvajanju trajnega ohranjanja digitalnih virov. Izpustili smo področje avtorskih pravic, ki sodi v organizacijski vidik tega področja. Sicer naj bi digitalni arhivi te pravice pridobi- li ob prevzemu digitalnega vira v hranjenje. Zajemale naj bi pravico do repro- duciranja, pravico dajanja digitalnih vsebin na voljo javnosti in pravico do spre- minjanja logične strukture zapisa v okviru izbrane metode za trajno ohranjanje.
Seveda pa so vmes različni vidiki, zaradi katerih zasluži ta specifična proble- matika veliko večjo pozornost.
V prispevku smo želeli poudariti, da je glavni problem pri digitalnih virih ohra- njanje dostopnosti do digitalnih informacij v prihodnosti. Vendar bo komaj čez nekaj desetletij, po opravljenih analizah nosilcev in življenjske dobe digitalnih objektov, možno reči, katera od metod je najuspešnejša. Danes je vsaka metoda, ki je namenjena ohranjanju čim več informacij in ki skrbi za celotni življenjski ciklus tako nosilcev kot dostopa do digitalnih vsebin, lahko uspešna. Pri tem je zelo pomembna doslednost in vztrajnost. Trajno ohranjanje digitalnih virov se začne v trenutku ustvarjanja digitalnih vsebin in zato je potrebno v tistem tre- nutku tudi začeti razmišljati, kaj bo z digitalnim objektom v prihodnosti, kdo bo dostopal do njega, kakšen je njegov pomen, katere so njegove specifične lastnos- ti, ki jih želimo ohraniti, na kaj je treba biti posebej pozoren, kdo je odgovoren za njegovo ohranjanje itd. Pri tem bodo – če bomo ugotovili, da smo se motili – vse pravočasno pridobljene informacije pripomogle, da bomo prakso prilagodili drugim metodologijam.
10 V knjižničarstvu ohranjamo dostopnost do intelektualne vsebine digitalnih knjižnih virov, medtem ko je v arhivistiki glavni cilj hranjenja zagotoviti neizbrisljivost, nespremenljivost, celovitost, verodostojnost in neokrnjenost vsebine in oblike elektronskih podatkov in dokumentov. Tako knjižničarji ohranjamo digitalno knjižnično gradivo, medtem ko arhivisti dokumentarno gradivo in elektronske zapise, ki so rezultat elektronskega poslovanja. Zaradi različnega predmeta ohra- njanja sta pristopa nekoliko različna.
Navedeni viri
1. An audit checklist for the certification of trusted digital repositories: draft for public comment. (2005). Mountain View: RLG; OCLC. Pridobljeno 19. 2. 2010 s spletne strani: http://www.worldcat.org/arcviewer/1/OCC/2007/08/08/
0000070511/viewer/file2416.pdf
2. Barnett, A. (2007, 6. marec). The expanding digital universe. Alex Barnett blog.
Pridobljeno 19. 2. 2010 s spletne strani: http://alexbarnett.net/blog/archive/
2007/03/06/The-Expanding-Digital-Universe.aspx
3. Beagrie, N. (2006). Digital curation for science, digital libraries and individuals. International Journal of Digital Curation, 1 (1), 3–16.
4. Beagrie, N., Jones, M. (2001). Preservation management of digital materials: a handbook. London: British Library.
5. Brown, A. (2008a). Digital preservation guidance note2: selecting storage media for long-term preservation. Richmond: The National Archives. Pridobljeno 19. 2.
2010 s spletne strani: http://www.nationalarchives.gov.uk/preservation/
advice/digital.htm.
6. Brown, A. (2008b). Digital preservation guidance note3: care, handling and storage of removable media. Richmond: The National Archives. Pridobljeno 19. 2. 2010 s spletne strani: http://www.nationalarchives.gov.uk/documents/removable- media-care.pdf.
7. Definitions of digital preservation. (2007). Chicago: ALA. Pridobljeno 19. 2. 2010 s spletne strani: http://www.ala.org/ala/mgrps/divs/alcts/resources/
preserv/defdigpres0408.cfm
8. Digital preservation handbook. (2008). Heslington: Digital Preservation Coalition. Pridobljeno 19. 2. 2010 s spletne strani: http://www.dpconline.org/
advice/digital-preservation-handbook.html
9. DINI-Certificate. Document and publication services 2007. (2006). Göttingen:
Deutsche Initiative für Netzwerkinformation. Pridobljeno 19. 2. 2010 s spletne strani: http://www.dini.de/documents/Zertifikat-en.pdf
10. Gantz, J.F. (2007). The expanding digital universe: forecast of worldwide information growth through 2010. Framingham(MA): IDC. Pridobljeno 19. 2. 2010 s spletne strani: http://www.emc.com/collateral/analyst-reports/expanding-digital- idc-white-paper.pdf
11. Guidelines for the preservation of digital heritage. (2003). Paris: UNESCO.
Pridobljeno 19. 2. 2010 s spletne strani: http://unesdoc.unesco.org/images/
0013/001300/130071e.pdf
12. Heminger, A. R. in Robertson, S. B. (1998). Digital Rosetta stone: a conceptual model for maintaining long-term access to digital documents. V Sixth DELOS Workshop: preservation of digital information, Tomar, Portugal 17-19 June 1998.
Pridobljeno 19. 2. 2010 s spletne strani: http://www.ercim.eu/publication/
ws-proceedings/DELOS6/rosetta.pdf
13. How much information 2003. (2003). Berkeley: University of California.
Pridobljeno 19. 2. 2010 s spletne strani: http://www2.sims.berkeley.edu/
research/projects/how-much-info/
14. ISO 12234-2:2001, Electronic still-picture imaging - Removable memory - Part 2: TIFF/
EP image data format. (2001). Geneva: ISO.
15. ISO 12639:2004, Graphic technology - Prepress digital data exchange - Tag image file format for image technology (TIFF/IT). (2004). Geneva: ISO.
16. ISO 14721:2003, Space data and information transfer systems - Open archival information system - Reference model. (2003). Geneva: ISO.
17. ISO 19005-1:2005, Document management - Electronic document file format for long-term preservation - Part 1: use of PDF 1.4 (PDF/A-1). (2005). Geneva: ISO.
18. ISO/IEC 10918-1:1994, Information technology - Digital compression and coding of continuous-tone still images: requirements and guidelines. (1994). Geneva: ISO.
19. ISO/IEC 15444-1:2004, Information technology - JPEG 2000 image coding system:
core coding system. (2004). Geneva: ISO.
20. Kanič, I., Leder, Z., Ujčič, M., Vilar, P. in Vodeb, G. (2009). Bibliotekarski terminološki slovar. Knjižnica, 53 (3/4), 1–374.
21. Kavčič - Čolic, A. (1996). Analiza stanja v specialnih knjižnicah v Sloveniji v obdobju 1992–1995. V N. Češnovar (Ur.), Vloga specialnih knjižnic pri pospeševanju družbenega in gospodarskega razvoja. Organizacijski, tehnološki in komunikacijski izzivi v specialnih knjižnicah, 6. posvetovanje Sekcije za specialne knjižnice, ZBDS, Ljubljana, 17. – 18. oktober 1996 (str. 81–95). Ljubljana: Centralna tehniška knjižnica Univerze.
22. Kavčič - Čolić, A. (2004a). Teoretični model digitalnih arhivov. Knjižnica, 48 (4), 63–75.
23. Kavčič - Čolić, A. (2004b). Metapodatki za trajno ohranjanje elektronskih virov. Knjižnica, 48 (4), 97–119.
24. Kavčič - Čolić, A. in Kragelj, M. (2008). Razvoj digitalnega repozitorija v NUK.
V M. Selan, S. Čufer, M. Hartman, S. Maček in M. Jurečič (Ur.), Sistemi za upravljanje z dokumenti, 17. posvetovanje DOK_SIS 2008, Kranjska Gora, 23. 9.
2008. (str. 46-I-54-I). Ljubljana: Media.doc.
25. Kodrič - Dačić, E. (2005). Zunaj Gutenbergovega vesolja. Knjižnica, 50 (1–2), 173–186.
26. Lorie, R. A. (2002). The UVC: a method for preserving digital document- proof of concept. Amsterdam: IBM Netherlands.
27. Lupovici, C., Masanès, J. (2000). Metadata for long term preservation. Paris: BNF;
Den Haag: Koninklijke Bibliotheek. Pridobljeno 19. 2. 2010 s spletne strani:
http://nedlib.kb.nl/results/D4.2/D4.2.htm
28. McGovern, N. Y. (2007). A digital decade: where have we been and where are we going in digital preservation? RLG DigiNews, 11 (1). Pridobljeno 17. 3. 2010
s spletne strani: http://deepblue.lib.umich.edu/html/2027.42/60441/
McGovern-Digital_Decade.html
29. Metadata standards framework - preservation metadata. (2002). Wellington:
National Library of New Zealand. Pridobljeno 19. 2. 2010 s spletne strani:
http://www.natlib.govt.nz/files/4initiatives_metaschema.pdf
30. Novak, M. (2007). Roki hranjenja dokumentarnega gradiva – arhivsko gradivo – nov nastajajoči vmesni arhivi. V M. Selan, S. Čufer, M. Hartman, S. Maček in M. Jurečič (Ur.), Sistemi za upravljanje z dokumenti, 16. posvetovanje DOK_SIS 2007, Kranjska gora, 26.-28. september 2007 (str. VIII-32-VIII-38). Ljubljana:
Media.doc.
31. Novak, M. (2002). O arhiviranju spletnih strani ter problemih njihovega varovanja, ohranjanja in uporabe. Knjižnica, 46 (1–2), 61–76.
32. PREMIS Data dictionary for preservation metadata. (2010). Pridobljeno 17. 3.
2010 s spletne strani: http://www.loc.gov/standards/premis/
33. Preservation metadata and the OAIS information model: a metadata framework to support the preservation of digital objects. (2002). Dublin, OH: OCLC/RLG Working Group on Preservation Metadata. Pridobljeno 5. 5. 2004 s spletne strani: http://www.oclc.org/research/projects/pmwg/pm_framework.pdf 34. Reference Model of an Open Archival Information System (OAIS): draft
recommended standard: CCSDS 650.0-P-1.1 Pink Book. (2009). Washington:
CCSDS. Pridobljeno 19. 2. 2010 s spletne strani: http://public.ccsds.org/
sites/cwe/rids/Lists/CCSDS%206500P11/Attachments/650x0p11.pdf 35. Resolucija o Nacionalnem programu za kulturo 2008–2011. (2008). Uradni
list RS, št. 35.
36. Steinke, T. (Ur.) (2005-). Long-term preservation metadata for electronic resources (LMER). Frankfurt am Main: Die Deutsche Bibliothek. Pridobljeno 19. 2. 2010 s spletne strani: http://www.d-nb.de/eng/standards/lmer/lmer.htm 37. Thibodeau, K. L. (2002). Overview of technological approaches to digital
preservation and challenges in coming years. Pridobljeno 19. 2. 2010 s spletne strani: http://www.clir.org/pubs/reports/pub107/thibodeau.html
38. Trusted digital repostiories: attributes and responsibilities: an RLG-OCLC report.
(2002). Mountain View, CA: RLG. Pridobljeno 19. 2. 2010 s spletne strani:
http://www.oclc.org/research/activities/past/rlg/trustedrep/repositories.pdf 39. Trustworthy repositories audit & certification (TRAC): criteria and checklist. (2007).
Chicago; Dublin (OH): CRL; OCLC. Pridobljeno 19. 2. 2010 s spletne strani:
http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf
Dr. Alenka Kavčič – Čolić je zaposlena v Narodni in univerzitetni knjižnici.
Naslov: Pot na Fužine 1, 1000 Ljubljana
Naslov elektronske pošte: alenka.kavcic@nuk.uni-lj.si