Tessella

Posted on 10/10/2013

0


Zgodovina človeštva je polna dokazov o barbarskem ravnanju z literaturo, znanstvenimi dosežki, s filozofskimi spisi in z umetnostjo. Danes se soočamo z neprimerno večjim številom gradiva, ki bi sodilo v neko skladišče znanja, kot kadarkoli v zgodovini. Sodobna gradiva so v elektronski obliki in prišel je čas, ko se bodo morali arhivi in knjižnice soočiti z realnostjo – razglasiti vse za smeti, nepomembno in ničvredno ali poiskati rešitev, ki bo hranila naše dosežke, znanje in umetnost naslednjih 2000 let.

Zažgite vse!

Slika 1: In dobrih 2000 let kasneje ... (Slika: Wikipedia)

Slika 1: In dobrih 2000 let kasneje … (Slika: Wikipedia)

Pred davnimi časi je po Sredozemlju lomastil Gaj J. Cezar. V Aleksandriji je imel dogovorjen zmenek s Kleopatro in ker so ga nekako pustili čakati pred vrati, se je odločil za nekoliko bolj spektakularen vstop v mesto. Zažgal je nekaj lastnih ladij in jih pustil, da so zaplule v pristanišče. Mimogrede je pogorela tudi slavna aleksandrijska knjižnica – tedanji osrednji vir modrosti. Zgodovinarji trdijo, da je bil zmenek, ki je sledil, uspešen.

Kaj nas torej uči ta zgodovinska dogodivščina? Kdor je res car, ta zažge vse in osvoji dekle. Znanje, dokumenti, zgodovina – vse to je nepomembno, ko junak v soju ognjemeta osvoji srce brhke kraljične. Hollywood je obstajal še pred Kristusom.

Splošna dostopnost znanja je tudi škodljiva – to je kakšnih 450 let po Cezarju ugotovil koptski patriarh Teofil. Nekaj zlikovcev je namreč ob slavnejšem Cezarjevem dejanju uspelo rešiti del papirusov in jih preseliti v pogansko svetišče Serapeum. Teofil je dobro izkoristil prepoved poganstva in knjižnico zaprl. Koptska ortodoksna cerkev ga je uvrstila med svetnike.

Minilo je še približno 200 let in nad Aleksandrijo se je znesla še muslimanska vojska, ki jo je vodil Amr ibn al `Aas. Eden od njegovih poveljnikov je menda za vsebino tega, kar je le ostalo od knjižnice, izjavil: “Če so ti zapisi v skladu s Koranom, potem jih ne potrebujemo. Če nasprotujejo Koranu, jih je tako in tako treba uničiti.” In tako je pravi as zaključil delo, ki ga je začel pravi car.

Share this!

V Aleksandriji so že dobro razumeli, da je pridobljeno znanje treba ohranjati. Uradni prepisovalci so izvajali operacijo “kopiraj in lepi” iz originalov na kopije (papirus). Originale so – podobno kot to počnemo danes – hranili zgolj v knjižnici in jih niso izposojali.

Po dokončnem obračunu z aleksandijsko knjižnico smo v imenu vere, ideologije ali rasizma pogosto sežigali knjige in druge zapise, ki nam niso bili najbolj všeč. S tem smo najbrž naredili veliko koristnega, saj bi vsa ta pretirana zaloga znanja sodobno družbo najbrž hudo obremenjevala in bi bili manj dovzetni za slaboumne kreacije javnega mnenja, manipulacije in natolcevanja.

Prvi idejni pisalni stroj naj bi nastal že v letu 1714. Pisalni stroj je huda nadloga, saj z njim že vsak, ki ima prste, lahko piše neke svoje knjige, pisma in podobne neumnosti.

V 20. stoletju smo izumili urejevalnike besedil. Prvega menda že v letu 1967. Od tedaj vse več in več besedil nastaja v elektronski obliki. Poskušal sem ugotoviti, kakšna je ocena števila dokumentov, ki so do danes nastali v urejevalnikih besedil, a žal nekega relevantnega podatka o tem nisem našel. Morda gre verjeti vsaj večkrat zapisanim ocenam o številu aktivnih osebnih računalnikov po svetu – to število naj bi se trenutno gibalo nekje med 900.000.000 in 1.100.000.000. Predpostavimo, da na vsakem od teh računalnikov v urejevalniku besedil nastane v povprečju letno le 10 dokumentov. Globalno gledano bi tako vsako leto nastalo novih 10.000.000.000 (deset milijard) dokumentov.

Slika 2: Le kos železa, a hkrati ključ do razumevanja vseh bistvenih dogajanj v Sloveniji v zadnjih 5 letih. (Slika: Wikipedia)

Slika 2: Le kos železa, a hkrati ključ do razumevanja vseh bistvenih dogajanj v Sloveniji v zadnjih 5 letih. (Slika: Wikipedia)

Dodatni problem za vsakogar, ki živi v utvari, da bo ohranil bistveno nacionalno znanje, kulturo in kronologijo, je vse pogosteje tudi sama forma izdelkov, ki krojijo naš čas, dogajanje in odločitve. Kako bo na primer čez 200 let nekdo lahko razumel dogajanje v Sloveniji v letih med 2008 in 2013, če na primer finska oddaja o aferi Patria ne bo shranjena v naših arhivih? Kako bo nekdo, ki bo na primer čez 50 let analiziral zgodovinske vzroke za gospodarski zlom Slovenije ob zaključku prvega desetletja novega tisočletja, kar koli razumel, če ne bodo shranjeni tabelarični podatki o stopnji brezposelnosti, plačah javnega sektorja, številu in strukturi zaposlenih po posamičnih industrijskih panogah, izvozu, davčni stopnji in podobno? Brez teh informacij, dokumentov in drugih datotek se za kakršno koli znanje, ki bi izšlo iz slabih izkušenj, lahko le obrišemo pod nosom in seveda ponovimo napake.

Danes vse te dokumente, multimedijske vsebine, tabelarične podatke in druge oblike informacij, ki ključno oblikujejo čas, v katerem živimo, jemljemo zelo lahkotno. Vsako datoteko lahko delimo z desetinami prijateljev in znancev v socialnih omrežjih, vsako novico v elektronski obliki razmnožimo po sto in sto elektronskih predalih. To nam daje občutek, da bodo informacije, dokumenti in surovi podatki dostopni večno. Žal je ta občutek navadna laž. Podatki v bazah se nenehno prepisujejo. Dokumenti – čeprav razmnoženi večtisočkrat – enostavno počasi “izginejo” iz poštnih predalov in diskov računalnikov. Ostaja le nešteto manipulacij, izrezanih vsebin, citatov brez konteksta in pamfletov.

Smetišče

V zadnjih mesecih sem imel izvrstno priložnost za to, da sem bolje spoznal problematiko elektronskega arhiviranja gradiv. Včasih sem bil prepričan, da je dolgoročno elektronsko arhiviranje dokaj premočrtna zadeva – če želiš v elektronski knjižnici ali arhivu obdržati gradiva, enostavno definiraš dovoljene formate datotek in v trenutku, ko ti formati “izumrejo”, vse skupaj konvertiraš v nove, aktualne formate. V osnovi sem si celo zadevo še kar pravilno predstavljal, a v praksi se seveda  kot vedno  stvari vsaj nekoliko zakomplicirajo.

Slika 3: Žalostno je, da morajo danes ljudje marsikje na svetu živeti na smetišču. Informacijsko gledano pa vsi živimo na ogromnem, smrdljivem smetišču. (Slika: Wikipedia)

Slika 3: Žalostno je, da morajo danes ljudje marsikje na svetu živeti na smetišču. Informacijsko gledano pa vsi živimo na ogromnem, smrdljivem smetišču. (Slika: Wikipedia)

Prva težava, s katero se sooča nekdo, ki mora vzpostaviti elektronsko knjižnico ali arhiv, je poplava elektronskih gradiv. V Aleksandriji se s tem niso kaj dosti ukvarjali, saj pisnih izdelkov vendarle ni bilo tako zelo veliko, da bi se jih morali ravno otepati. Pisni izdelek je tedaj predstavljal neko vrednost – naj je šlo za verske spise, znanstvena in filozofska dognanja, nacionalne legende ali geometrijske zakonitosti. Zapisi brez vsake vrednosti so bili najbrž redki. Danes je situacija zelo drugačna. Vsi ustvarjamo dokumente, filme, celo glasbo, slike, novice in zgodbice. Praktično vse ustvarimo s pomočjo računalnikov. Morda gre za dejansko znanje, leposlovje, ključne podatke ali umetniška dela, morda pa so naši izdelki brez vsake vrednosti. To drugo je nenazadnje tudi bolj verjetno. Na poti do elektronske knjižnice ali arhiva potrebujemo najprej ljudi, ki bodo sposobni presoditi, ali so naše stvaritve, podatki in dognanja dejansko sploh kaj vredni ali ne. To filtriranje elektronskih vsebin, ki imajo neko vrednost, je po mojem mnenju ena težjih nalog, ki so človeku dodeljene. Kako sploh presoditi, kaj je za človeško znanje in razumevanje stvari pomembno in kaj je brez vsake vrednosti? Po teoriji kaosa lahko zadošča ena sama kratka objava statusa v družbenem omrežju Facebook ali na Twitterju in zgodovina celega naroda ali celega sveta se lahko obrne v povsem drugo smer od predvidene. Filtriranje morja informacijskih smeti je zato zame ena najtežjih nalog.

Drugi problem, ki se nemudoma pojavi ob kakršnem koli razmišljanju o elektronskih arhivih, je fizično shranjevanje vseh teh dokumentov, informacij in podatkov. Do sedaj smo se ukvarjali s tem, da nismo več vedeli, kam s papirji, ki jih želimo hraniti. Sedaj se bomo pričeli ukvarjati s tem, da ne vemo več, koliko diskovja (ali pomnilnih naprav, ki bodo na voljo v prihodnosti) potrebujemo, da bomo shranili vse relevantne podatke. Za hip se bom vrnil k podatkom, ki bodo nekomu čez vrsto let morda omogočili relevanten vpogled v razloge za nastanek aktualne gospodarske in javnofinančne krize v Sloveniji. Razumevanje vzrokov za nastalo stanje je ključnega pomena za to, da se tem vzrokom v bodoče izognemo. To pomeni, da ne moremo hraniti zgolj ene baze na vsake toliko let, ampak bi bilo potrebno narediti presek vseh ključnih baz dokaj pogosto. Zaupanje v neka trenutna dognanja in arhiviranje le-teh dokumentov ni zadostno in celo ni relevantno. Če ste na primer pred 15 leti povprašali kakšnega pomembnega ekonomskega strokovnjaka o tem, kaj bi bila varna naložba, vam je marsikdo odgovoril, da z investicijo v nepremičnino ne morete kaj dosti zgrešiti. Pred nekaj leti se vam je ta isti človek ob katastrofalnem padcu cen nepremičnin lahko posmehoval in zmajeval z glavo, češ: “Le kako si bil lahko tako zabit, da si investiral v nepremičnino?” Trenutna dognanja zato nimajo nobene prave vrednosti. Resne analize lahko nastanejo šele po preteku neke prave časovne distance. To je tudi podlaga za kakršne koli resne zaključke o tem, kaj so vzroki, kaj so napake in kako se tem napakam izogniti v prihodnje. Zgolj hramba nekih trenutnih dognanj je hramba puhlega in ničvrednega znanja – v pomoč nam je lahko le hramba surovih podatkov. Problem je očiten – če želimo zagotoviti prihodnjim rodovom relevantne informacije in vire, ki jim bodo omogočali napredek, potem potrebujemo ogromne pomnilne kapacitete in seveda tudi orodja za zagotavljanje berljivosti teh podatkov.

Tretje ključno vprašanje, s katerim bi se moral resno spopasti vsak e-bibliotekar ali e-arhivar, je vprašanje orodja, ki ga bo uporabljal za to enormno skladišče znanja, umetnosti in podatkov. Na trgu kar mrgoli ponudnikov različnih rešitev, ki se razglašajo za dolgoročno e-hrambo, a tudi pri teh rešitvah je večina ponudnikov le sleparjev s figo v žepu. Rešitve, ki so primerne za te namene, morajo najprej ponujati prijazna orodja, s katerimi sploh v osnovi filtriramo vsebine, ki jih želimo arhivirati oziroma vključiti v e-knjižnico. Potem morajo te vsebine kot predlog prispeti do nekega urednika, ki bo odločil, ali predlagana gradiva sprejme ali ne. Tudi v sistemu hrambe te vsebine ne smejo kar “spati”. Rešitev jih mora stalno nadzirati in kontrolirati ustreznost formatov, v katerih so te vsebine shranjene. V kolikor zunanji svet teh datotečnih formatov ne pozna več, potem jih mora rešitev sama transformirati v ekvivalenten sodobnejši format. Uporabnik takšnega arhiva ali e-knjižnice mora imeti na voljo preprosta orodja, s katerimi bo hitro našel vsebine, ki ga zanimajo …

Tessella SDB

Ustrezna rešitev, ki obstaja na trgu, je Tessella SDB (Safety Deposit Box). Angleži so izdelali orodja, s katerimi enostavno kreiramo arhivske pakete iz datotek, ki jih imamo shranjene na lastnem računalniku, v omrežnem pogonu, na FTP-strežniku ali kjer koli drugje, kjer so nam datoteke dosegljive. Orodje za kreiranje arhivskih paketov je tako enostavno za uporabo, da ga vsak, ki ni popoln analfabet za delo z računalnikom, razume in lahko uporablja v nekaj minutah. Vsebinsko razumevanje tega, kaj sodi v e-hrambo in kaj ne, je seveda druga stvar.

Slika 4: SIP-Creator – orodje za izdelavo poljubnega arhivskega paketa.

Slika 4: SIP-Creator – orodje za izdelavo poljubnega arhivskega paketa.

Pripravljen paket zelo enostavno pošljemo na spletni servis, ki pričakuje paketne predloge za e-hrambo s poljubnega števila virov. Najlepše pri tem je to, da se uporabnik s tem, kaj in kje je spletni servis, sploh ne ukvarja. Uporabnik pripravi paket in ga “odda”. To je vse. V najslabšem primeru bo obveščen o zavrnitvi paketa – a o tem ne bo odločal nek spletni servis, ampak človek.

Uporabnikom, ki sodijo v skupino “strokovnih” uporabnikov, in običajnim laikom je na voljo sila enostaven uporabniški vmesnik, ki v celoti deluje zgolj in samo s pomočjo spletnega brskalnika.

Slika 5: Uporabniški vmesnik za e-hrambo Tessella.

Slika 5: Uporabniški vmesnik za e-hrambo Tessella.

Urednik, ki e-gradiva prevzema in odloča o tem, kaj bo šlo v e-hrambo in kaj ne, ima na voljo enostaven pregled čakajočih gradiv, ki jih lahko prevzame ročno ali samodejno. Veliko večino pravil za prevzem in obdelavo gradiv v e-hrambi je možno prilagajati lastnim potrebam in procesom.

Vse napake, do katerih utegne priti v procesih prevzemanja paketov v e-hrambo, se beležijo. Pravzaprav se beležijo vse ključne napake, celo napake, do katerih bi utegnilo priti med procesi samodejnega konvertiranja datotečnih formatov.

Za vsako prevzeto datoteko SDB  iz centralnega registra datotečnih formatov razbere ustreznost in standard tega datotečnega formata in si ta podatek zapomni. Kasneje te podatke izkorišča za ohranjanje berljivosti datotek s samodejnim konvertiranjem v aktualne datotečne formate. To opravilo izvede tako, da originalno datoteko ohrani – torej tako, kot so pred več kot 2000 leti originale ohranjali v aleksandrijski knjižnici.

Iskanje po tem enormnem skladišču datotek je sila enostavno. Dostopnost datotek je sicer lahko omejena, a na splošno je iskanje natanko toliko zahtevno kot iskanje z uporabo Googla. Rezultati iskanja so predstavljeni v lepo urejenem seznamu in vsebujejo kratke opise. Datoteke so indeksirane, kar nam omogoča tudi iskanje po polnem besedilu.

Slika 6: Iskanje je zelo enostavno.

Slika 6: Iskanje je zelo enostavno.

Pri iskanju seveda utegnemo včasih naleteti na rezultat, ki je blizu temu, kar smo želeli najti, a ne natanko tisto, kar iščemo. V takih primerih si zelo preprosto lahko ogledamo cel arhivski paket (na primer celoten spis ali celoten direktorij).

Slika 7: Ogled celotnega arhivskega paketa.

Slika 7: Ogled celotnega arhivskega paketa.

Tessella SDB ima še obilo odličnih lastnosti, ki se vse po vrsti odlikujejo po uporabniški prijaznosti in fantastični premišljenosti vsakega segmenta produkta posebej. Prav zaradi te čudovite kombinacije nastavljivosti in enostavnosti je SDB ena od najpogostejših rešitev, ki podpirajo e-hrambo v institucijah, kakršne so nacionalni arhivi ali knjižnice. Med njihovimi uporabniki tako najdemo ustanove, kot na primer UK National Archives, Wellcome Trust Library, Schweizerisches Bundesarchiv, Österreichisches Staatsarchiv, FamilySearch International, National Library of Australia in druge.

Kljub vsem naštetim razmislekom in bolj ali manj posrečenim utemeljitvam se seveda lahko vselej odločimo za preprostejšo rešitev – vse zažgemo in si rečemo: “Le enkrat se živi!” In potem osvojimo srce kakšne eksotične dame.

Robert Kristanc

Posted in: InfoSRC 74