KOMPIUTERINIS PASIRENGIMAS DUOMENŲ ARCHYVO VARTOJIMUI
Mokymo kurso medžiaga
KOMPIUTERINIS PASIRENGIMAS DUOMENŲ ARCHYVO VARTOJIMUI
Autorius Algimantas VENČKAUSKAS
|
|
3. E. LEIDYBOS SISTEMOS, E. DOKUMENTŲ PUBLIKAVIMO PROCESAI IR PRIEMONĖS
3.3. E. dokumentų talpyklos
E. dokumentų talpykloms keliami tokie reikalavimai:
- pateikti informaciją vartotojams;
- pateikti informaciją kitoms sistemoms;
- suteikti ilgalaikio e. dokumentų ir jų metaduomenų saugojimo ir
tvarkymo paslaugą.
Dspace e. dokumentų saugyklą sukūrė Masačūsetso
technologijos instituto (MIT) biblioteka ir kompanija Hewlett-Packard (HP).
Sistema pagrįsta Java technologijomis (Java serverio programėlės (servlet),
Jsp, Java beans). Dspace naudoja PostgreSQL duomenų bazių valdymo sistemą
(DBVS), kurioje saugoma vartotojų sisteminė ir metaduomenų informacija. Dspace
galima pritaikyti ir kitoms DBVS, pavyzdžiui, Oracle. Yra daugybė sąsajų (API),
leidžiančių pritaikyti sistemą savo poreikiams.
Fedoros e. dokumentų saugyklą sukūrė
Virdžinijos (Virginia) ir Kornelio (Cornell) universitetai. Sistema pagrįsta
Java technologijomis, Web paslaugų architektūra ir gali būti suderinta dirbti su
Oracle ar kitomis duomenų bazių valdymo sistemomis. Paslaugos, kaip abstrakčių
operacijų aibės, aprašomos Web paslaugų aprašymo kalba WSDL (Web Servis
Description Language). Klientai su Fedoros sistema bendrauja
keisdamiesi pranešimais.
Fedora – bendros paskirties skaitmeninių objektų
saugykla
Fedoros sistema yra WEB paslaugų rinkinys,
veikiantis Apache Tomcat WEB serveryje. Fedoros priemonėmis galima kurti,
valdyti, importuoti ir pateikti skaitmeninius objektus, esančius duomenų
saugykloje. Iš kitų sistemų Fedora išsiskiria daugeliu savybių.
Sistema gali formuoti skaitmeninius objektus,
sudarytus iš daugybės kitų objektų, esančių skirtingose vietose. Pavyzdžiui,
skaitmeninis objektas gali būti rinkinys tiff tipo failų, kurie yra
nuskenuoto dokumento puslapiai. Duomenų šaltiniai (konkretus dokumento turinys
arba metaduomenys) gali būti valdomi lokaliai pačioje Fedoros sistemoje arba tai
gali būti tiesiog URL nuorodos į kitus objektus.
Fedoros sistema gali susieti skaitmeninius objektus
su atitinkamomis web paslaugomis. Pavyzdžiui, anksčiau aprašytas skaitmeninis
objektas iš tiff failų gali būti susietas su paslauga, transformuojančia tiff
failus į vieną html dokumentą. Paslaugos gali būti arba vietinės, arba
išorinės, pasiekiamos per URL nuorodas. Fedora yra tarsi tarpinis (Proxy)
sluoksnis, kuris koordinuoja vietinius ir paskirstytus tinkle duomenis ir web
paslaugas (3.2 pav.).
Fedora teikia prieigą prie skaitmeninių objektų per
Web pagrindu veikiančią sąsają (REST užklausos ir SOAP metodai). Ši sąsaja
standartinio rinkinio metodais teikia prieigą prie metaduomenų ir objektų
vidinės struktūros. Pavyzdžiui, vartotojas gali pritaikyti šiuos metodus,
norėdamas sužinoti anksčiau aprašyto objekto metaduomenis, peržiūrėti html
failus. Privalumai:
- Vartotojų klientinė programinė įranga nepriklauso nuo skaitmeninio
objekto struktūros ir saugojimo formatų.
- Skaitmeninio objekto atvaizdavimo metodai nepriklauso nuo vidinės
objekto struktūros.
Pavyzdžiui, anksčiau aprašyto skaitmeninio objekto
(kuriame html dokumentas yra sugeneruotas iš kelių tiff failų)
vartotojo sąsaja išliks nepakitusi, nors tiff failai bus pakeisti jpeg,
pdf, o vienas - net html failu.
Įgyvendinta galinga SOAP pagrindu veikianti valdymo
sąsaja. Visos vidinės operacijos (objektų kūrimas, valdymas) yra galimos per API
sąsają. Tai suteikia galimybę integruoti sistemą Fedora įvairiose aplinkose.
Galima saugoti ir administruoti skirtingas to
paties objekto versijas, naudoti ryšius tarp skirtingų skaitmeninių objektų.
Fedoros sistema gali importuoti ir eksportuoti
daugybės XML formatų skaitmeninius objektus. Todėl galima keistis duomenimis
tarp Fedoros ir kitų XML pagrindu veikiančių sistemų.

Fedora nėra skirta paprasčiausiems statiniams WEB
dokumentams valdyti. Tam yra daug kitų html redagavimo ir publikavimo
priemonių. Fedora skirta sudėtingesnio turinio valdymo reikmėms (metaduomenų
aprašai, versijų kūrimas, formatų transformacijos, dinamiškai generuojami
dokumentai iš įvairių duomenų šaltinių).