https://www.ictbusiness.info

Link: https://www.ictbusiness.info / internet / hrvatski-arhiv-weba-prikuplja-i-cuva-online-sadrzaje-za-buduce-narastaje

Hrvatski arhiv weba prikuplja i čuva online sadržaje za buduće naraštaje

Svi koji posjete stranice Nacionalne i sveučilišne knjižnice u Zagrebu mogu pristupiti Hrvatskom arhivu weba koji predstavlja zbirku odabranih sadržaja preuzetih s Interneta i pohranjenih na računalnom poslužitelju Knjižnice. Arhiv je namijenjen preuzimanju i trajnom čuvanju publikacija s Interneta kao dijela hrvatske kulturne baštine. Arhivirani sadržaji mogu se pretraživati preko naslova, URL-a, ključnih riječi ili predmetnih područja. Također, arhivirani sadržaj dostupan je i putem online kataloga NSK.

Kako bi se upotpunila baza arhiviranih sadržaja, Hrvatski arhiv weba je 2011. i 2012. godine proveo dva pobiranja (harvestiranja) hrvatske internetske domene, a u planu je i harvestiranje .hr domene u 2013. godini. Rezultati harvestiranja sada su dostupni putem web-stranica Hrvatskog arhiva weba i mogu se pretraživati tako da se u tražilicu unese točan URL i  na kalendaru odabere željeni datum arhiviranog primjerka.

Do sada je provedeno i pet tematskih harvestiranja sadržaja koji se odnose na specifičnu temu ili događaj kao što su npr. lokalni izbori 2013., referendum o pristupanju Republike Hrvatske Europskoj uniji i sl. U popisu URL-ova, klikom na odabrani naslov prikazuje se arhivirane kopije web-stranice.

Ovakav je nacionalni arhiv sadržaja s weba , poručuju iz Nacionalne i sveučilišne knjižnice, izuzetno važan za naše kolektivno pamćenje jer preuzete web-stranice namjerava sačuvati za buduće naraštaje  kao dokument o kulturnoj i znanstvenoj baštini jedne sredine. „Karakteristika online sadržaja jest da je on nestalan, promjenjiv, kratkog vijeka te specifične dinamike u objavljivanju, vrlo je bitno takav sadržaj pohraniti na vrijeme. Arhiv je javan, a vjerujemo da će biti od velikog značaja studentima, povjesničarima i znanstvenicima, s ciljem otkrivanja, tumačenja i pojašnjavanja činjenica, stvaranja znanja o prošlim događajima, povijesti,  ili određenoj temi.“, kažu  djelatnici Hrvatskog arhiva weba iz Nacionalne sveučilišne knjižnice u Zagrebu.

Alat za selektivno preuzimanje i arhiviranje digitalnog sadržaja razvijen je u Sveučilišnom računalnom centru (SRCE).

Za harvestiranja domene .hr i tematska harvestiranja koriste se alatom Heritrix. Heritrix je softver otvorenog koda čija je primarna svrha kvalitetno pobrati i sačuvati digitalne sadržaje s weba.

Sustav se stalno razvija jer se od početka poboljšava i prilagođava novim tehnologijama. Od uspostave selektivnog sakupljanja web publikacija, planirana su i provedena godišnja harvestiranja domene kao i tematska harvestiranja te je u međuvremenu izrađena web stranica koja omogućava pregledavanje svih ovih sadržaja.  Daljnji razvoj tj. unapređivanje sustava ( npr. rješavanje problema poberivosti )  planira se u skladu s daljnjim razvojem web-tehnologija.

Do 2013.  u  Hrvatskom arhivu weba arhivirano je više od 4900 naslova u preko 33 000 arhiviranih primjeraka. Ukupna veličina arhiviranog sadržaja je preko 13 TB.