Sustav za prikupljanje i pohranu obveznog primjerka publikacija objavljenih na webu nastao 2004. godine.
Poberivost izravno ovisi o načinu na koji se rabe pojedine tehnologije prilikom izrade web sjedišta.
Selektivna pobiranja weba provode se pomoću robota koji dolazi s IP adrese 161.53.3.4 i predstavlja se kao Mozilla/5.0 (compatible; SrceDAMP/4.2.2; +http://haw.nsk.hr/cesta-pitanja). Kod selektivnih harvestiranja robot ignorira robots.txt datoteke.
Domenska i tematska harvestiranja weba provode se pomoću robota koji dolazi s IP adresa 161.53.3.11 i/ili 161.53.3.4 i predstavlja se kao Mozilla/5.0 (compatible; heritrix/3.4.x; +http://haw.nsk.hr/cesta-pitanja). Robot pobire sve sadržaje za koje je dozvoljeno pobiranje bilo kojem robotu tj. ne pobire sadržaje za koje u robots.txt postoji zabrana pobiranja za sve robote. Iznimka od tog pravila su umetnuti (embedded) resursi koji se uvijek pobiru.
Molimo da dozvolite pristup navedenim robotima.
Ako bilo koji robot Hrvatskog arhiva weba narušava stabilnost vašeg poslužitelja ili primijetite neočekivane aktivnosti, molimo da nam to javite na adrese damp@srce.hr i haw@nsk.hr zajedno s podacima: vrijeme posjete robota, naziv robota i što detaljniji opis problema.
Zbirku odabranih sadržaja s weba (web-sjedišta) ustanova, udruga, klubova, događaja, projekata, tijela državne i javne uprave, portale, blogove, časopise i knjige.
Sadržaje objavljene na webu prije 2004. godine, radne verzije publikacija, građu koja se distribuira isključivo putem elektroničke pošte, osobne stranice, računalne igre, građu za čiji je pristup potrebna registracija, publikacije ili dijelove publikacija koje zbog načina izrade tj. formata u kojem je objavljena nije moguće arhivirati, digitaliziranu građu koja je dio digitalnih zbirki drugih ustanova niti druge arhiva weba.
Pretraživanje selektivno arhiviranih publikacija dostupno je u tražilici „Pretraži HAW“ prema naslovu, URL-u i ključnim riječima. Napredno pretraživanje dostupno je ovdje.
Pretraživanje .hr domene dostupno je u tražilici „Pretraži .hr domenu“ prema potpunom URL-u.
Pregledavanje tematskih zbirki prema naslovu.
Potrebno je ispuniti obrazac za prijavu online publikacija; arhiviranje i uvjeti pristupa bit će dogovoreni sa svakim nakladnikom pojedinačno.
Hrvatski arhiv weba određuje učestalost arhiviranja prema značaju publikacije za širu korisničku zajednicu i važnosti promjena građe u sadržajnom i tehničkom smislu. Jako velike datoteke (preko 500 MB) pobiru se manjom učestalošću.
Uz to, Hrvatski arhiv weba jednom godišnje harvestira cijelu nacionalnu .hr domenu i povremeno provodi tematska harvestiranja značajnih tema i događaja.
Na vrhu svakog arhiviranog primjerka stoji tekst koji upozorava da se radi o arhiviranoj kopiji. Arhivirani je primjerak na internetskoj adresi koja počinje s https://haw.nsk.hr/arhiva.
Internetski pretraživači indeksiraju osnovnu stranicu Hrvatskog arhiva weba, ali ne i arhivirane kopije publikacija.
Nakladnici online publikacija obavještavaju Knjižnicu o postojanju svoje publikacije na internetu popunjavanjem obrasca za prijavu online publikacija .
Na naslovnici ili u impresumu treba navesti naslov, autora ili urednika, naziv i sjedište nakladnika, datum objavljivanja na webu.
Da bi bila katalogizirana i arhivirana, publikacija već mora biti objavljena na internetu. Za mrežnu se građu CIP ne izrađuje – izrađuje se odmah puni kataložni opis.