Algengar spurningar


Hverju er safnað?

Efni sem hýst er undir þjóðarléninu .is auk valdra vefja undir alþjóðlegum lénum eins og .com, .net og .org og þjóðarlénum eins og .dk.

Af hverju varar vírusvörnin mín við vefsafninu?

Svikavefir eru oft látnir líta út eins og vel þekktir vefir, t.d. bankavefir. Markmið þeirra er að plata fólk til að skrá inn viðkvæmar upplýsingar.

Vírusvarnarforrit flagga því gjarnan vefjum sem 'vafasömum' ef þeir hafa að geyma efni sem svipar til vel þekktra vefja sem oft er hermt eftir á svikavefjum. Þar sem vefsafnið (eðli sínu samkvæmt) geymir og birtir afrit af öðrum vefjum, þá flokka vírusvarnarforrit því miður stundum safnið ranglega sem 'vafasamt'.

Auðvitað er ekkert vafasamt í gangi á vefsafninu. En því miður höfum við enga stjórn á því hvernig hin ýmsu vírusvarnarforrit flokka vefinn.

Hvað geri ég ef ég lendi í vandræðum með vefsafnara Landsbókasafns

Valdi vefsöfnunin vandræðum getur þú haft samband við safnið á póstfanginu vefsofnun (hjá) landsbokasafn.is.

Vinsamlega útilokaðu ekki vefsafnara Landsbókasafns frá vefþjónum þínum. Hafðu frekar samband og fundin verður lausn á málinu.

Samkvæmt lögum um skylduskil til safna nr. 20/2002 og í reglugerð um skylduskil til safna nr. 982/2003 ber aðila sem birtir verk á rafrænu formi á almennu tölvuneti að veita safninu aðgang að verkinu og ef þörf er á láta safninu í té aðgangsorð og aðrar upplýsingar sem nauðsynlegar eru til söfnunar þess. Afhendingarskyldu telst fullnægt sé móttökusafni gert kleift að taka til sín rafrænt eintak af verkinu.

Mikilvægt er að unnt sé að ná til allra íslenskra vefja og fá heildstæða mynd af hverjum um sig. Aðilar sem gefa út efni á veraldarvefnum hafa hag af vefsöfnun Landsbókasafns. Hún dregur úr þörf útgefenda á að varðveita gögn sín langt aftur í tímann og hún tryggir að til sé afrit sem hægt er að nálgast ef efni glatast af einhverjum ástæðum en upp hafa komið mörg tilvik þar sem hægt var að sækja í vefsafnið gögn sem annars hefðu tapast.

Hvernig nota ég vefsafnið?

Á forsíðu vefsafnsins slærð þú inn þá vefslóð (URL) sem þig langar að skoða. Þá birtist listi yfir þau afrit sem safnið á af viðkomandi vefslóð, raðað í tímaröð eftir árum og mánuðum. Með því að smella á tiltekna dagsetningu og birtist afritið sem tekið var þann dag.

Af hverju er mínu efni safnað svona oft?

Öllu íslensku efni er safnað þrisvar á ári og völdum lénum vikulega. Því til viðbótar eru haldnar tímabundnar viðburðasafnanir þar sem tekin eru afrit af vefjum tengdum viðburðinum vikulega. Af tæknilegum ástæðum getur verið að einstaka lén séu heimsótt nokkrum sinnum við hverja söfnun. Hver heildarsöfnun tekur 1-2 vikur og eru framkvæmdar á fjögurra mánaða fresti. Ef vart verður við vefsafnarann oftar, t.d. vikulega, þá er vefurinn einn af sérvöldum vefjum sem safnað er vikulega eða hefur verið valin í söfnun tengda einhverjum atburði, t.d. kosningum.

Er hætta á að vefsafnari Landsbókasafns íþyngi vefþjóninum mínum?

Vefsafnarinn er hannaður þannig að hann biður einungis um eitt skjal (URL) í einu og bíður svo 2-20 sekúndur eftir að svar fæst áður en hann biður um það næsta. Vefsafnarinn aðlagar sig að því hversu hratt svar berst frá vefþjóni og verður biðtíminn því í samræmi við getu þjónsins. Þessi virkni er bundin við fullt lén. Þannig eru undirlénin a.example.com og b.example.com meðhöndluð sem óháð lén. Í langflestum tilvikum er þetta í lagi en ef mikill fjölda undirléna er hýstur á einum vefþjóni þá getur þetta íþyngt þjóninum. Þetta á aðallega við bloggvefi þar sem sýndarundirlén er búið til fyrir hvern notanda. Verðir þú var við að safnanir séu óeðlilega íþyngjandi hafðu þá samband við safnið með því að senda póst á póstfangið vefsofnun (hjá) landsbokasafn.is og þá verða gerðar viðeigandi ráðstafanir.

Af hverju notar vefsafnarinn ekki IP-tölur til að jafna álag í stað léna?

Fyrir þessu eru tæknilegar ástæður sem varða uppbyggingu hugbúnaðarins sem framkvæmir vefsafnanirnar. Þyngst vegur sú staðreynd að IP-tölur gefa ekki alltaf rétta mynd. Þannig eru mörg dæmi um að öflugir vefir með mörgum undirlénum séu á einni IP tölu en í reynd séu margir vefþjónar á bak við og IP talan vísar einungis á þjón sem sér um að dreifa álaginu á hinar vélarnar. Í þeim tilvikum er sá netþjónn einungis framhlið vefþjónsins.

Í hve langan tíma er efnið varðveitt?

Til frambúðar. Safnið fer með þetta efni eins og annað útgefið efni; bækur, handrit, tímarit og annað sem því ber að varðveita til framtíðar.

Hvað með höfundarétt?

Í 1. mgr. 15. gr. laga nr. 20/2002 um skylduskil til safna segir : „Skilaskyld verk eru aðgengileg notendum að því marki sem höfundalög heimila.”

Þetta er mjög almennt orðað og stefna safnsins er að aðgengi að vefsafninu verði opið öllum líkt og annað efni sem því berst. Þetta er þó háð þvíi að ekki sé vegið að réttmætum hagsmunum rétthafa efnisins, s.s. með því að birta efni sem allir geta fengið aðgang að gegn því að greiða fyrir aðganginn.

Þeim sem telja að safninu sé óheimilt að birta ákveðið efni eða birting ekki við hæfi er bent á að hafa samband með því að senda póst á vefsofnun (hjá) landsbokasafn.is.

Hverjir fá aðgang að efninu sem safnað er?

Vefsafnið er opið öllum líkt og með annað efni sem safninu berst. Þó verður einungis hægt að nálgast efni sem greiða þarf gjald fyrir innan veggja Þjóðarbókhlöðunnar. Þá kann að verða nauðsynlegt að takmarka aðgang að tileknu efni af margvíslegum ástæðum.

Hvaða lög eru það sem vefsöfnunin vísar til?

Landsbókasafni Íslands – Háskólabókasafni er skylt að safna þessu efni, varðveita það og gera það aðgengilegt almenningi í samræmi við lög um skylduskil til safna nr. 20/2002 og reglugerð um skylduskil til safna nr. 982/2003. Í 1. mgr. 8.gr. laga um skylduskil til safna nr. 20/2002 er kveðið á um að aðili sem birtir verk á rafrænu formi á almennu tölvuneti skuli veita safninu aðgang að verkinu og láta safninu í té aðgangsorð og aðrar upplýsingar sem nauðsynlegar eru. Afhendingarskyldu telst fullnægt sé móttökusafni gert kleift að taka til sín rafrænt eintak af verkinu.

Eru lögin afleiðing af EES-samningnum?

Nei, en mörg nágrannalönd okkar, t.d. Noregur og Danmörk (sjá upplýsingar um vefsöfnun í Danmörku hér), hafa komið sér upp hliðstæðri löggjöf.

Hvernig sé ég hvort vefsafnari Landsbókasafns safnar mínu efni?

Ef efnið er hýst undir þjóðarléninu .is og er ekki aðgangsvarið þá eru miklar líkur á að því sé safnað. Eina leiðin til að komast að því með vissu er að skoða log-skrár viðkomandi vefþjóns. Flestir vefþjónar skrá „user-agent" þess sem sendir beiðni á þjóninn. „User-agent" vefsafnara safnsins er ætíð á forminu:
Mozilla/5.0 (compatible; heritrix/3.0.0 +http://vefsafn.is/crawler)
Eini breytilegi hlutinn er útgáfutalan „3.0.0" á vefsafnaranum.

Einnig geturðu leitað í vefsafninu og séð hvort þínum vef hefur áður verið safnað.

Hvernig get ég komið á framfæri hugmyndum um úrbætur fyrir vefsöfnun?

Með því að senda safninu póst á vefsofnun (hjá) landsbokasafn.is.

Af hverju virðið þið ekki robots.txt reglur?

Því miður hefur ítrekað komið í ljós að vefir nota robots.txt reglur til að takmarka aðgengi að efni sem er sannanlega innan þess ramma sem safninu ber að safna. T.d. er aðgangur að myndum gjarnan bannaður með slíkum reglum.

Reynslan hefur sýnt að það eru sárafáir vefir sem nota þessar reglur til að halda söfnurum frá viðkvæmum hluta vefsins.

Valdi þessi stefna ónæði á þínum vef þá hvetjum við þig til að hafa samband (vefsofnun (hjá) landsbokasafn.is) og við finnum lausn á málinu.

Hvernig get ég hleypt vefsafnara Landsbókasafns að mínu efni?

Vefsafnanir safnsins eru svipaðar þeim sem leitarfyrirtæki eins og t.d. Google framkvæma. Þannig eru leiðbeiningar eins og þessar almennt gagnlegar. Þá auðveldar það einnig safnanir ef vefir uppfylla aðgengisstaðla eins og þá sem W3C hefur sett fram. Það torveldar vefsöfnun mjög ef vefurinn er háður Javascript-virkni.

Frekari ráðleggingar um margvísleg atriði sem geta auðveldað við vefsöfnun á þínum vef er að finna í Vefhandbókinni um opinbera vefi.

Á bloggi vefsöfnunardeildar Library of Congress í Bandaríkjunum (http://blogs.loc.gov/digitalpreservation/) og þá serstaklega bloggfærslan Designing Preservable Websites, Redux.

Á bloggi vefsöfnunardeildar Þjóðbókasafns Bretlands og þá sérstaklega bloggfærslan How to Make Websites More Archivable?

Þá hefur Portúgalska vefsafnið tekið saman og birt leiðbeiningarnar: Recommendations for authors to enable web archiving.

Og loks bloggið Five Tips for Designing Preservable Websites af skjalasafni Smithsonian stofnunarinnar.