Informatika

Évente kétszer aratják a magyar internetet

webaratás

Úgy látszik a webaratás az egy karácsonyi téma lesz nálam. Történt ugyanis, hogy épp egy éve írtam arról, hogy az Országos Széchényi Könyvtár 2017 áprilisától az OKR projekt keretében elkezdett kísérletezni a webarchiválás technológiájával, az internetes források hosszú távú megőrzésének érdekében. Ennek a kutatási és fejlesztési munkának az a célja, hogy megalapozza egy leendő magyar internet archívum feltételeit.

A projekt úgy tűnik, hogy nem áll(t) meg, ugyanis a „Magyar Internet Archívum” (vagy feltételezem valamilyen hasonló fantázianéven fut a projekt) kapcsán épp tegnap jelent meg a webarchiválás részletes szabályairól szóló 626/2020. (XII. 22.) Korm. rendelet. A norma értelmében a nemzeti könyvtár a muzeális intézményekről, a nyilvános könyvtári ellátásról és a közművelődésről szóló 1997. évi CXL. törvény alapján, a webtartalom begyűjtése érdekében jegyzéket vezet.

A jegyzék tartalmazza a webtartalom:
a) egyedi azonosítóját,
b) URL-címét,
c) kiemelkedő minősítését,
d) elnevezését és
e) jegyzékbe történő felvételének időpontját.

A webaratás (merthogy az eljárást így hívják) során a nemzeti könyvtár a jegyzékben szereplő valamennyi webtartalom kezdőlapjáról és legfeljebb 10 linkmélységgel mélyebb tartalmáról az adott időpontot tükröző tartalmú adatfelvételt készít, illetve a webtartalomnak – meghatározott szempontok szerint válogatott köréről – a webtartalom teljességének letöltésére irányuló adatfelvételt készít.

A nemzeti könyvtár válogatott webaratást akkor végez, ha a webtartalmat oktatási, tudományos, kulturális, társadalmi, történeti vagy egy adott eseménnyel, történéssel összefüggésben meghatározott kutatási szempontból kiemelkedőnek minősítette. A minősítést évente felül kell vizsgálni és a minősítés eredményétől függően a változást a jegyzéken átvezetni.

A nemzeti könyvtár teljes körű webaratást évente két alkalommal, válogatott webaratást negyedévente végez, kivéve, ha egy adott eseményre vonatkozó webtartalom esetében az esemény jellegére és aktualitására tekintettel ennél nagyobb gyakoriságot tart indokoltnak.

A webaratás során a nemzeti könyvtár a begyűjtött webtartalom minőségét ellenőrzi, gondoskodik annak archiválásáról és az archivált webtartalom feltárásáról. A nemzeti könyvtár és a tartalomszolgáltató megállapodást köthet a tartalomszolgáltató válogatott webaratás szempontjainak nem megfelelő webtartalmának válogatott webaratás során történő archiválása céljából. A nemzeti könyvtár a megállapodás alapján az archiválást szabad kapacitása terhére végezheti.

A rendelet úgy  rendelkezik, hogy nem kell archiválni a folyamatosan vagy alkalomszerűen sugárzott online rádió-, televízió-, videó-, podcast- vagy egyéb audiovizuális webtartalmat, valamint a feltört, vírussal vagy más rosszindulatú kóddal fertőzött webtartalmat.

A tartalomszolgáltató a nemzeti könyvtárral történő együttműködés keretében köteles a nemzeti könyvtár megkeresésére írásban nyilatkozni a bejelentett webtartalom nyilvános hozzáférésű archívumban történő hozzáférhetővé tételére vonatkozóan és hozzáférési jogosultságot adni az általa közzétett webtartalom archiválási célú begyűjtéséhez és lemásolásához.

A nemzeti könyvtár a begyűjtött és archivált webtartalom megismerhetőségét és használatát a szerzői jogról szóló törvény rendelkezéseinek alkalmazásával, ingyenesen biztosítja helyben használat vagy interneten történő hozzáférhetővé tétel formájában. Az interneten az az archivált webtartalom tehető hozzáférhetővé, amelyre vonatkozóan a nemzeti könyvtár a tartalomszolgáltatóval felhasználási szerződést kötött.

A nemzeti könyvtár jogosult a kormányzati és önkormányzati tartalomszolgáltató és az állami vagy önkormányzati fenntartású intézmény tartalomszolgáltató archivált webtartalma, valamint a költségvetési támogatás igénybevételével létrehozott archivált webtartalom nyilvános szolgáltatására. Az archivált webtartalom felhasználója felelős a webtartalom jogszerű felhasználásáért.  A könyvtárak az archivált webtartalom használatát a nemzeti könyvtár által biztosított formában teszik lehetővé a felhasználók számára.

A fentiek azért izgalmasak, mert az interneten elérhető tartalmakat számtalan robot, crawler igyekszik feltérképezni, de ezek mögött szinte soha nem áll szerződéses jogviszony. A magyar koncepció viszont ragaszkodik a felhasználási szerződés meglétéhez, ami meglehetősen nagy adminisztrációs terhet fog jelenteni az üzemeltetők számára, illetve korlátozza majd a projekt tényleges hatókörét.

Másfelől viszont úgy tűnik, hogy a rendelet szerint az anyaggyűjtésre, tárolásra, belső körben való felhasználásra ez nem vonatkozik, mivel a felhasználási szerződés előírása kizárólag az interneten való közzétételre vonatkozik. Mindenesetre kíváncsian várom a fejleményeket és persze az OSZKbot/3.3 ismételt megjelenését is a weboldalamon.

A kép illusztráció, a webaratás nem a Google technológiájával történik.

A cikkhez ITT lehet hozzászólni. Ha tetszett, ne maradj le a következőről:

Ajánlott tartalom

Továbbiak:Informatika