Karácsonyi látogató

A napokban, konkrétan karácsony első napján szokatlan látogató érkezett a weboldalamra, egy „könyvtáros.” A látogatás után kicsit keresgéltem és azt kell, hogy mondjam: botnak/crawlernek, vagy keresőrobotnak így még nem örültem. Néhány napja még „a forgalom irányító szervereken keletkezett túlterhelés” miatt volt elérhetetlen a jogalappal.hu weboldal, ezért, bár másra most időm nincs, de belekukkantok a logokba is. Ott vettem észre az OSZKbot/3.3-at.

Igazából nem a neve az érdekes, hanem az, hogy honnan jött, ugyanis a KIFÜ-s környezet és az Országos Széchenyi Könyvtár volt megjelölve forrásként, illetve a http://mekosztaly.oaszk.hu/mia URL. Így találtam rá egy szuperérdekes projektre, amiről eddig alighanem csak a könyvtárosok hallhattak.

Az Országos Széchényi Könyvtár ugyanis 2017 áprilisától az OKR projekt keretében elkezdett kísérletezni a webarchiválás technológiájával, az internetes források hosszú távú megőrzésének érdekében. „Ennek a kutatási és fejlesztési munkának az a célja, hogy megalapozza egy leendő magyar internet archívum feltételeit.”

A feltételezem jelenleg is teszt fázisban levő (vagy nemrég zárult) projektben, első körben, néhány száz kulturális és tudományos webhely került kiválasztásra (pl. könyvtári, levéltári, múzeumi honlapok, egyetemek és kutatóintézetek oldalai, elektronikus folyóiratok, szakmai blogok), melyeknek a tulajdonosait elektronikus levélben értesítették erről és engedélyt kértek az archiválásra, illetve adott esetben a lementett változat szolgáltatására is, egy demonstrációs célra létrehozott gyűjteményben.

A webaratás projekt (szerintem zseniális név) során leginkább különböző open technológiákkal kísérletezgettek. A mentések Heritrix, a Brozzler, a Webrecorder, a HTTrack szoftverrel készültek, míg a megjelenítés az Open Wayback és a PyWb szoftverekkel és/vagy a Webrecorder Player online verziójával történik, továbbá a fájlrendszerben tárolt HTTrack mentések a webszerveren át is megnézhetők.

Szóval már kezdtem is megilletődni, hogy ilyen fontosnak tartja az írásaimat az OSZK, de azután rájöttem, hogy ez már az OSZKbot/3.3 második aratása (először 2018-09-24 és 2018-09-26 között volt aktív) és a pizzarendelés.com-ot már akkor feltérképezte, szóval ez a bot aligha az archiválásért felelős. Meg persze nincs is a feltérképezett oldalak keresőjében sem a honlapom (egyébként a bot csak néhány oldalt járt be a weboldalamon).

De nem is ez a lényeg, hanem az, hogy végre elindult (lényegében talán már le is zárult) egy ilyen projekt, amelyre építve tényleg el lehetne kezdeni az előzetes lehatárolások alapján értékesnek tartott digitális adattartalmak megőrzését az utókor számára, akár kifejezetten a magyar tartalmakra fókuszálva (nyilván már ez is óriási adatmennyiséget jelentene).

Az már csak hab a tortán, hogy mindezt ráadásul megfelelő jogi keretek között kívánják megtenni, hiszen több oldalas szerződést kötnek a kiszemelt weboldalakkal, amely leginkább a szerzői jogi kérdésekre fókuszál.

Miközben ugyanezt a funkciót különböző külföldi archiváló projektek hosszú évek óta, mindenféle engedélykérés nélkül elvégzik, és amiket egyébként én is gyakran használok, mivel nem ül közjegyző a szobámban ténytanúsítványokat írni (természetesen az ő munkájukra is szükség van, nem állítom tehát ezzel, hogy egyenértékű szolgáltatásokról lenne szó).

Visszatérve a MIA-ra (hogy mi a MIA, nem tudom: talán Magyar Internet Archívum?): a partner weboldalakról ráadásul részletes META-adatbázis (XML) jön létre, amiben már kissé visszásnak érzem, hogy magánszemélyek telefonszámát is közzéteszik, gondolom külön engedélykérés történik erre is, illetve remélem opcionális a megadása.

Összességében szerintem ez egy hiánypótló projekt lenne, ahol bár vannak külföldi minták (akár más könyvtárak ilyen funkciói kapcsán is), de ennek ellenére érdemes lenne tovább folytatni, mert a digitális adattartalmak világában is születnek értékek, amiket érdemes lenne megőrizni és a megőrzésük kereteiről szabadon dönteni.

A cikkhez ITT lehet hozzászólni. Ha tetszett, ne maradj le a következőről:

Cookie	Duration	Description
cookielawinfo-checkbox-advertisement	1 év	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
cookielawinfo-checkbox-analytics	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
cookielawinfo-checkbox-functional	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
cookielawinfo-checkbox-necessary	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
cookielawinfo-checkbox-others	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
cookielawinfo-checkbox-performance	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.
viewed_cookie_policy	11 hónap	A GDPR Cookie Consent plugin által használt süti, célja a felhasználó sütikkel kapcsolatos tevékenységének, döntéseinek tárolása.

Cookie	Duration	Description
_ga	2 év	Ez a sütit a Google Analytics. Feladata a látogató tevékenységének és a weboldal használatának nyomon követése. A süti véletlenszerűen generált, anonimizált adatokat használ.
_ga_WBTPGN10KT	2 év	Ezt a sütit a Google Analytics telepíti.
_gat_gtag_UA_103607673_1	1 perc	Ezt a sütit a Google alkalmazza a felhasználók megkülönböztetésére.
_gid	1 nap	Ezt a sütit a Google Analytics szolgáltatás alkalmazza. Segítségével meghatározható egyes oldalak látogatottsága és látogatói forgalma.
CONSENT	16 év 5 hónap	Ezek a sütik beágyazott Youtube videók miatt vannak jelen a rendszerben. Ezek anonim felhasználási adatokat rögzítenek, például, hogy hány alkalommal került a videó megjelenítésre. Amennyiben be van jelentkezve Google fiókjába, úgy további adatok is rögzítésre kerülhetnek.

Cookie	Duration	Description
IDE	1 év 24 nap	A Google DoubleClick által használt süti, amely a látogató érdeklődési körének megfelelő reklámokért felelős.
test_cookie	15 perc	A doubleclick.net által beállított süti. A célja felderíteni, hogy a felhasználó milyen süti beállításokat alkalmaz.
VISITOR_INFO1_LIVE	5 hónap 27 nap	A Youtube által beállított süti. A weboldalba beágyazott videókra vonatkozó információkat tárol.
YSC	munkamenet	A Youtube által beállított süti. A weboldalba beágyazott videókra vonatkozó információkat tárol.

A magyar védelmi ipar jelene

Rogán Antal bizottsági meghallgatása: Magyarország új nemzetbiztonsági struktúrája

Átalakuló nemzetbiztonság

A polgári nemzetbiztonsági szolgálatok a jövőben a Miniszterelnöki Kabinetirodához tartoznak majd

Oroszország esete a szankciós környezettel

Oroszország az új COCOM-listák árnyékában

Közvetlenül a csernobili atomerőmű mellett ég az erdő

Ma már Mariupol központjában folytatódtak a harcok

Nem lesz idén bekapcsolva az arcfelismerő rendszer a siófoki térfigyelő kamerákban

A szolgáltatóknak ellenőrizniük kell a kapcsolati ügyféladatok valódiságát

Arcfelismerő rendszer miatt módosulhat az Országgyűlésről szóló törvény

NAIH 2020: a felejtéshez jogunk van

A kínai Huawei mellé került az orosz Kaspersky az amerikai tiltólistán

A Nemzeti Kibervédelmi Intézet szerint a magánfelhasználók számára is aggályos lehet a Kaspersky használata

A masszázsszalonnal nem érdemes ujjat húzni

Kibertámadás alatt

Karácsonyi látogató

Valóra válik a csillagok háborúja?

Ezek voltak 2019 legnépszerűbb felhasználónevei

Továbbiak:Informatika

A masszázsszalonnal nem érdemes ujjat húzni

Kibertámadás alatt

Legnépszerűbb cikkek

Óriási változást hozhat a honvédelem területén az Alaptörvény kilencedik módosítása

Ezek voltak 2019 legnépszerűbb felhasználónevei

A HM Currus felkészült a dél-afrikai Mbombe 8×8 szállító harcjármű összeszerelésére

Jelentős átalakítások a Magyar Honvédségben, megszűnik az MH 54. Veszprém Radarezred

Amit egy magyar titkosügynöknek tudni érdemes

Miért kellett távoznia az Alkotmányvédelmi Hivatal vezetőjének?

Ha férfinak születtél, akkor a honvédség mindent tudni fog rólad

Több száz EJDER YALÇIN és YÖRÜK járművet vett a Magyar Honvédség

Zsarolólevelet kaptam

Brazil védelmi miniszter: közel a megegyezés a magyar kormánnyal a KC-390-es repülőgépek megvásárlásáról

Jogalappal

– független elemző oldal

A weboldal MTI hírfelhasználó

Megosztás

Ajánlott tartalom

Továbbiak:Informatika

Legnépszerűbb cikkek