Adatvédelem és információszabadságInformatika

Óriási Youtube adatszivárgás helyett már megint a magyar médiáról

media

A nyári uborkaszezonban közepesen nagyot futott a hír, hogy a Comparitech kiberbiztonsági vállalat talált néhány védtelen adatbázist, ami a Social Data elnevezésű, adatbányászattal foglalkozó cég szerverein volt elérhető, a publikus internet felől. A kiberbiztonsági elemző cég szerint az adatok egy részének a forrása a Deep Social vállalat lehetett, amivel korábban a Facebook és az Instagram is megszakította az együttműködését. Ezt a Social Data tagadta.

Minderről a Comparitech egy egészen érdekes és részletes tájékoztatást adott a cikkében, amit a média azután felkapott. Leírja benne például azt is, hogy az adatok scraping technológiával lettek begyűjtve, ami egy automatizált és tömeges adatgyűjtő robot, és ami jobbik esetben az egyébként publikusnak szánt oldalakról gyűjti be, célzottan az információkat.

Ez ellen a jelenség ellen persze a „learatott” weboldalak megpróbálnak küzdeni és tiltják ennek a technológiának a használatát. Egyfelől azért, mert a felhasználóik azért adják meg a személyes adataikat, hogy azt a konkrét weboldal használja, hasznosítsa, az általuk előzetesen megismerhető adatkezelési szabályzatok alapján.

Másfelől meg persze köszönik szépen maguknak ezeket az adatokat, amiknek kereskedelmi, illetve „kutatási célú” hasznosítását (ha erre az érintett engedélyt ad) inkább maguk végeznék, nem pedig az ilyen területen „versenytársak” pénztárcáját szeretnék gyarapítani.

Egyébként az adatok forrását tekintve:

  • 96,714,241 record az Instagramról,
  • 95,678,713 record az Instagramról,
  • 42,129,799 record a TikTokról,
  • 3,955,892 record a Youtuberól.

A begyűjtött, vagy legalábbis a letárolt adatok pedig:

  • profilnév,
  • valódi név,
  • profilkép,
  • leírás,
  • üzleti jelleg,
  • statisztika a követőkről,
  • utolsó posztolás,
  • kor,
  • nem,
  • illetve bizonyos esetekben e-mail címek, telefonszámok is szerepeltek.

Egy-két beszédesebb JSON-részletet is bemutatnak bizonyítékul. Arról nincs információ, hogy az adatokhoz bárki más ténylegesen hozzáfért volna, de a Comparitech  iparági tapasztalatai alapján ez akár néhány órán belül megtörténhetett.

Összefoglalva tehát adatvédelmi szemüvegen keresztül egészen biztosan több probléma is lehetett a fenti ügyben, de ezeket az adatokat a publikus felületekről gyűjtötte be valaki, eljárását tekintve nem sokban különbözve attól, ahogy azt egyébként más keresőrobotok is teszik.

Más kérdés persze a személyes adatok, és az ahhoz kapcsolható további adatok összegyűjtése, összekapcsolása, és védtelen hozzáférhetővé tétele bárki számára. Tehát az adatvédelmi probléma a véleményem szerint valós.

Ehhez képest a Portfolio „Brutális adatszivárgás a Youtube-nál, TikToknál és Instagramnál: százmilliók adatai kerültek nyilvánosságra” című cikkében nem nagyon szól arról, hogy az adatok ilyen technológiával kerültek begyűjtésre, nem ír arról, hogy a címben megjelölt, érintett vállalatoknak ehhez a problémához nincs közük.

Ennek hiányában pedig az egész írásnak egy olyan olvasatát nyitja ki, mintha az adatszivárgás eredete közvetlenül ezekhez a vállalatokhoz kötődne és onnan gyűjtötte volna be a Deep Social-on keresztül a Social Data, ami bár bizonyos értelemben igaz, de ez ebben a formában nyilvánvalóan kifordítása lenne a tényeknek.

Érdekes továbbá a magyar címadás is, hiszen a fentiek miatt az adatszivárgás nem a Youtube-nál, TikToknál és Instagramnál volt, hanem a Social Datánál. Végezetül pedig nem ebben a sorrendben. Sem az adatok számossága, sem az ABC szerint.

A kibercég még arra is vette a fáradságot, hogy már a „Social media data broker exposes nearly 235 million profiles scraped from Instagram, TikTok, and Youtube” címében korrektül tájékoztasson minden fontosabb kérdésről, amit fent hiányoltam.

Persze az „adatszivárgás a Youtube-nál, TikToknál és Instagramnál” clickbait „képességei” vitathatatlanok, hiszen a Youtube-ot mindenki használja, vagyis bárki érintett lehet, a falból is a TikTok adatproblémái folynak, az Instagram meg nyilván utolsó sorban érintett.

Mi ezzel a baj? Az, hogy valójában nem volt „Brutális adatszivárgás a Youtube-nál, TikToknál és Instagramnál”, ellenben szépen hozzászokik az olvasó, hogy százmilliós, milliárdos adatszivárgások történnek ezeknél az óriásvállalatoknál, mégsem dől össze a világ, amiből levonja majd azt a következtetést, amit nem kellene.

A cikkhez ITT lehet hozzászólni. Ha tetszett, ne maradj le a következőről:

Ajánlott tartalom