COVID19

Az utóbbi napokban egymás érik a mesterséges intelligencia alkalmazásának lehetőségeit és eredményeit firtató tudományos cikkek a médiában. Ezen cikkek fókuszában leginkább a koronavírus (COVID19) kitörésénél jeleskedő, kanadai BlueDot áll, amely nyelvi elemzést használva hírek, illetve információk elemzésével ért el kiemelkedő eredményeket, és megjósolta a fertőzés kirobbanását, jócskán megelőzve a hivatalos forrásokat. De vajon mi lesz a következő lépés?

Hasonló kutatások már a Zika vírus kapcsán elindultak, illetve a Google  is folytatott mesterséges intelligencia kutatásokat az influenza terjedésével összefüggő témakörben, Flu Trends néven, ami végül nem igazán váltotta be a hozzá fűződő reményeket. Most a DeepMind segítségével végeznek kutatásokat a koronavírus terjedésének megfékezésére.

A sikerek (és a fejlődéssel szükségszerűen együttjáró kudarcok) mögött természetesen ott feszül néhány további kérdés, de mielőtt rátérnék ezekre, egy pár gondolatot írnék magáról a mesterséges intelligenciáról. Mert a médiában talán erről esik a legkevesebb szó, nem véletlenül.

Az erről szóló cikkek felületes olvasásával ugyanis úgy tűnhet, hogy teljesen triviális, hogy mit értünk mesterséges intelligencia alatt, annak általánosan elfogadott definíciója pedig nyilvánvalóan létezik, és lényegében mindig irányt mutat minden helyzetben. Így határozottan ki lehet jelenteni, hogy A tárgyban van mesterséges intelligencia, B tárgyban nincs. A valóság szerintem igen távol áll ettől.

Mindeközben a terület – a véleményem szerint – erősen túlmisztifikált, és hoznék is gyorsan egy-két példát a fentiek alátámasztására. Már a fogalom definiálása is érdekes kérdés, az egyszerűség kedvéért én az alábbi három elemet emelném ki egy potenciális informatikai rendszer kapcsán:

  • automatizáltság,
  • tanulási képesség,
  • emberszerű működés.

Most képzeljük el az alábbi rendszert. A feladat keresőszavaknak megfelelő internetes tartalmak hatékony monitorozása. A keresési feltételeknek megfelelő oldalakat a rendszer megjeleníti az operátor számára, aki kétféle módon dönthet: A releváns, B nem releváns.

A rendszer domain nevekre szűrve figyeli az A-B válaszok arányát és XY arányú B válasz felett felkínálja, hogy az adott domain név kerüljön ki az operátor általi feldolgozásra váró elemek közül. XY időközönként ennek ellenére megjelenít ilyen kizárt találatot is, és ha arra mégis releváns, vagyis A választ kap, akkor felajánlja a korábbi, fel nem dolgozott találatok megjelenítését is.

A fenti rendszernek eleme az automatizáltság, a tanulási képesség és az emberszerű működés (utóbbi véleményes). Segítségével olyan találati mélységig juthat el az operátor, ahova manuálisan lehetetlen. Egy mesterséges intelligenciát írtam le általános iskolai matematikai műveletekkel?

Lehet persze azt mondani, hogy ez a rendszer nem flexibilis, hanem túlzottan feladatspecifikus. Most legyen a feladat OCR-ezett PDF dokumentumok feldolgozása, cél a dokumentum típusának felismerése. Az operátornak döntenie kell, hogy a képernyőjén megjelenő szöveges dokumentum típusa A vagy B.

Az operátor döntéseit figyelve a rendszer összehasonlítja az utolsó XY darab A-nak és XY darab B-nek minősített dokumentumok szövegét és olyan elemeket keres, ami legalább XY% A-ban szerepelt, és nem, vagy XY%-nál nem többször szerepelt a B típusban. Ha a rendszer XY+n dokumentumban egy A típus specifikus szót talál, akkor a lehetséges típust előre felajánlja, és már csak megerősítést kér a rendszer.

Természetesen mindkét rendszert rengeteg paraméterrel lenne lehetséges tovább finomítani, a kérdés, hogy a fenti rendszerek mesterséges intelligenciával rendelkeznek-e, vagy sem? Ez azért lényeges kérdés, a véleményem szerint, mert a közvélekedés gyakran nem diferenciál a különböző fejlettségi szintek között, és a fogalmi bizonytalanságok, illetve a témát övező üzleti megfontolások mentén a mesterséges intelligencia jelenségének társadalmi tudatosulása – szerintem – meglehetősen rossz.

A különböző vírusok globális terjedésének vizsgálatához szükséges mesterséges intelligenciák a fentieknél (ha azok egyáltalán azok) természetesen jóval összetettebbek, és érdemes szerintem leválasztani őket például a nyers matematikai algoritmusokról is. Például a Röst Gergely által vezetett szegedi kutatócsoport matematikai eszközökkel jósolta meg, az iráni fertőzöttség valódi mértékét.

A vírusok terjedéséhez használt, fejlett mesterséges intelligenciák hatékony működéséhez, mint amilyen a BlueDot, rendszerint Big Data méretű adattömegekre is szükség van, legyenek azok médiahírek, utazási szokások, vagy épp egészségügyi adatok.

Egy részük szabadon hozzáférhető, más részük elvileg kizárólag kormányzatok, nemzetközi szervezetek által elérhetők. Magyarországon például a TIBEK kezeli az utas-nyilvántartási adatállományt (PNR), az Országos Idegenrendészeti Főigazgatóság ismeri a vízumkötelezett országokból érkező forgalmat, a Nemzeti Népegészségügyi Központ ismeri a vírus terjedését leíró legfontosabb adatokat.

Ezek, és a nyílt forrásból származó Big Data adatok piaci szereplő által fejlesztett mesterséges intelligenciában történő összekapcsolása természetesen számos adatvédelmi és gyakorlati kérdést felvethetne, ha erre egyáltalán szándék lenne. Összességében, a publikált információk alapján nekem úgy tűnik, hogy BlueDot elsődlegesen szokatlan mintázatok után kutatva jelzett előre, kérdéses, hogy a további folyamatok előrejelzésében hogyan tud majd mindez segíteni.

Adja magát a kérdés: ha ennyire hatékonyak a mesterséges intelligencia előrejelzések, akkor miért nem írja le végre egy kutatócsoport, hogy mi fog történni? Akár lokálisan, akár globálisan. Akár egy hétre, akár egy évre vetítve. Hiszen lényegében minden kormány, a média, a közérdeklődés erre kíváncsi. Pédául, Magyarország felé terjed a vírus tovább Olaszországból, vagy épp Ausztriába?

Kicsit elméleti síkra terelve a gyakorlati problémát: az ilyen előrejelzések egyik legnagyobb kihívása a probléma komplexitása. Tegyük fel, hogy egy rendkívül fejlett, rengeteg adattal rendelkező mesterséges intelligencia megpróbálja megjósolni a vírus terjedését Európában, a fenti példát tovább boncolgatva, Olaszországból kiindulva.

Tegyük fel továbbá, hogy a román vendégmunkások “A” tipikus utazási útvonala Olaszország-Szlovénia-Magyarország-Románia, a “B” tipikus utazási útvonala Olaszország-Szlovénia-Horvátország-Szerbia-Románia. A mesterséges intelligencia arra a következtetésre jut, hogy a régióban ez a forgalom lesz a legfontosabb járványügyi kockázati tényező.

A mesterséges intelligencia ezért minden érintett ország tekintetében megnöveli a járvány kialakulásának valószínűségét és ezzel kalkulál tovább. A mesterséges intelligencia a tanulási folyamata eredményeként, vagy betáplált adottságként  egyébként alacsony eshetőséggel kezeli bármely érintett határ lezárását (a lehetséges jogi, gazdasági, társadalmi, politikai hatások miatt).

Azonban a magyar kormány mégis úgy dönt, hogy – bár a saját kalkulációi szerint a járvány megjelenésére és méretére nem lesz közvetlen hatással, de – mégis egy olyan eljárást vezet be a szlovén-magyar határon, amely ugyan nem jelenti annak lezárását, a teherforgalmat alig érinti, de a személyautó és busz átvizsgálás protokol kényelmetlensége miatt a személyfogalom várakozási ideje egy nagyságrendel megnő, a fertőzésgyanús személyek pedig azonnal karanténba kerülnek.

Ennek gyakorlati hatásaként a vendégmunkás személyforgalom B útvonalra terelődik (különösen, ha bármilyen – esetleg nem is koronavírus – tünet már jelentkezett is valakin, hiszen tart a karanténtól), ezzel pedig jelentősen befolyásolja a mesterséges intelligencia által jósolt terjedési forgatókönyvet. Természetesen épp a tanulási képesség és a flexibilitás miatt a mesterséges intelligencia folyamatosan képes reflektálni is a változásokra.

Ha viszont már kifejezetten döntéshozatal támogató rendszerekben gondolkodunk, és nem csak utólagos “érdekesség,” ha az történik, amit egy informatikai rendszer megjósol, akkor a mesterséges intelligenciának mindezt olyan keretek között kell tennie, ahol a döntéshozók egy része biztosan nem az eredményei szerint fog cselekedni, de paradox módon azt is számításba kell vennie, ha egy, vagy több döntéshozó az eredményeire alapozva hoz meg egy döntést, ezzel pedig lényegében saját maga is a kialakult eredmény előidézőjévé válik.

A fenti komplexitású problémák és kérdések mesterséges intelligencia általi megoldása és megválaszolása a véleményem szerint a továbbiakban is csak néhány rendszer lehet képes, jelenleg inkább a szélesebb kutatási tevékenység lehetőségét teremti meg a kialakult helyzet, lényegében kisebb méretű vállalatok számára is lehetőséget adva a fejlesztés alatt álló, közepes fejlettségű mesterséges intelligenciáik számára szükséges adatgyűjtésekhez.

Találtam egyébként egy, a mesterséges intelligencia kutatásokban gyakran alkalmazott algoritmusra, a Kalman-(vagy Kálmán, nem tudom, Rudolf E. Kalman minek örülne)szűrőre alapozott, 2020.03.01-i előrejelzést, amit a kutatók nyilvánosságra is hoztak. Az előrejelzés szerint Németországban, Franciaországban és Spanyolországban fog az igazolt fertőzések száma a következő napokban megugrani.

Németországra mára 750-800 esetet prognosztizált, jelenleg a hivatalos szám 902, amit az előrejelzés szerint 2020.03.10-én “kellett volna” csak elérni. Franciaországra az előrejelzés mára csak 500 körüli esetet jósolt, a valódi szám meghaladja Németországét, 1126 esettel. Spanyolországra a tényleges esetszám 500 körüli, ami a két nappal későbbre jósolt számnak felel meg

Hogy mi a tanulság szerintem? Egyfelől a vírus terjedése gyorsabb, mint amit a matematikai algoritmus jósolt, ami mindenképp aggasztó. A mesterséges intelligencia viszont még nem irányít.

De tanul.

A cikkhez ITT lehet hozzászólni. Ha tetszett, ne maradj le a következőről:

Ajánlott tartalom

Továbbiak:Informatika