Netes kereséseink alapján jósolná meg a járvány következő hullámait egy amerikai algoritmus

2020. július 9. 18:09

A Harvard kutatói által kifejlesztett módszer a Twitteren, a Google-on és további felületeken megadott, koronavírushoz kapcsolt keresőkifejezéseink számának alakulását követve elvileg hatékonyan előre tudja jelezni, hol fognak megsokasodni a fertőzöttek.

A sikeres megküzdésnek a koronavírussal nem csak az az előfeltétele, hogy előre be legyen tárazva a lélegeztetőgép meg az orvosi maszk, de az is, hogy eredményesen előre tudjuk jelezni a fertőzésszámok megszaporodását. Ezért vesz rendszeresen mintákat a budapesti szennyvízből a Nemzeti Népegészségügyi Központ (mely a hónapban már a fővároson kívül is vizsgálódott), a mintákat elemezve ugyanis akár két héttel előrejelezhető az újabb gócpont kialakulása.

A Harvard új húzása is ezen az elven működik, csak teljes egészében az interneten zajlik: szennyvíz helyett a közösségi médiában indított kereséseket vizsgálja, a koronavírus helyett a koronavírussal kapcsolatos keresések gyakorisága és minősége alapján jósol, és ugyanúgy nagyjából két hetes felkészülési időt ad a helyi egészségügyi ellátórendszereknek. Az algoritmust a New York Times cikke mutatta be.

Az algoritmust egy nemzetközi kutatócsoport állította össze a Harvard két kutatója, Mauricio Santillana és Nicole Kogan vezetésével. A rendszer valós időben monitorozza a Twitter- és Google-kereséseket, párosítva az okostelefonok mobilitási adataival és további adatokkal. A kutatócsapat az eszközt úgy írja le, mint egyfajta hőfokszabályzót, mely segít a szigorítások és lazítások tervezésében és finomhangolásában, vagyis nagy segítség lehet az újranyitások tervezésében.

Santillana úgy ragadta meg az algoritmusban rejlő újdonságot, hogy a legtöbb virológiai modellben különböző feltételezések alapján dolgoznak ki különféle forgatókönyveket - feltételezések viszont ebben a keresés-monitorozó rendszerben nincsenek, itt csak megfigyelés folyik, de ez az eljárás a valós idejűség miatt érzékenyebben reagál a viselkedésminták azonnali megváltozására.

Az új elemzési módszernek még nem készült el a szakmai bírálata, de azok a külsős szakemberek, akik már betekintést nyertek bele, eddig biztatónak látták a fejleményeket, kiemelve, hogy a módszer javíthat a már meglévő vírusmodellek eredményességén.

Próbálták már, nem sikerült

A betegségek terjedésének valós idejű adatokon alapuló előrejelzésére már legkésőbb 2008-ban tettek kísérletet, de az a projekt még nem volt sikeres. Akkor a Google mérnökei próbálták meg kitapintani a háziorvosi látogatások esetleges felszökését, az alapján, hogy keresőjükben elkezdték külön figyelni az olyan, influenza-gyanús keresőkifejezések gyakoriságának alakulását, mint "levertnek érzem magam", "sajgó ízületek" vagy az "oszeltamivir-adagolás" (ez egy az influenzavírus A és az influenzavírus B fertőzés kezelésére és megelőzésére használt gyógyszer), és így tovább.

Ez volt a Google Flu Trends, de nem muzsikált valami jól: mint utóbb kiderült, folyamatosan túlbecsülte az orvosi látogatásokat, részben a nem elegendő adat miatt, részben külső tényezők befolyása okán (ilyen volt például a sajtómegjelenések hatása - ha valahol elkezdtek cikkezni az influenza-járványról, annak nyomán akkor is megugrottak a Google-keresések, ha amúgy adott régióban nem is indult útjára a fertőzés).

Ez is bizonyítja, hogy a környezetéből kiragadba, önmagában egyetlen adatsor nem nyújt valós képet, a mostani modell azonban jóval több, valós időben alakuló adattal dolgozik, így valóban eredményesen képezheti le a valós vírushelyzet valós alakulását.

Kereskedjen az mfor trader rendszerével!
Esést vár a piacokon? Nálunk akkor is kereshet! Apple részvényeket venne, esetleg a Google és a Microsoft érdekli? Bízik az elektromos autókban: a Teslában vagy inkább a Mercedesben? Vagy inkább hazai pályán maradna? Ha a világ legnagyobb tőzsdéin, vagy 120 devizapárral kereskedne, adott a lehetőség. Tesztelje rendszerünket kockázatmentesen!

Több gépszem többet lát

Az új eljárás a Google-ön túl négy forrás adatait vizsgálta. Nézték a Twitteren megjelenő koronavírussal kapcsolatos bejegyzéseket, azok posztolói lokációjának számba vételével, nézték az UpToDate nevű orvosi platformon lefuttatott (nyilvánvalóan orvosi) kereséseket, az okostelefonok anonim lokációs adatait, és a Kinsa nevű okoshőmérő adatait, melyet az eszköz a hozzá párosított applikációba tölt fel. Ezt a színes adathalmazt küldték be a Northeastern University által kifejlesztett előrejelzési modellbe, mely az emberek mozgási és közösségben mutatott viselkedési mintáin alapul.

A kutatócsoport a modell számításainak helyességét úgy ellenőrizte, hogy összevetették az előrejelzések adatait és a koronavírus-fertőzések és a betegséghez kapcsolt halálesetek adatait március-áprilisban, az USA minden egyes államában. Azt találták, hogy New Yorkban a koronavírus-témájú Twitter-bejegyzések már több mint egy héttel azelőtt kilőttek az égbe, hogy a vírus március közepén konkrétan berobbant volna a városban. A Google releváns keresései és a Kinsa-adatok is több nappal előzték meg a fertőzöttek tömeges megjelenését.

A kutatócsoport súlyozta az adatforrásokat releváns találatok alapján, és az így kapott előrejelzés átlagosan 21 nappal jelezte előre a következő gócpont-kialakulást. Az aktuális adatok azt jósolják, hogy a következő nagy fertőzöttszám-felszökést Nebraskában és New Hampshire-ben regisztrálják majd pár héten belül, noha jelenleg mindkét államban még csendes a járványhelyzet.

Santillana kiemeli, hogy a modelljük nem kiváltja a tradicionális megfigyelést, hanem megerősíti. Szerinte ezekkel az információkkal felszerelve a helyi vezetők sokkal könnyebben meg tudnak hozni egy szigorításról szóló döntést, melynél akár egy hetes késlekedésen is emberéletek tömegei múlhatnak.

A világot ez sem váltja meg

A modell kritikusai szerint ugyanakkor a bigdata-elemzések sem tudják jobban előrejelezni a társas visekedés hirtelen változásait, mint a tradicionális modellek. Például semmi sem jelezhette előre a Geroge Floyd halála miatt indult tiltakozási hullámot, és annak járvány-hatásait - ez tömeges megfertőződések melegágya lehetett.

Problémás az is, hogy a közösségimédiás keresések az idő előrehaladtával kevésbé képesek a valósággal tényleg találkozó fertőzöttségi jóslatokat produkálni, egyszerűen azért, mert minél többet tudnak az emberek a vírusról, annál kevesebbszer használják a hozzá kapcsolódó keresőkifejezéseket.

Az amerikai járványügyi hivatal (Centers for Disease Control and Prevention) éppen ezért nem is szán központi szerepet a hasonló algoritmusoknak a járvány-előrejelzéseik összeállításakor. Santillana ugyanakkor arról beszél, hogy az elérhető "legjobb" adatsorokkal dolgoznak, és nagyon kíváncsiak lennének például arra, hogy az Amazon és a Netflix adatai mit árulnának el nekik.

(New York Times)

Friss

Privátbankár.hu Top 24

A magyar GDP-növekedés hátulról a második az Európai Unióban

Sereghajtó az EU-ban a magyar GDP-növekedés, csak egy ország áll mögöttünk.

Bezuhantak az exportrendelések, és ezzel a magyar ipar is

Havi alapon az idei legnagyobb mértékben esett vissza a magyar ipar teljesítménye júniusban. A főként az exportra termelő ágazatoknak nem jó hír, hogy a német ipari megrendelés-adatok messze alulmúlták a várakozásokat.

Az Otthon Start mellékszála beindíthatja a nagy lakásprojekteket

Nemzetgazdasági szempontból kiemelt beruházássá nyilvánítja a kormány azokat a legalább 250 lakásos ingatlanfejlesztéseket, melyeknél a lakások 70 százaléka megfelel az Otthon Start program követelményeinek. Több lakás épülhet ettől? A végleges részletszabályok egyelőre nem ismertek, de a döntés mindenképpen élénkítheti az újlakás-piacot, noha az igazi hatása majd csak évek múlva érződik – olvasható az OTP Ingatlanpont friss elemzésében.

Csak a jövő néz ki jól a magyar építőiparban

Az egy évvel ezelőttihez képest valamelyest nőtt az építőipari termelés, de az előző hónaphoz képest csökkent – a megkötött új szerződések volumene viszont nagyot emelkedett. Az építőipar termelői árai emelkednek.

Szabadesés: az ipari termelés valóban zuhant júniusban

Szabadesés: az ipari termelés valóban nagyot zuhant júniusban

2025 júniusában az ipari termelés volumene 4,9 százalékkal elmaradt az egy évvel korábbitól. A munkanaphatástól megtisztított index megegyezik a kiigazítatlannal. A feldolgozóipari alágak többségében visszaesés következett be. A szezonálisan és munkanappal kiigazított adatok alapján az ipari kibocsátás 1,2 százalékkal kisebb volt a 2025. májusinál.

Nem számít az adótitok: olyan levelet küldhet a NAV, amilyet eddig még soha

A friss Magyar Közlönyben megjelent egy rendelet, amely szerint mostantól az adótitok felhasználására alapos ok, hogy ki kell küldeni a kormány propagandalevelét.

Pintér Sándor lánya 300 milliós vagyon érkezésekor lett vezérigazgató a lovasberényi kormányüdülőt megszerző cégben

Pintér Sándor lánya több mint 300 milliós vagyon landolásakor lett vezérigazgató

A vagyon a Civil Zrt.-től érkezett, amit később megvett Nyerges Zsolt.

Nagy Mártonék döntöttek: pluszpénz jut erre a projektre

Kiszélesítették a program kereteit.

Működik a különadó: sokan lemondtak a káros italokról

Lényeges mértékben visszaesett az idei év első hat hónapjában Szlovákiában az édesített italok eladása és így vélhetően a fogyasztásuk is – közölte a TASR szlovák közszolgálati hírügynökség az Alkoholmentes Italok és Ásványvizek Gyártói Szövetségének (AVNM) statisztikáira hivatkozva szerdán.

Orbánék rokonával üzletelt a válságos időkben felbukkanó milliárdos

Orbán Viktorék rokonával üzletelt a válságos időkben felbukkanó milliárdos

Nyerges Zsolt ezúttal Lévai Anikó unokaöccsével bizniszelt. Tavasz óta látványos a mozgása a céges világban.

Emelkedik a koronavírus-fertőzések száma Magyarország egyes részein

Orbán Balázs szerint Putyin nem avatkozik be a választásokba

Befűtött a kánikula a forintnak is

A mesterséges intelligencia két új antibiotikumot talált fel