2020-ųjų pavasaris išgarsino naują statistikos modelį. Visuomenei stengiantis suprasti, kiek galingas koronavirusas gali būti kovą ir balandį, kaskart buvo siūlomos dvi prognozavimo sistemos: vieną iš jų sukūrė valstybinis universitetas „Imperial College London“, kitą – Sveikatos parametrų ir vertinimo institutas (angl. Institute for Health Metrics and Evaluation, IHME), įsikūręs Siatle.

Bet modelių prognozės smarkiai skyrėsi. „Imperial“ perspėjo, kad Jungtinėse Valstijose iki vasaros nuo COVID-19 gali mirti iki dviejų milijonų žmonių, tuo tarpu IHME prognozės buvo daug konservatyvesnės,– apie 60 000 mirčių iki rugpjūčio.

Kaip paaiškėjo, nė viena iš jų toli gražu neatitiko tikrovės. Jungtinėse Valstijose iki rugpjūčio pradžios nuo COVID-19 mirė apie 160 000 žmonių.

Didžiuliai prognozių duomenų skirtumai tą pavasarį atkreipė jauno duomenų mokslininko dėmesį. 26-erių metų Youyangas Gu turėjo elektrotechnikos ir informatikos magistro laipsnį Masačiusetso technologijų institute (MIT) ir dar vieną matematikos mokslų laipsnį, bet nebuvo baigęs jokių formalių studijų su pandemija susijusiose sferose, tokiose kaip medicina ar epidemiologija. Ir vis dėlto jis pamanė, kad jo darbo su duomenų modeliais patirtis gali būti naudinga per pandemiją.

Youyangas Gu

Balandžio viduryje, gyvendamas su tėvais Santa Klaroje, Kalifornijoje, Youyangas Gu savaitę kūrė savo paties COVID mirčių prognozavimo priemonę ir svetainę niūriai informacijai eksponuoti.

Netrukus jo modelis jau generavo daug tikslesnius rezultatus nei tie, kuriuos skelbė dosniai finansuojamos ir ilgametę patirtį turinčios institucijos.

„Jo modelis buvo vienintelis, kuris atrodė racionalus, – sakė Jeremy Howardas, garsus duomenų ekspertas ir San Fransisko universiteto mokslinis bendradarbis. – Kiti modeliai ne kartą pasirodė beprasmiški, be to, trūko įžvalgų ir analizių iš tų, kurie publikavo prognozes, ar žurnalistų, kurie apie jas rašė. Nuo šių dalykų priklausė žmonių gyvybės, ir Youyangas Gu buvo būtent tas žmogus, kuris iš tiesų analizavo duomenis ir darė tą tinkamai.“

Prognozavimo modelis, kurį sukūrė Youyangas Gu, iš dalies buvo paprastas. Jis iš pradžių sumanė ištirti ryšį tarp COVID testų, hospitalizacijų ir kitų veiksnių, bet netrukus įsitikino, kad tokius duomenis valstijos ir federalinė vyriausybė skelbia nenuosekliai.

Paaiškėjo, kad patikimiausi yra dienos mirčių rodikliai. „Kiti modeliai naudojo daugiau duomenų šaltinių, bet aš nusprendžiau pasiremti jau užfiksuotų mirčių skaičiumi, kad galėčiau prognozuoti būsimų mirčių rodiklius, – sakė Youyangas Gu. – Apsiribojimas šiuo vieninteliu šaltiniu padėjo išfiltruoti signalą triukšmo fone.“

Siekdamas patobulinti savo skaičiavimus, Youyangas Gu naudojosi mašininio mokymo algoritmais, ir tai lėmė naują, pažangų posūkį kuriant modelį. Baigęs MIT, jaunas vyras porą metų dirbo finansų pramonėje kurdamas algoritmus dažnų trumpalaikio pobūdžio prekybos sandorių (angl. high frequency trading) sistemoms, – jis žinojo, kad jeigu nori išsaugoti savo pareigas, jo prognozės turi būti tikslios.

Dirbdamas COVID sferoje, Youyangas Gu toliau lygino savo prognozes su skelbiamais galutiniais bendrais mirčių rodikliais ir nuolat derino bei koregavo savo mašininio mokymosi programinę įrangą, idant prognozavimas būtų dar tikslesnis. Ir nors toks darbas reikalavo tiek pat laiko, kiek dirbant visą įtemptą darbo dieną, Youyangas Gu darbavosi savanoriškais pagrindais ir gyveno iš santaupų. Jis norėjo, kad jo duomenys nebūtų varžomi kokių nors interesų konfliktų ar politinio šališkumo.

Youyango Gu modelis, nors toli gražu ne tobulas, nuo pat pradžių veikė gerai. Balandžio pabaigoje jaunasis mokslininkas prognozavo, kad iki gegužės 9 dienos Jungtinėse Valstijose bus užregistruota 80 000 mirčių. Faktinis mirčių skaičius siekė 79 926. Panašioje balandžio pabaigoje skelbtoje IHME prognozėje prognozuota, kad per visus 2020 metus JAV nebus peržengta 80 000 mirčių riba. Youyangas Gu taip pat numatė 90 000 mirčių iki gegužės 18 dienos ir 100 000 mirčių – iki gegužės 27 dienos, ir vėl skaičiai atitiko.

Tuo metu, kai IHME tikėjosi, jog virusas išnyks kaip socialinių kontaktų ribojimo ir kitų priemonių rezultatas, Youyangas Gu prognozavo antrą, didelę užsikrėtimų bei mirčių bangą, daugeliui šalių atsivėrus po karantinų.

IHME sulaukė kritikos kovą bei balandį, kai jos pateikti skaičiai neatitiko faktinės padėties. Vis dėlto įtakingą centrą, įsikūrusį Vašingtono universitete ir finansuotą daugiau nei 500 mln. JAV dolerių iš Billo Gateso ir jo žmonos Melindos fondo „Bill & Melinda Gates Foundation“, kone kasdien per spaudos konferencijas citavo prezidento Donaldo Trumpo administracijos nariai.

Balandį JAV Nacionalinio alergijos ir užkrečiamųjų ligų instituto vadovas Anthony Fauci žurnalistams pareiškė, kad mirčių nuo COVID-19 skaičius „veikiau siekia 60 000, o ne 100 000-200 000“, kaip anksčiau prognozuota – rodikliai, atspindėję IHME prognozes.

O balandžio 19 dieną, tą pačią dieną, kai Youyangas Gu perspėjo dėl antrosios bangos, D. Trumpas atkreipė dėmesį į IHME 60 000 mirčių prognozę kaip indikatorių, jog kova su virusu netrukus bus baigta.

IHME pareigūnai taip pat aktyviai propagavo savo skaičius.

„Per visas naujienų laidas matydavai, kaip IHME stengiasi įtikinti žmones, kad iki liepos mirčių skaičius sumažės iki nulinio lygio, – sako Youyangas Gu. – Bet kuris blaiviai mąstantis žmogus galėjo nuspėti, jog kurį laiką turėsime 1 000-1 500 mirčių per dieną rodiklius. Mano nuomone, toks jų elgesys buvo labai nesąžiningas.“

IHME direktorius Christopheris Murray tvirtina, kad kai organizacija po balandžio mėnesio sugebėjo geriau perprasti virusą, jos prognozės radikaliai pagerėjo.

Bet tą pavasarį, sulig kiekviena savaite, vis daugiau žmonių ėmė įsiklausyti į Youyango Gu darbus. Jis pranešė apie savo modelį žurnalistams per tviterį, taip pat nusiuntė elektroninį laišką epidemiologams, prašydamas jų patikrinti jo skaičius. Baigiantis balandžiui, garsusis Vašingtono universiteto biologas Carlas Bergstromas tviteryje užsiminė apie Youyango Gu modelį, ir jau neturkus JAV ligų kontrolės ir prevencijos centras (CDC) įtraukė vaikino rodiklius į savo COVID prognozių svetainę. Pandemijai gilėjant, Youyangas Gu, kinų imigrantas, užaugęs Ilinojaus ir Kalifornijos valstijose, jau dalyvavo reguliariuose susitikimuose su CDC atstovais ir profesionalių modeliuotojų bei epidemiologų komandomis, nes visi labai stengėsi pagerinti savo prognozes.

Youyango Gu tinklalapis stačiai sprogo nuo peržiūrų, milijonai žmonių kasdien jį tikrino, norėdami sužinoti, kas vyksta jų valstijose ir apskritai JAV. Dažniausiai jo prognozuoti rodikliai kone tiksliai atitikdavo faktinius mirčių skaičius, kurie būdavo paskelbti po kelių savaičių.

Kilus tokiam dideliam susidomėjimui šiomis prognozėmis, 2020 m. pavasario-vasaros laikotarpiu ėmė rastis daugiau modelių. Nicholas Reichas, Masačiusetso universiteto (Amherstas) Biostatistikos ir epidemiologijos departamento docentas, surinko apie 50 modelių ir daugelį mėnesių tikrino jų tikslumą „Covid-19 Forecast Hub“ prognozių centre. „Youyango modelis nuolat buvo tarp geriausiųjų“, – sakė N. Reichas.

Lapkritį Youyangas Gu nusprendė nutraukti savo mirčių prognozių veiklą. N. Reichas, jungęs ir derinęs įvairių prognozių duomenis, nustatė, kad tiksliausias prognozes siūlo būtent šis „modelio ansamblis“, arba kitaip, kombinuoti duomenys.

„Yoyangas Gu pasitraukė demonstruodamas neįtikėtiną nuolankumą, – sako N. Reichas. – Jis suprato, kad kiti modeliai puikiai veikia ir kad čia jam nebėra ką veikti“.

Likus mėnesiui iki projekto sustabdymo, Youyangas Gu paskelbė prognozę, esą iki lapkričio 1 dienos Jungtinėse Valstijose bus užfiksuota 231 000 mirčių. O lapkričio 1-ąją JAV paskelbė apie 230 995 mirtis nuo koronaviruso.

Ch. Murray iš IHME turi asmeninę nuomonę dėl Youyango Gu pasitraukimo. Pasak jo, Youyango Gu modelis nebūtų apčiuopęs sezoninės koronaviruso prigimties ir būtų praleidęs žiemos sezono atvejų ir mirčių šuolį.

„Jis manė, kad epidemija išsikvėps žiemą, o mes dar gegužę įžvelgėme sezoniškumą“, – sako Ch. Murray.

Mašininio mokymosi metodai, kuriuos naudojo Youyangas Gu, puikiai veikia sudarant trumpalaikes prognozes, sako Ch Murray, bet piešiant bendresnį vaizdą „nėra itin tinkamos, kai norima suprasti, kas vyksta“. Anot Ch. Murray, algoritmai, paremti ankstesniais įvykiais, negali atsižvelgti į viruso atmainas ir į tai, kaip vakcinos galėtų ar negalėtų jas nukenksminti. IHME, savo ruožtu, teisingai numatė pirminį viruso piką, vėliau suklydo prognozuodama staigų mirčių sumažėjimą, kol galiausiai pakoregavo savo modelį taip, kad jis geriau atspindėtų tikrąją padėtį. „Mes suklydome balandį, – pripažįsta Ch. Murray. – Nuo tada esame vienintelė grupė, kuri sistemingai pateikia teisingus duomenis.“

N. Reichas, sudarantis pagrindinių modelių aprašą, teigia, kad organizacijos prognozės vėlesnėmis pandemijos fazėmis buvo priimtinos. „Ankstesnėje stadijoje IHME modelis neatliko to, ką reklamavo, – sako N. Reichas. – Ne per seniausiai jis tapo priimtinu modeliu. Nepasakyčiau, kad jis yra vienas iš geriausių, bet priimtinas.“

Youyangas Gu nėra linkęs komentuoti Ch. Murray pastabų dėl savo modelio ir veikiau siunčia dviprasmišką komplimentą duomenų mokslininko versijai. „Aš esu labai dėkingas daktarui Chrisui Murray ir jo komandai už jų atliktą darbą, – sako jis. – Be jų aš nebūčiau toje pozicijoje, kurioje esu šiandien.“

N. Reichas sako, kad iš šios duomenų istorijos galima pasimokyti, ir prašo žmonių neskubėti per daug pasitikėti pirminiais individualiais modeliais kitą kartą, kai kils pandemija. Jis taip pat abejoja, ar prognozės šešioms-aštuonioms savaitėms kada nors bus labai tikslios. Būtų geriausia, jeigu ateityje CDC ir kiti operatyviau jungtų modelius ir platintų kombinuotus duomenis.

„Tikiuosi, kad mes investuosime laiką, energiją, ir lėšas į sistemą, kuri, pasitelkdama platesnį modelių spektrą, nuo pat pradžių bus geriau pasiruošusi reaguoti, – sako N. Reichas. – Turime parengti žmones, užuot slampinėję aplinkui ir beldęsi į žmonių duris.“

Po nedidelės pertraukėlės Y. Gu, kuriam dabar jau 27-eri ir kuris gyvena bute Niujorke, grįžo į modeliavimo sferą. Šį kartą jis „buria“ skaičius, susijusius su tuo, kiek žmonių JAV infekuota COVID-19, kaip greitai kuriamos ir gaminamos vakcinos ir kada, jei kada nors apskritai, šalis galėtų pasiekti kolektyvinį imunitetą.

Jo prognozėmis, apie 61 proc. gyventojų iki birželio turėtų jau įgyti tam tikrą imuniteto formą – ar dėl vakcinos, ar dėl persirgtos ligos.

Iki pandemijos Youyangas Gu tikėjosi įsteigti naują įmonę, galimai sporto analizės srityje. Dabar jis svarsto galimybę ir toliau darbuotis visuomenės sveikatos sektoriuje. Jis norėtų susirasti darbą, kur galėtų prasmingai prisidėti prie bendro reikalo, bet kartu išvengiant politikos, šališkumo ir bagažo, kuris kartais neatsiejamas nuo didelių institucijų.

„Yra daugybė trūkumų šioje srityje, kuriuos galėtų ištaisyti mano aplinkos žmonės, – sako jis. – Bet aš vis dar nežinau, ar rasiu čia sau nišą.“