„Buvus dalimi pradinio Human Genome Project dalimi 2001 ir ypatingą dėmesį skyrus sudėtingiems regionams, man iš tiesų malonu išvysti šitą darbą užbaigtą, nors tai ir truko 20 metų“, – sako Evan Eichler iš Vašingtono universiteto Seattle.

Naujajame genome papildomai yra 200 milijonų bazių porų – DNR „raidžių“, ir dar daugiau nei 2000 papildomų genų.

Mes esame tuo, kas esame, dėl genų. Žmonės jų turi tūkstančius, nors tikslus jų skaičius nėra tvirtai žinomas ir iš dalies priklauso nuo to, kaip jie skaičiuojami. Genai saugomi ląstelių branduoliuose, ilgose DNR molekulėse. Genetinė informacija egzistuoja kaip išilgai DNR molekulės išsirikiavusios keturios molekulėse, vadinamos bazėmis (Citozinas, Guaninas, Timinas ir Adeninas).

Žmogaus genome yra kiek daugiau, nei 3 milijardai raidžių. Pirmoji nuosekli genoskaita su didžiulėmis fanfaromis buvo publikuota 2001 metais: Tarptautinio žmogaus genomo nuskaitymo konsorciumo (International Human Genome Sequencing Consortium – HGSC) ir JAV kompanijos Celera Genomics. Pats projektas prasidėjo dešimtmečiu anksčiau, 1990 metais.

Kadangi genomą reikėjo nuskaityti mažomis atkarpomis ir tuomet jas vėl sujungti, kai kurių sekcijų, kuriose daug pasikartojimų, sudėlioti buvo neįmanoma, truputį panašiai sudėlioti dėlionę, kurios visi gabalėliai atrodo vienodi.

Trūkstamos dalys

Per kitus tris metus HGSC kai kuriuos iš tų plyšių užpildė, ir konsorciumas paskelbė atlikęs viską, ką galėjo. Genetikai šį referencinį genomą vis papildydavo, bet didžiąja dalimi papildydami esančias sekas, o ne pridėdami naujas. Maždaug 8 procentų trūko ar tikėtina, buvo klaidingi.

Naująją genomo versiją sukūrė Telomere-to-Telomere konsorciumas, kuriam vadovauja Karen Miga iš Kalifornijos universiteto, Santa Cruz, ir Adam Phillippy iš Nacionalinio žmogaus genomo tyrimo instituto Marylande. 2018 metais jie dalyvavo komandoje, nuskaičiusioje dideles, daugiau nei 100 000 bazių, genomo atkarpas, kurios padėjo užpildyti kai kurias trūkstamas dalis. „Ji [Miga] paskambino man ir pasakė „Noriu užbaigti genomą“,“ sako Phillippy. „Pasakiau, „Aš irgi“.“

Nuskaitytas žmogaus genomas.

Jie nusprendė skaityti ląstelių linijos CHM13 genomą. Jis yra iš nepavykusio nėštumo audinių masės, (hydatidiform mole), kuomet kiaušinėlis gimdoje praranda savo genomą, o tada apvaisinamas spermatozoidu. Susidariusi ląstelė turi tik pusę normalaus embriono DNR, todėl duplikuojama spermatozoido DNR. Tokios ląstelės suformuoja pavojingus auglius, vėžius, ir turi būti pašalinti. Tuomet jie gali augti laboratorijoje – neribotai.

„Tai yra savotiškai unikalus genomas, nes nėra kieno nors gyvenusio“, – sako Phillippy. Tai yra vieno spermatozoido DNR, tad, jame yra pusė potencialaus tėvo genomo, kuris buvo padvigubintas.

Šios ląstelės, gavus sutikimą, buvo surinktos prieš kelis dešimtmečius, tačiau donorų tapatybę anonimizavo kompanija, kuri jau pasitraukusi iš verslo, todėl nėra žinoma, iš kur tos ląstelės gautos.

„Iš tiesų negalėtume išsiaiškinti kieno jos, net [jeigu] norėtume“, – sako Phillippy.

Įprastose žmogaus ląstelėse yra dvi kiekvienos DNR gijos kopijos, kurios dažnai būna gan skirtingos, nes viena yra iš motinos, kita – iš tėvo. Tai apsunkina tikslų DNR nuskaitymą, nes keblu pasakyti, kur yra klaida, o kur tikras skirtumas. Naudojant CHM13, šios problemos nelieka, nes dvi kopijos yra praktiškai identiškos.

Viena kitą papildančios sekoskaitos technikos

Genomui nuskaityti komanda sujungė dvi technologijas. Viena buvo sekoskaitos tipas, nuskaitantis itin ilgas, daugiau nei milijono raidžių, atkarpas, o kitas sekoskaitos tipas pateikia itin tikslius rezultatus, tad, galintis susitvarkyti su labai mažai besiskiriančiomis sekcijomis – tarkime, daugybe to paties geno kopijų.

Žmogaus DNR saugoma didelėse molekulėse, vadinamose chromosomomis, kurių centre X forma susijungia keturios atšakos. Didžioji dalis sunkiai perskaitomos DNR yra apie tuos centrinius taškus, vadinamos centromeromis. Be to, kai kurios chromosomos yra nesimetriškos, viena jų atšakų pora trumpesnė už kitą: trumposiose atšakose yra daug sudėtingos DNR.

Iš pradžių, 2020 rugpjūtį komanda publikavo visą žmogaus lytinę X chromosomą. Dabar paskelbė visą žmogaus genomą.

Naujojoje versijoje yra beveik 200 milijonų raidžių daugiau, ne ankstesnėje versijoje, o 2226 sekcijos yra beveik identiškos žinomų genų kopijos. Komanda prognozuoja, kad iš šių naujų genų 115 koduoja baltymus.

Nuskaitytas žmogaus genomas.

Kas yra genas?

Phillippy pažymi, kad šie skaičiai nėra užtikrinti. „Geno apibrėžimas tebėra truputį nevienareikšmis“, – teigia jis. Tradiciškai genais buvo laikomos DNR sekcijos, koduojančios baltymą, bet iš tiesų, daug genų baltymų nekoduoja ir atlieka kitas funkcijas. Naujame genome yra 63 494 genai, kai tuo tarpu 2019 metais paskelbtame atnaujiname jų buvo 60 090. Baltymus koduojančių genų padaugėjo nuo 19 890 iki 19 969.

„Tai yra daug, daug geriau, nei ką nors turėjome“, – sako Aida Andrés iš UCL.

Antrajame straipsnyje, Eichlerio komanda sutelkė dėmesį į segmentų dubliavimąsi: ilgas DNR atkarpas, kurios buvo vėl ir vėl nukopijuotos. Kitaip nei „DNR šiukšlės“, kurios dažnai atrodo kaip beprasmiai pakartojimai, dubliuojančiuose segmentuose yra suprantamas funkcijas atliekančių genų ir kitų sekų. Dėl to žmonės gali turėti daug kai kurių genų kopijų.

Segmentų dublikatai sudaro beveik trečdalį naujos sekos ir 7 procentus viso genomo. O dar jų sekose įvairovės daugiau, nei regionuose be dublikatų.

Eichleris mano, kad segmentų duplikacija buvo svarbi žmonių evoliucijai. „Jos yra genomo vieta, kur gali rastis nauji genai“, – tikina jis, nes viena kopija gali keistis kaip tinkama. Žmonėse yra keletas dubliuotų genų, kurie buvo kritiškai svarbūs kuriant didesnes smegenis, skiriančias mus nuo kitų žmogbeždžionių “, pabrėžia jis.

Net jei ir smarkiai nepasikeisdami, šie duplikuoti genai daro didelę įtaką jau vien tuo, kad daugiau kuriama jais koduojamo baltymo, paaiškina Andrés. Segmentų dubliavimasis vis žmonių evoliucijos paaiškinti negali, nes tai labai sudėtingas procesas, „bet jie svarbūs“, pažymi ji.

DNR įjungimas ir išjungimas

Naujasis genomas gerokai palengvins dubliuotų genų tyrimą, nes lyginant su ankstesne versija, dabar daug didesnė tikimybė, kad jame esančios sekos yra teisingos, sako Andrés.

Segmentų duplikatus suprasti yra gyvybiškai svarbu, nes kai kurie iš jų lemia genetinius sutrikimus, sako Eichleris.

Trečiame straipsnyje, komanda, kuriai vadovavo Winstonas Timpas iš Johns Hopkins universiteto Baltimorėje, tyrė metilo grupių cheminius žymenis, kurie prisitvirtina įvairiose DNR vietose. Šie „epigenetiniai“ žymenys lemia genų įjungimą ir išjungimą. Timpo komanda naująjį genomą panaudojo nustatyti naujai ištirtų vietų metilinimą.

Jie išsiaiškino, kad metilinimo lygis aplink centromeras chromosomų viduje yra mažas. Šie regionai gyvybiškai svarbūs reprodukcijai ir ląstelių dalijimuisi.

Juose atsiradę sutrikimai gali kelti pavojų. „Vėžiuose dažnai įgaunama ar prarandama ištisa chromosoma“, – teigia Timpas. Žvelgiant į ilgą perspektyvą, supratimas, kaip dalijasi ląstelės, o taip pat metilinimo supratimas, gali parodyti naujų vėžio gydymo būdų.

Šaltinis: