機(jī)器學(xué)習(xí)模型助力探尋新冠病毒新變種
新華社北京5月29日電 《參考消息》29日登載阿根廷布宜諾斯艾利斯經(jīng)濟(jì)新聞網(wǎng)報(bào)道。報(bào)道摘要如下:
麻省理工學(xué)院-哈佛大學(xué)布羅德研究所以及美國(guó)馬薩諸塞大學(xué)醫(yī)學(xué)院的科學(xué)家開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)模型,可以分析來(lái)自新冠病毒樣本的數(shù)百萬(wàn)個(gè)基因組,并預(yù)測(cè)哪些病毒變體將占主導(dǎo)地位并可能引發(fā)新的浪潮。該模型被稱(chēng)為PyR0,可以幫助研究人員確定病毒基因組的哪些部分最不可能發(fā)生突變,從而為可對(duì)抗未來(lái)變體的疫苗提供目標(biāo)。研究結(jié)果日前發(fā)表在美國(guó)《科學(xué)》周刊上。
研究人員使用截至2022年1月在流感數(shù)據(jù)共享全球倡議數(shù)據(jù)庫(kù)中的600萬(wàn)個(gè)新冠病毒基因組訓(xùn)練了機(jī)器學(xué)習(xí)模型。
自新冠大流行開(kāi)始以來(lái),世界各地的研究人員一直致力于預(yù)測(cè)新冠病毒不同變體的適應(yīng)性。但以前的模型無(wú)法同時(shí)比較所有變體,或者僅處理幾千個(gè)基因組就需要數(shù)天時(shí)間。
相反,PyR0可以在大約1小時(shí)內(nèi)分析數(shù)百萬(wàn)個(gè)基因組——所有公開(kāi)可用的新冠病毒數(shù)據(jù)。它將相似的序列組合在一起,并通過(guò)它們共享的突變?nèi)簛?lái)定義基因組的“組別”。通過(guò)聚焦可能出現(xiàn)在多個(gè)變體中的突變,PyR0比僅關(guān)注病毒變體的模型具有更強(qiáng)大的統(tǒng)計(jì)能力。
隨后,該模型可以確定哪些突變將越來(lái)越普遍,并估計(jì)每種突變導(dǎo)致病毒傳播的速度。它還可根據(jù)其基因組成估計(jì)不同變體的病例數(shù)量增加的速度。
通過(guò)確定哪些突變對(duì)哪些變體的適應(yīng)性很重要,該模型還提供了關(guān)于新冠病毒如何傳播和發(fā)展的生物學(xué)觀點(diǎn)。例如,了解關(guān)鍵突變可以幫助科學(xué)家預(yù)測(cè)新變體是否更具傳染性或更能逃避中和抗體,還可以幫助他們決定要更詳細(xì)地研究哪些突變。
(責(zé)任編輯:歐云海)