首個(gè)完整無(wú)間隙人類基因組序列公布
科技日?qǐng)?bào)北京4月1日電 (實(shí)習(xí)記者張佳欣)被譽(yù)為生命科學(xué)“登月計(jì)劃”的人類基因組測(cè)序再次取得重大進(jìn)展:國(guó)際科學(xué)團(tuán)隊(duì)端粒到端粒聯(lián)盟(T2T)發(fā)表了第一個(gè)完整的、無(wú)間隙的人類基因組序列,首次揭示了高度相同的節(jié)段重復(fù)基因組區(qū)域及其在人類基因組中的變異。這是對(duì)標(biāo)準(zhǔn)人類參考基因組,即2013年發(fā)布的參考基因組序列(GRCh38)的“重大升級(jí)”。當(dāng)?shù)貢r(shí)間31日,《科學(xué)》雜志連發(fā)6篇論文報(bào)告這一成就。
2001年2月12日,由6國(guó)科學(xué)家共同參與的國(guó)際人類基因組計(jì)劃首次公布人類基因組圖譜及初步分析結(jié)果;2003年4月15日,公布了人類基因組序列草圖。然而由于技術(shù)限制,當(dāng)初的人類基因組計(jì)劃留下了大約8%的“空白”間隙。這部分很難被測(cè)序,由高度重復(fù)、復(fù)雜的DNA塊組成,其中包含功能基因以及位于染色體中間和末端的著絲粒和端粒。
新的無(wú)間隙版本被稱為T(mén)2T-CHM13,由30.55億個(gè)堿基對(duì)和19969個(gè)蛋白質(zhì)編碼基因組成。增加了近2億個(gè)堿基對(duì)的新DNA序列,包括99個(gè)可能編碼蛋白質(zhì)的基因和其中近2000個(gè)需要進(jìn)一步研究的候選基因。這些候選基因大多數(shù)是失活的,但其中115個(gè)仍然可能表達(dá)。團(tuán)隊(duì)還在人類基因組中發(fā)現(xiàn)了大約200萬(wàn)個(gè)額外的變異,其中622個(gè)出現(xiàn)在與醫(yī)學(xué)相關(guān)的基因中。此外,新序列還糾正了GRCh38中的數(shù)千個(gè)結(jié)構(gòu)錯(cuò)誤。
具體而言,新序列填補(bǔ)的空白包括人類5條染色體的整個(gè)短臂,并覆蓋了基因組中一些最復(fù)雜的區(qū)域。其中包括在重要的染色體結(jié)構(gòu)中及其周圍發(fā)現(xiàn)的高度重復(fù)的DNA序列,如染色體末端的端粒和在細(xì)胞分裂過(guò)程中協(xié)調(diào)復(fù)制染色體分離的著絲粒。新序列還揭示了以前未被發(fā)現(xiàn)的節(jié)段重復(fù),即在基因組中復(fù)制的長(zhǎng)DNA片段,已知其在進(jìn)化和疾病中發(fā)揮重要作用。
新序列還在識(shí)別和解釋遺傳變異方面具有重要改進(jìn),并揭示了關(guān)于著絲粒周圍區(qū)域的前所未見(jiàn)的細(xì)節(jié)。這一區(qū)域內(nèi)的變異性可能為人類祖先如何進(jìn)化提供新證據(jù)。
研究人員稱,這一完整的、無(wú)間隙的序列對(duì)于了解人類基因組變異的全譜和了解某些疾病的遺傳貢獻(xiàn)至關(guān)重要。
研究人員表示,下一階段的研究將對(duì)不同人的基因組進(jìn)行測(cè)序,以充分掌握人類基因的多樣性、作用以及我們與近親、其它靈長(zhǎng)類動(dòng)物的關(guān)系。
【總編輯圈點(diǎn)】
基因組的某些區(qū)域,其實(shí)是一遍又一遍的重復(fù),這些重復(fù)區(qū)域包括細(xì)胞分裂中一些極其關(guān)鍵的部分,也包括可能幫助物種適應(yīng)的新基因。在過(guò)去,所有這些重復(fù)使得科學(xué)家無(wú)法以正確的順序“組裝碎片”——就像高難度的、幾乎每一塊都相同的拼圖,而人們不知道其中哪一塊該放在哪,就在基因組圖譜上留下了巨大空白,F(xiàn)在的最新成果不再有任何隱藏或未知的部分,或者也可以說(shuō),一個(gè)全新的基因?qū)殠?kù)正在全人類面前徐徐打開(kāi)。
(責(zé)任編輯:歐云海)