
《科學(xué)》封面:迄今最完整的人類基因組測序結(jié)果公布
(神秘的地球uux.cn報道)據(jù)藥明康德:人類的基因組常被比作是一本書寫生命的“天書”,只有A、封面T、迄今青島市北小姐(上門年輕的小姐)小姐vx《134-8006-5952》提供外圍女上門服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)C、最完整的組測G四種“字母”——代表構(gòu)成DNA的人類四種堿基,但字?jǐn)?shù)多達(dá)60億個,基因分布在23對染色體中,序結(jié)無窮的科學(xué)組合蘊含著人類進(jìn)化、生老病死的封面無數(shù)奧秘。
21世紀(jì)之初,迄今人類基因組序列的最完整的組測第一版草圖問世,盡管并不完整,人類卻已經(jīng)在生物醫(yī)學(xué)領(lǐng)域產(chǎn)生了深遠(yuǎn)的基因影響,為臨床研究、序結(jié)藥物開發(fā)和醫(yī)療實踐的科學(xué)發(fā)展提供指引。
時隔二十一年,人類基因組測序領(lǐng)域迎來了新的里程碑:一份更完整的、無間隙的人類參考基因組。
本周,《科學(xué)》雜志同時上線的青島市北小姐(上門年輕的小姐)小姐vx《134-8006-5952》提供外圍女上門服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)6篇論文中,一個名為“端粒到端?!甭?lián)盟(T2T)的國際科研團(tuán)隊宣布完成了最新的人類參考基因組(被命名為T2T-CHM13),包括所有22條常染色體和X染色體的無縫組裝。其序列包含30.55億對堿基,不僅在過去的基礎(chǔ)上增加了近 2億堿基的遺傳信息——相當(dāng)于一條人類染色體包含的信息,還糾正了過往基因組序列上的許多錯誤,并解鎖了人類基因組中結(jié)構(gòu)最為復(fù)雜的一些區(qū)域。
填補最后8%的空白
由于當(dāng)時的測序技術(shù)所限,第一版人類基因組測序草圖中留有許多空白。2013年完成的新版本并經(jīng)過2019年的更新后,人類基因組測序結(jié)果中仍有數(shù)百萬個堿基由字母“N”表示,代表著該位置的實際堿基未知。更重要的是,占人類基因組大約8%的生物學(xué)重要區(qū)域處于未探明的狀態(tài)。
為了填補最后的空白,來自幾十個研究機(jī)構(gòu)的近100名科學(xué)家組成了大型團(tuán)隊“T2T聯(lián)盟”,也就是對每條染色體從一端的端粒到另一端的端粒進(jìn)行測序。隨著此次研究成果的集中發(fā)表,用團(tuán)隊領(lǐng)導(dǎo)人之一、華盛頓大學(xué)Evan Eichler教授的話說,我們在生命天書中“讀到了以前從未讀過的章節(jié)”。
讀取基因組時,科學(xué)家首先將所有DNA切成數(shù)百到數(shù)千個字母長的片段,由測序機(jī)器讀取每個片段中的字母,然后科學(xué)家們試圖以正確的順序組裝片段,就像玩一個超級復(fù)雜的拼圖。
這個過程中的一大挑戰(zhàn)是,基因組中的某些區(qū)域由大段重復(fù)字母組成,就像拼圖中有些板塊由看起來一樣的碎片組成,而這些區(qū)域往往具有重要的生物學(xué)特征,某些情況下還與人類疾病有關(guān)。另一個難點是,絕大多數(shù)細(xì)胞內(nèi)包含兩套基因組,分別來自父親和母親。當(dāng)研究人員試圖組裝DNA片段時,兩套基因組的序列混合在一起,就掩蓋了兩者本身具有的差異。
研究團(tuán)隊找到了一種只含單個基因組的細(xì)胞系來消除上述等位基因多樣性的問題。這種特殊的細(xì)胞系來自所謂的葡萄胎,是一種異常胚胎,受精后僅保留一個親本的基因組副本。
攻克難關(guān)的關(guān)鍵進(jìn)展還離不開測序技術(shù)的重大飛躍?;诰哂懈锩酝黄频拈L讀長測序技術(shù),研究者可以解碼更長的序列,甚至一次準(zhǔn)確讀取多達(dá)百萬級的堿基對也不成問題。
解鎖最復(fù)雜的區(qū)域
此次解鎖的新序列大約90%來自染色體的著絲粒。在形成精子或卵子的減數(shù)分裂過程中,著絲粒是成對染色體分離時附著的地方。這個區(qū)域結(jié)構(gòu)獨特,包含長段重復(fù)序列,而且DNA和蛋白質(zhì)似乎在這一區(qū)域纏繞得格外緊湊。
在T2T提供完整序列后,人類第一次有機(jī)會對著絲粒及其周圍序列的作用一探究竟。
根據(jù)他們的分析,著絲粒以及附近區(qū)域有各種序列堆疊現(xiàn)象,通常是一段新序列覆蓋在舊序列上。這一過程可以保證著絲粒與關(guān)鍵的動粒結(jié)構(gòu)緊緊結(jié)合。動粒是著絲粒兩側(cè)的特化結(jié)構(gòu),參與染色體的移動過程。
舊序列會存在一些隨機(jī)突變和缺失,說明這一段區(qū)域已經(jīng)被棄用;新序列中突變和甲基化都更少,說明正在被使用。而著絲粒中含有大量重復(fù)長度的DNA序列,大約為171個堿基,這些重復(fù)單元會共同形成更大的重復(fù)結(jié)構(gòu)并串聯(lián)多次,構(gòu)成了著絲粒中的重復(fù)序列區(qū)域。
著絲粒的重復(fù)序列在不同人之間同樣會存在差異。其中一篇論文比較了全世界1600人的著絲粒序列后發(fā)現(xiàn),非洲大陸以外的人,著絲粒(尤其是X染色體上的著絲粒)傾向于分成兩大簇,還有一些有意思的突變會出現(xiàn)在有非洲人血統(tǒng)的人身上。未來,科學(xué)家或許能通過解析著絲粒序列來追溯人類的譜系,對人類的演化史探索有重要意義。
最后得到完整測序的區(qū)域
在此次發(fā)表的一系列成果中,研究人員著重分析了基因組中的重復(fù)片段在人類演化、遺傳多樣性的形成以及疾病中的重要作用。
重復(fù)片段(segmental duplication)是基因組中反復(fù)出現(xiàn)的、序列相似性超過90%以上的大段序列。無論是物種內(nèi)還是物種之間的演化過程中,大多數(shù)的遺傳變異都出現(xiàn)在重復(fù)片段區(qū)域,這里是產(chǎn)生新基因和新基因功能發(fā)生適應(yīng)性變化的關(guān)鍵。但由于結(jié)構(gòu)的復(fù)雜性,這里也是人類基因組中最后得到完整測序的區(qū)域。
現(xiàn)在,基于最新的完整人類基因組測序結(jié)果,科學(xué)家終于能夠以更綜合的視角審視人類的重復(fù)片段。在這類區(qū)域,科學(xué)家找到了182個全新的蛋白質(zhì)編碼基因,并且?guī)椭覀兝斫庖幌盗兄匾难莼c醫(yī)學(xué)難題。
例如,比較人類與其他靈長類動物的測序結(jié)果,研究發(fā)現(xiàn)了與人類前額葉皮層擴(kuò)張相關(guān)的基因TBC1D3,這將有助于重現(xiàn)古人類演化的歷史。而在不同人類個體間,在重復(fù)片段區(qū)域編碼脂蛋白的LPA基因,其數(shù)量與心血管疾病風(fēng)險高度相關(guān)……
基于這項研究,我們能夠全面理解重復(fù)片段的組織、表達(dá)與調(diào)控,并提升基因注釋與基因分型。
在另一項研究中,康涅狄格大學(xué)Rachel O‘Neill教授領(lǐng)導(dǎo)的團(tuán)隊揭示了重復(fù)序列的轉(zhuǎn)錄與表觀遺傳狀態(tài)。重復(fù)序列包含移動遺傳元件,它們可以移動至基因組的其他區(qū)域。研究指出,一些多次重復(fù)的片段所包含的基因,能在很大程度上解釋人類的遺傳多樣性。
除了從基因組的角度揭示特定重復(fù)序列對人類的影響,這項研究還從局部(例如著絲粒中)分析了重復(fù)序列的轉(zhuǎn)錄圖景、描繪了甲基化的情形。這些結(jié)果將幫助我們理解轉(zhuǎn)錄在基因組穩(wěn)定性以及染色體分離機(jī)制中的作用。
O‘Neill教授表示,接下來他們計劃對更多不同人群進(jìn)行基因組測序,從而更全面地理解人類多樣性、疾病機(jī)制,以及我們與其他靈長類近親的關(guān)系。
新的起點
“生成真正完整的人類基因組序列代表了一項令人難以置信的科學(xué)成就,為我們的DNA藍(lán)圖提供了第一份全面視圖,”美國國家基因組研究所主任Eric Green博士評論說。
《科學(xué)》雜志的專題則這樣總結(jié):最新的人類參考基因組代表著“重要的一步,表明可以組裝代表所有人類的模型,這將更好地支持個體化醫(yī)療、人口基因組分析和基因組編輯?!保ㄔ瓨?biāo)題:新的里程碑!新的里程碑!《科學(xué)》封面重磅:迄今最完整的人類基因組測序結(jié)果公布)
相關(guān)報道:首個完整無間隙人類基因組序列公布
(神秘的地球uux.cn報道)據(jù)科技日報(實習(xí)記者 張佳欣):被譽為生命科學(xué)“登月計劃”的人類基因組測序再次取得重大進(jìn)展:國際科學(xué)團(tuán)隊端粒到端粒聯(lián)盟(T2T)發(fā)表了第一個完整的、無間隙的人類基因組序列,首次揭示了高度相同的節(jié)段重復(fù)基因組區(qū)域及其在人類基因組中的變異。這是對標(biāo)準(zhǔn)人類參考基因組,即2013年發(fā)布的參考基因組序列(GRCh38)的“重大升級”。當(dāng)?shù)貢r間31日,《科學(xué)》雜志連發(fā)6篇論文報告這一成就。
2001年2月12日,由6國科學(xué)家共同參與的國際人類基因組計劃首次公布人類基因組圖譜及初步分析結(jié)果;2003年4月15日,公布了人類基因組序列草圖。然而由于技術(shù)限制,當(dāng)初的人類基因組計劃留下了大約8%的“空白”間隙。這部分很難被測序,由高度重復(fù)、復(fù)雜的DNA塊組成,其中包含功能基因以及位于染色體中間和末端的著絲粒和端粒。
新的無間隙版本被稱為T2T-CHM13,由30.55億個堿基對和19969個蛋白質(zhì)編碼基因組成。增加了近2億個堿基對的新DNA序列,包括99個可能編碼蛋白質(zhì)的基因和其中近2000個需要進(jìn)一步研究的候選基因。這些候選基因大多數(shù)是失活的,但其中115個仍然可能表達(dá)。團(tuán)隊還在人類基因組中發(fā)現(xiàn)了大約200萬個額外的變異,其中622個出現(xiàn)在與醫(yī)學(xué)相關(guān)的基因中。此外,新序列還糾正了GRCh38中的數(shù)千個結(jié)構(gòu)錯誤。
具體而言,新序列填補的空白包括人類5條染色體的整個短臂,并覆蓋了基因組中一些最復(fù)雜的區(qū)域。其中包括在重要的染色體結(jié)構(gòu)中及其周圍發(fā)現(xiàn)的高度重復(fù)的DNA序列,如染色體末端的端粒和在細(xì)胞分裂過程中協(xié)調(diào)復(fù)制染色體分離的著絲粒。新序列還揭示了以前未被發(fā)現(xiàn)的節(jié)段重復(fù),即在基因組中復(fù)制的長DNA片段,已知其在進(jìn)化和疾病中發(fā)揮重要作用。
新序列還在識別和解釋遺傳變異方面具有重要改進(jìn),并揭示了關(guān)于著絲粒周圍區(qū)域的前所未見的細(xì)節(jié)。這一區(qū)域內(nèi)的變異性可能為人類祖先如何進(jìn)化提供新證據(jù)。
研究人員稱,這一完整的、無間隙的序列對于了解人類基因組變異的全譜和了解某些疾病的遺傳貢獻(xiàn)至關(guān)重要。
研究人員表示,下一階段的研究將對不同人的基因組進(jìn)行測序,以充分掌握人類基因的多樣性、作用以及我們與近親、其它靈長類動物的關(guān)系。 頂: 57493踩: 9663





