美國科學家領銜的國際合作團隊在《科學》雜志發表6篇論文,宣告有史以來最完整的一個人類單倍體基因組圖譜繪制完成。
“假如把人類基因組比作一輛結構復雜的汽車,那么,20多年前完成的人類基因組草圖就已經具備了汽車的基本配件和功能,新發現的序列只是讓這輛汽車的配備更完善,功能更強大。沒有它,汽車也能跑;有了它,汽車的性能更好,也更完美了。”中國科學院北京基因組研究所研究員于軍接受科普時報記者專訪時表示,人類第一次完成每個核苷酸水平堪稱完整的人類基因組測序,為了解人類基因組的全部基因和組織元件提供了完整的參照,為科學、全面、徹底認知人類的個體和群體演變的遺傳學本質和規律鋪平了道路。
“人類基因組計劃”:解碼生命奧秘
作為“人類基因組計劃”的親歷者和參與者,于軍表示,人類基因組圖譜的完整呈現,離不開該計劃的支持。“在過去的20多年里,科學家們一直在努力追求完美,幾乎每年都在更新‘人類基因組參照序列’。”
“人類基因組計劃”是繼“曼哈頓計劃”和“阿波羅登月計劃”之后,又一項規模宏大、跨越國界及學科的科學探索工程。其宗旨在于測定組成人類單倍染色體DNA中所包含的30億個由A、T、C、G堿基組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識其載有的基因及其序列,達到破譯人類遺傳信息的最終目的。
1990年,“人類基因組計劃”正式啟動;1999年,我國科學家參與到“人類基因組計劃”,并承擔了1%的測序任務。促成我國科學家參與到該計劃的人正是于軍。
“天書”為何遺漏8%
為了完成“人類基因組計劃”的任務,科學家首先需要將人類23對完整DNA切割成數百萬甚至數千萬個核苷酸序列碎片,并對碎片進行單獨測序,之后再根據碎片之間的重疊部分重新拼接,形成逐漸完整的“重疊群”。但大量重復序列的存在令拼接和解讀變得困難重重,導致少部分間隙區域被遺漏;核酸序列重復度高的地方也很難確定唯一的路徑,有可能造成誤拼,從而留下了8%的“不完整部分”。
2001年,科學家首次發表人類基因組草圖,宣布破譯人類的“生命天書”。不過,由于彼時所測的序列中仍有8%的“不完整部分”,因此這部“天書”尚有遺漏之處。這些遺漏的部分主要存在于染色體結構中間部分的中心粒和末端部分的著絲粒。由于這些地方含有高度重復的DNA序列,成了科學家當時難以完成的“瓷器活”。
“長讀長”技術:DNA測序領域的“金剛鉆”
隨著測序技術的發展,第三代DNA測序“長讀長”技術的出現,成為科學家修補和完成人類基因組序列這個“瓷器活”的好幫手,讓這8%的遺憾,得以成功彌補。
于軍介紹,第三代測序技術的出現,將一代和二代測序技術測量的核苷酸長度(讀長)從百位和千位數一下提升到了萬位數,甚至達到了十萬、百萬個核苷酸序列數的級別,大大突破了重復序列所帶來的技術瓶頸。
此次完成首個最完整人類單倍體基因組圖譜的機構——端粒到端粒聯盟(以下簡稱T2T聯盟)就是采用了二代和三代測序技術的“協同作戰”。三代測序技術屬于單分子技術,其中測定序列長度最高的是牛津納米孔的DNA測序方法,它的最長讀長可以達到100萬個核苷酸。
另一家是太平洋生物科學公司,使用的是二代測序技術,其測序儀的測序長度也達到了數萬水平。這兩種測序方法的優勢在于不僅可以提供連續性測序,而且還能提供更完美的數據精準度。二者的結合,讓完整的人類基因組序列第一次實現了完美地呈現。
“這種技術的進步是劃時代的,就像從蒸汽機發展到內燃機再到信息化、智能化地大踏步前進。”于軍說,這是獲得人類基因組完整序列的技術“后盾”。
中國人基因組測序宜早不宜遲
近年來“長讀長”測序技術的發展,極大地加速了解碼生命的進程,不僅測序時間大為縮短,測序成本也呈數量級降低。
于軍介紹,我國近20年來基本上依賴國外的基因測序設備,但從2015年開始擁有了第一款真正的國產基因測序儀,目前我國自主研發的二代和三代測序儀也在不斷地進入市場。在應用方面,我國也已經做到了與全球領先企業并駕齊驅。
于軍認為,完成某一個人類個體的基因組并不是“人類基因組計劃”的最終目標和結果。目前,T2T聯盟已與人類泛基因組參考聯盟合作,計劃對幾百個個體進行T2T的全基因組測序,以建立來自世界各地,代表不同人群的數百乃至上千個完整的群體參照基因組,建立盡可能完整的代表人類群體多樣性的系列參照基因組。
于軍表示,遺傳保證了生命的延續,而突變產生了不同的物種以及人與人之間的差異。不同族群有著各自獨特的遺傳背景,對不同疾病的易感性也可能不一樣。只有真正了解基因與疾病的關系,才能根據每個個體的基因進行疾病預測和檢測,及早做出預防方案或進行針對性治療。
“中國人的基因組與現有的完整白人基因組序列仍然存在較大差異,希望我國盡快運用和發展三代、四代測序技術,早日測出完整的‘中華民族代表基因組序列’。”于軍說,“國人的基因組系列完成后,科學家們可以通過比對分析個體DNA的堿基序列差異,開展更深入的基因組學和遺傳學研究,為預防疾病、研制新藥以及精準醫療提供個性化、智能化的數據。”
關鍵詞: 美國科學家 國際科學團隊 人類基因組草圖 中國科學院北京基因組研究所