科技日報北京4月2日電(記者劉園園)記者2日從西湖大學獲悉,該校楊劍教授研究團隊與合作者開發(fā)出基于泛基因組的聯(lián)合組裝(PIGA)新方法,成功構建了目前全球規(guī)模最大的人類泛基因組,并發(fā)現人類基因組中約13%的未知序列,為遺傳疾病診斷與精準醫(yī)療提供了關鍵支撐。相關成果1日發(fā)表于國際學術期刊《自然》。
人類基因組被譽為生命地圖,自2003年人類基因組計劃完成后,科學研究長期使用單一參考基因組作為研究標準。但是,這一“標準地圖”存在大量盲區(qū),難以適配個體間遺傳差異。而傳統(tǒng)泛基因組研究受限于高昂的三代測序成本,樣本量多在幾十至百人,難以全面反映人類遺傳多樣性。
為破解這一困境,楊劍團隊提出采用高性價比的二代與三代混合測序策略,創(chuàng)新性地開發(fā)出一套基于泛基因組的聯(lián)合組裝方法。其中,二代測序技術保障序列準確性,三代測序技術搭建基因組骨架,該方法在提升測序質量的同時,還顯著降低了測序成本。依托該方法,團隊成功構建包含1116個二倍體基因組的泛基因組,錯誤率僅五萬分之一,實現了大規(guī)模人群高質量基因組組裝。
“大樣本量泛基因組可以極大地賦能罕見病診斷,尤其是針對那些之前未知的復雜變異。”楊劍解釋道,只有樣本量足夠大,才能準確估計某個復雜變異在人群中的頻率。
研究顯示,傳統(tǒng)參考的人類基因組遺漏了超過4億堿基對的未知序列,相當于人類基因組總規(guī)模的13%。研究團隊在新發(fā)現序列中識別出2620萬堿基對的功能基因與調控元件,這些元件可指導蛋白質合成并調控基因表達。同時,他們繪制出迄今最詳盡的人類遺傳變異圖譜,涵蓋3540萬個小變異,還破譯了大量難以檢測的結構變異、串聯(lián)重復序列、嵌套變異等復雜變異。此外,研究團隊成功定位了3256個調控基因表達的關鍵復雜變異,為疾病遺傳診斷提供重要依據。
“這項研究極大地深化了我們對復雜遺傳變異及其功能的認知,彰顯了基于大規(guī);蚪M組裝的分析方法在填補傳統(tǒng)測序研究空白方面的巨大潛力,為人類健康研究和其他物種泛基因組研究提供了新范式!睏顒φf。
|