(資料圖片)
研究人員發布了一個新的高質量參考人類基因組序列集合,從不同人群中捕獲了比以前更多的多樣性。這項工作由國際人類泛基因組參考聯盟領導,該聯盟由美國國立衛生研究院下屬的國家人類基因組研究所 (NHGRI) 資助。
新的“泛基因組”參考包括47 人的基因組序列,研究人員的目標是到 2024 年年中將這一數字增加到 350 人。由于每個人都攜帶一對染色體,目前的參考文獻實際上包括 94 個不同的基因組序列,目標是在項目完成時達到 700 個不同的基因組序列。
這項工作發表在《自然生物技術》雜志上,是聯盟成員發表的幾篇論文之一。
基因組是幫助每個生物發育和發揮功能的 DNA 指令集。個體間的基因組序列略有不同。就人類而言,任何兩個人的基因組平均超過 99% 是相同的。這些微小的差異造就了每個人的獨特性,并可以提供有關他們健康的見解,有助于診斷疾病、預測結果和指導醫療。
為了解這些基因組差異,科學家們創建了參考人類基因組序列以用作“標準”——人類基因組序列的數字合并,可用作比對、組裝和研究其他人類基因組序列的比較。
原始參考人類基因組序列已有近 20 年歷史,并且隨著技術進步和研究人員修復錯誤并發現人類基因組的更多區域而定期更新。然而,它從根本上限制了它對人類物種多樣性的表示,因為它僅包含大約 20 個人的基因組,而且大部分參考序列僅來自一個人。
“每個人都有一個獨特的基因組,因此對每個人使用單一參考基因組序列會導致基因組分析的不公平,”NHGRI 校內研究計劃計算和統計基因組學分部的高級研究員 Adam Phillippy 博士說,主要研究的共同作者。“例如,對于基因組與參考基因組差異更大的人來說,預測遺傳病可能效果不佳。”
當前的參考人類基因組序列存在反映缺失信息的缺口,尤其是在重復且難以閱讀的區域。最近的技術進步,例如一次讀取更長 DNA 的長讀長 DNA 測序,幫助研究人員填補了這些空白,從而創建了第一個完整的人類基因組序列。這個完整的人類基因組序列于去年作為 NIH 資助的端粒到端粒 (T2T) 聯盟的一部分發布,并被納入當前的泛基因組參考。事實上,許多 T2T 研究人員也是人類泛基因組參考聯盟的成員。
關鍵詞: