發布日期:2018-04-08
基因組相當于機體的"指導手冊",它以DNA的形式儲存了生物體最原始的信息,它決定了生物體的各種性狀以及患病的風險。但由于該"手冊"是由生物語言書寫的,因此進行解碼變得十分有挑戰。如今,來自哥倫比亞大學的研究者們開發出了一種計算機工具,能夠對基因組中最難以解碼的片段進行翻譯。基于這一手段,研究者們能夠更進一步地理解DNA如何指導生物體的發育,衰老以及疾病的發生。
這項研究發表在最近一期的《PNAS》雜志上。
(Mann Lab/Columbia's Zuckerman Institute)
"像果蠅這么簡單的生物,其基因組中也具有1.2億個堿基對,由于工具的限制,其中大部分基因片段的信息還沒有得到解析",該研究的作者,來自哥倫比亞大學的獨立研究員Richard Mann博士說道。"然而,我們開發的算法則能夠對這些遺傳密碼進行逐一解析,從而得到更加完整的DNA密碼圖譜"。
遺傳學家滿長期以來都想發現DNA背后隱藏的秘密,其中一個例子就是一類叫做Hox的基因家族。歷經幾十年的探索,研究者們發現盡管每個單獨的Hox基因對生長特征的影響都是獨立的,但hox轉錄因子結合DNA的序列具有極高的相似性。
2015年,作者等人發現Hox轉錄因子也會與其它DNA位點進行結合,盡管親和程度較低。研究者們認為這些低親和力的位點對于Hox多種調控效應的實現具有關鍵的作用。不過如何鑒定這些基因組位點仍然是不小的挑戰。
為了解決這一問題,作者等人建立了分析遺傳活性的計算機模型。
早在幾年之前,作者等人開發了一種叫做SELEX-seq的基因測序手段,能夠系統性地分析所有Hox結合位點,但該技術也存在缺陷,即需要對重復的DNA片段反復測序。雖然每一輪測序都會得到新的信息,不過低親和力的位點仍然難以被檢測到。
為了解決這一問題,作者等人開發了更為復雜的計算機算法,能夠首次對SELEX-seq實驗中所有序列的表現進行分析,該算法名為BRLB。
作者認為該算法能夠幫助科學家們拼接轉錄因子結合以及激活的DNA序列,這對于尋找降低患病風險的遺傳療法十分重要。
資訊出處:Scientists build better way to decode the genome
原始出處:Chaitanya Rastogi et al, Accurate and sensitive quantification of protein-DNA binding affinity, Proceedings of the National Academy of Sciences (2018). DOI: 10.1073/pnas.1714376115
來源:生物谷