發布日期:2018-04-10
十分之一的人類基因會表達一種特殊的蛋白——轉錄因子(TFs),通過與基因組結合讀取相應區域DNA 信息。這一結合是調控基因表達與否的關鍵。4月初,《PNAS》期刊最新發表一篇文章,揭示了一種新的計算工具,可以完美量化基因組中這一“蛋白-DNA”的結合。
利用NRLB,逐漸消除低親和結合位點(從左往右),從而逐漸降低基因表達(白色)。(圖片來源:Mann Lab/Columbia's Zuckerman Institute)
越來越多的研究表明,轉錄因子與DNA結合位點的突變與疾病有關。然而現有的測序技術并不能解析這些位點信息。現在,哥倫比亞大學的科學家們開發出一種計算工具,能夠解析基因組中最難翻譯的部分。有了這個工具,科學家們可以更深入地了解DNA指導生長發育、衰老、疾病等所有的生命過程。
“即便是簡單的生物,依然有大量基因信息因為技術的局限而未能被破譯。” 哥倫比亞大學Mortimer B. Zuckerman心理大腦行為研究所的首席研究員Richard Mann表示,“讓我們開心的是,新算法能夠掃描數百萬行的遺傳密碼,甚至于能夠識別出最微弱的信號,從而更完整地繪制DNA編碼的藍圖。”
圖片來源:PNAS(doi.org/10.1073/pnas.1714376115)
1、Hox基因
DNA中隱藏著太多的秘密,其中一個謎團涉及一個特別普遍的基因,即Hox基因——機體主要的“建筑師”,參與生命早期的多個重要發育、分化過程,例如胚胎發育過程中頭部、四肢的定位。
Richard Mann表示:“Hox基因通過表達一種轉錄因子,與DNA序列結合,從而‘打開’或者‘關閉’大量基因。”他認為,這一過程類似于按照正確的順序調控成千上萬個開關。
但是,數十年針對Hox基因的研究揭示了一個悖論:盡管每一個Hox基因都對應著不同的生長特征,但是Hox表達的轉錄因子都傾向于與同一組更容易識別的DNA序列結合。
2015年,Richard Mann和團隊發現,Hox轉錄因子也與其他位點結合——只是在所謂的“低親和位點”更為謹慎。科學家們認為,低親和位點是Hox轉錄因子驅動基因表達與否的關鍵。問題的關鍵在于如何從基因組中破譯這些位點。
2、新研究
為了應對這一挑戰,Richard Mann團隊與哥倫比亞大學生物科學與系統生物學系教授、遺傳學活動模型專家Harmen Bussemaker課題組合作,開發了一種名為SELEX-seq的基因測序方法,用于系統描述Hox所有的結合位點。但是這一方法存在局限性,即需要一次次測序相同的DNA片段。而且,關鍵的低親和結合位點的信息依然是個謎。
“類似于谷歌翻譯一段文字,即便重復多次,最終只有10%的單詞被成功翻譯。” Richard Mann解釋道。
為了克服局限,Harmen Bussemaker團隊研發出一種新型的算法,能夠首次解釋SELEX-seq實驗中所有DNA序列的行為。他們將這一算法稱之為“No Read Left Behind”(NRLB)。
3、意義
“簡單地說,NRLB可以覆蓋所有的結合位點(從高到低),靈敏度和準確度都遠超已有的技術。在這一基礎上,我們希望開發更為深入的生物和計算模型,從而有助于回答基因組更為復雜的問題。” Harmen Bussemaker解釋道。
“例如精神分裂癥、帕金森氏癥和自閉癥等疾病已經被映射到特定的DNA區域,但是這些區域似乎沒有明確的功能。” Richard Mann表示說,“現在,利用NRLB,科學家們可以拼湊出與這些疾病相關區域結合的轉錄因子圖譜,未來我們或許可以找到靶向這些因子的方法,從而有效降低疾病風險。”
參考資料:1)Scientists build better way to decode the genome
來源:生物探索