發布日期:2019-02-14
英國劍橋大學研究人員設計出一種新的機器學習算法來尋找藥物,其效率已被證明是目前行業標準的兩倍,有助新藥開發提速。研究成果發表在近期出版的美國《國家科學院院刊》上。
藥物發現的關鍵點是預測分子是否會激活一個特定的生理過程。可以通過搜索激活生理過程的分子之間共享的化學模式來建立統計模型,但是目前構建這些模型的數據十分有限,因為實驗成本高且不清楚哪些化學模式具有統計學意義。“機器學習在數據量豐富的計算機視覺等領域已經取得了重大進展。”項目主要負責人、劍橋大學卡文迪許實驗室的阿法·李博士說,將其運用到藥物發現領域,就是為了解決數據量相對有限的問題。
被稱為隨機矩陣理論的數學原理,給出了關于隨機和噪聲數據集統計特性的假定,用這一原理可以將活性和非活性分子化學特征的統計數據進行比較,以確定哪些化學模式對于結合而言是真正重要的,哪些只是偶然的。
根據這一設想,研究團隊與輝瑞制藥公司合作開發出一種算法,即利用數學運算,將與藥理學相關的化學模式從不相關的化學模式中分離開來。重要的是,該算法不僅研究已知具有活性的分子,而且也不放過那些無活性的分子,并且學會識別分子的哪些部分對于藥物作用是重要的,而哪些部分是不重要的,使得那些失敗的實驗(數據)也可以得到有效的利用。
研究人員用222個活性分子開始建模,已能夠從計算角度對其他600萬個分子進行篩選。由此,研究人員從中篩選出100種最相關的分子,再從這些分子中找到了4種可以激活可能與阿爾茨海默病和精神分裂癥有關的CHRM1受體的新分子。
“從600萬個分子中篩選出4種活性分子,就像在大海撈針一樣,”李博士說,“詳細比較顯示,新算法效率是行業標準的兩倍。”目前研究人員正在完善該算法,預測合成復雜有機分子的方法,以及將機器學習方法擴展到新材料設計領域。(記者田學科)
來源:科技日報