作者:唐鳳發(fā)布日期:2019-01-21
去年8月的一天,美國特拉華州威爾明頓市內(nèi)穆爾/阿爾法雷德愛杜邦兒童醫(yī)院醫(yī)學(xué)遺傳學(xué)家Karen Gripp接待了一位年僅4歲的患者。
這個小女孩雖比同齡孩子稍矮,且已經(jīng)失去了大部分乳牙和幾顆已經(jīng)長出來的成年牙齒,但并沒有其他明顯的罕見病指征。
Gripp曾閱讀過描述Wiedemann-Steiner綜合征患兒牙齒過早生長的病例報告。該疾病是由KMT2A基因突變引起的一種極為罕見的疾病。但Gripp并不確定。
于是,Gripp將這個女孩的照片上傳到一個智能手機應(yīng)用中,Wiedemann-Steiner綜合征出現(xiàn)在該軟件的提示中。
Gripp后來通過有針對性的DNA測試確定了女孩的病情。Gripp表示,人工智能方法幫助她縮小了疾病的潛在范圍,并節(jié)省了昂貴的多基因面板測試的成本。
近日,研究人員在《自然—醫(yī)學(xué)》上撰文描述了這種診斷輔助手段(一個叫做Face2Gene智能手機應(yīng)用)的技術(shù)特點。
它依靠機器學(xué)習算法和類腦神經(jīng)網(wǎng)絡(luò)對先天性和神經(jīng)發(fā)育障礙患者照片中的面部特征進行分類。利用從圖片中推斷出的“經(jīng)驗”,對可能的診斷進行定位,并提供可能的選項列表。
該研究負責人、馬薩諸塞州波士頓數(shù)字健康公司FDNA首席技術(shù)官Yaron Gurovich告訴《中國科學(xué)報》,以標準化方式描述顯型能力的增強,為未來的研究和應(yīng)用,以及識別新的遺傳綜合征打開了大門。“它展示了如何將先進的算法,比如深度學(xué)習,應(yīng)用到一個具有挑戰(zhàn)性的領(lǐng)域。”
看“臉”識病
目前,人工智能蓬勃發(fā)展,甚至能“達到或超越人類表現(xiàn)”。在醫(yī)療健康領(lǐng)域,人工智能開始成為醫(yī)生的“小助手”。
例如,各種遺傳綜合征會表現(xiàn)出獨特的面部特征,然而,綜合征數(shù)量巨大,要正確識別并非易事。利用人工智能或能幫助診斷遺傳綜合征。
但是早期此類人工智能研究采用的訓(xùn)練數(shù)據(jù)集規(guī)模不大,僅能識別少量綜合征。而Face2Gene正是人工智能輔助診斷的再進一步。
FDNA研究人員首先訓(xùn)練了人工智能系統(tǒng),以區(qū)分狄蘭吉氏癥候群和天使人綜合征(這是兩種面部特征截然不同的病癥)與其他類似病癥。他們還教會該模型對努南綜合征的不同基因形式進行分類。
他們在算法中輸入了涵蓋216種不同綜合征的17000多張確診病例的圖像。所有患者被確診的遺傳綜合征總計達幾百種。
研究人員利用兩個獨立的測試數(shù)據(jù)集測試人工智能的表現(xiàn),每一個數(shù)據(jù)集都包含數(shù)百張之前經(jīng)過臨床專家分析的患者面部圖像。對于每一張測試圖像,F(xiàn)ace2Gene按照一定順序列出各種潛在的綜合征。
在兩組測試中,在約90%的情況下,F(xiàn)ace2Gene提出的前10條建議中都包括了正確的綜合征。當看到面孔新圖像時,該應(yīng)用程序的最佳診斷率約為65%。
“這是人們期待已久的醫(yī)學(xué)遺傳學(xué)領(lǐng)域突破。”Gripp說,“通過這項研究,我們已經(jīng)證明,在臨床工作中添加自動面部分析框架,如DeepGestalt,可以幫助實現(xiàn)更早地診斷和治療,并改善生活質(zhì)量。”
此外,澳大利亞和巴西聯(lián)合研究團隊于近日基于人工智能技術(shù)開發(fā)出一種圖像處理算法,通過分析眼底相機拍攝的視網(wǎng)膜圖像,可以瞬時自動識別出糖尿病視網(wǎng)膜病變的關(guān)鍵特征,即眼球內(nèi)由于視網(wǎng)膜毛細血管破裂而滲漏出來的液體,準確率達98%。
“打敗”專家
FDNA希望不斷改善Face2Gene,以幫助其他公司在DNA分析過程中篩選、優(yōu)先排序和解釋未知基因變異等。但是為了訓(xùn)練它,F(xiàn)DNA需要大量數(shù)據(jù)。
Face2Gene目前對醫(yī)療專業(yè)人士是免費的。而且,許多醫(yī)生已經(jīng)開始將該系統(tǒng)作為診斷罕見遺傳病的第二選擇。它還可以為醫(yī)生不知道如何判斷病人癥狀的情況提供一個起點。“這就像谷歌搜索。”Gripp說。
隨著越來越多的醫(yī)療保健專業(yè)人員將患者照片上傳到應(yīng)用程序,該應(yīng)用的準確性略有提高。現(xiàn)在它的數(shù)據(jù)庫中有大約150000張圖像。
去年8月,F(xiàn)ace2Gene和臨床醫(yī)生在出生缺陷研討會上進行了一次非官方的“較量”。結(jié)果顯示,該應(yīng)用的表現(xiàn)優(yōu)于人類。
南卡羅萊納州格林伍德遺傳中心遺傳學(xué)家Charles Schwartz分發(fā)了10名兒童的面部照片,這些照片具有“相當可識別的”綜合征特征,并要求與會者提出正確的診斷。
在49名參與研究的臨床遺傳學(xué)家中,只有一半人對兩個病例選擇正確。Face2Gene在其中7張圖片上做出了正確的選擇。
“我們慘遭失敗,F(xiàn)ace2Gene完勝。”馬里蘭州貝塞斯達美國國家人類基因組研究所的臨床遺傳學(xué)家Paul Kruszka說,“我認為每個兒科醫(yī)生和遺傳學(xué)家很快都會有這樣的應(yīng)用程序,并將像用聽診器一樣使用它。”
“目前的挑戰(zhàn)仍在于數(shù)據(jù),如果有更多且更多樣化的數(shù)據(jù),我們就能夠提供更好的結(jié)果。”Gurovich說。
存在風險
但是,該算法的好壞取決于它的訓(xùn)練數(shù)據(jù)集,而且存在風險,尤其是在那些只影響全球少數(shù)人的罕見疾病開始受到關(guān)注的情況下,該公司和研究人員將對數(shù)據(jù)集進行存儲和商品化。
醫(yī)生可以把這項技術(shù)當作一種輔助手段,盡管它并不能提供明確的診斷。但研究人員表示,這也引發(fā)了一些倫理和法律方面的擔憂,例如培訓(xùn)數(shù)據(jù)集的種族偏見和數(shù)據(jù)庫的商業(yè)碎片化。這兩種情況都可能限制診斷工具的使用。
英國牛津大學(xué)計算生物學(xué)家Christoffer Nellaker表示:“這威脅到了這項技術(shù)的主要潛在好處。”Nellaker一直在推動該領(lǐng)域的數(shù)據(jù)共享。
一直以來,在訓(xùn)練數(shù)據(jù)集中的種族偏見都是一個問題。
2017年對智障兒童進行的一項研究發(fā)現(xiàn),在比利時白人兒童中,F(xiàn)ace2Gene對唐氏綜合征的識別率為80%,而在剛果黑人兒童中這一比例僅為37%。
然而,隨著訓(xùn)練數(shù)據(jù)集多樣化,該算法對非洲面部識別的準確性得到改善,表明更公平地代表不同人群是可以實現(xiàn)的。
“正因為如此,我們成功地開發(fā)和培訓(xùn)了一種可以被認為是種族平等的人工智能解決方案。我們計劃繼續(xù)擴大和開發(fā)人工智能解決方案,幫助減少醫(yī)療保健領(lǐng)域的種族差異。”Gurovich告訴《中國科學(xué)報》,“隨著我們向前發(fā)展,技術(shù)偏見會越來越少。”
來源:中國科學(xué)報