發布日期:2017-10-31
癌癥,猶如黑暗中的魔鬼,帶給人們恐懼與絕望。而肺癌,在我國作為發病率、死亡率最高的一類癌癥,傷害著無數家庭。在我國每年都有近60萬人死于肺癌。然而,癌癥的死亡率與首次發現癌癥的時期緊密相關,早期肺結節篩查可以為無數人免去痛苦與折磨。上海交通大學人工智能實驗室徐奕教授、倪冰冰教授、楊小康教授、朱禹萌同學等人與點內科技合作,利用深度學習搭建的肺結節自動定位篩查系統,能夠有效檢測肺 CT 影像中包含微小結節、磨玻璃等各類結節,并降低假陽性誤診的發生,實現「早發現,早診斷,早治療,早痊愈」的愿望。該算法獲得了天池大數據比賽的第一名,這個比賽吸引了全國兩千多支參賽團隊,總獎池高達百萬,面向全社會各大醫院、高校、公司、研究所參加。
團隊利用計算機視覺領域卷積神經網絡技術來解決肺結節檢測問題,并在多個層面上進行創新。1)結合物體檢測與分割算法提取候選結節,產生高召回率候選結節池。2)使用假陽性衰減網絡,并采取多尺度集成學習的網絡模型提高檢測精度,衰減假陽性比例。3)在數據的處理上,采取生成對抗網絡進行了數據增廣,提高了訓練的有效性。
算法框架如圖
數據預處理
通過旋轉平移等幾何變換針對有限數量的正樣本做數據多樣性增廣,類似于醫生通過不同的視角、不同的上下文去分析結節區域,并利用生成對抗網絡(GAN),從隨機噪聲中產生新的結節正樣本,學習生成新形態的結節樣本,深度增廣數據的多樣性,提升模型泛化能力。
結節預檢測
建立 3D-Unet 網絡結構,該分割網絡主要功能是提取疑似候選結節,最大化敏感度,降低漏檢率。 其網絡輸入三個維度的數據特征,可從多個 Z 軸維度「觀察」,正如醫生結合多個平面觀察結節,從而充分學習肺內部正常紋理和非正常紋理的區別,捕捉到結節多樣性特征,比如毛玻璃結節密度比周圍略高、呈云霧狀性,純實性結節實性密度較高,類似單獨分離的蛋黃等。
結節精檢測
結節精檢測采用三種模型分別預測候選結節概率,并根據模型間權重比例給出最終概率的方法。主要優勢在于,負樣本經歷由易至難的學習過程,分割網絡和后續假陽性衰減網絡相輔相成。多結構類型的模型 Ensemble,且單一網絡性能良好,類似于多個醫生獨立閱片的過程,綜合給出閱片結果。
結果
這一算法在阿里云與英特爾聯合舉辦的天池醫療 AI 大賽中大獲全勝,以 0.732 的成績從兩千多組強勁隊伍中脫穎而出,在比賽最為重要的復賽賽程中排名第一。
根據算法訓練出的模型能夠更好地處理不同形態的結節特征,達到很好的檢測效果,在 400 例小結節測試數據上,FROC 曲線如圖所示:
值得注意的是,該算法診斷 20 萬張肺結節片需要 10 分鐘,遠遠少于醫生人工診斷的時間,在提升準確率的同時,節約了醫生的時間,真正在診斷流程上做好了醫生的助手。團隊也將算法真正投入到上海各大醫院進行試驗與使用,嵌入醫生診斷流程當中,真正造福患者。
來源:機器之心(微信號 almosthuman2014)