為促進醫學研究、保護數據隱私以及改善患者腦腫瘤識別結果,NVIDIA 攜手倫敦國王學院(King’s College London)于近日推出了首個用于醫學影像分析且具有隱私保護能力的聯邦學習系統( federated learning system),標志著在醫療健康 AI 領域實現了突破性進展。
該技術論文在 MICCAI 大會召開期間發布——該會議于 10 月 14 日在中國深圳拉開帷幕,是全球最高端的醫學影像會議之一。
NVIDIA 與倫敦國王學院研究人員介紹了該技術的實施細節。
聯邦學習(federated learning)是一種能夠讓開發者與各企業機構利用分散在多個位置的訓練數據對中心深度神經網絡(DNN)進行訓練的學習范式,該方法可以支持各企業機構針對共享模型開展協作,而無需共享任何臨床數據。
研究人員在論文中闡述道:“聯邦學習在無需共享患者數據的情況下,即可實現協作與分散化的神經網絡訓練。各節點負責訓練其自身的本地模型,并定期提交給參數服務器。該服務器不斷累積并聚合各自的貢獻,進而創建一個全局模型,分享給所有節點。”
研究人員解釋道,雖然聯邦學習可以保證極高的隱私安全性,但通過模型反演,仍可以設法使數據重現。為了幫助提高聯盟學習的安全性,研究人員研究試驗了使用ε- 差分隱私框架的可行性。該框架是一種正式定義隱私損失的方法,該方法可以借助其強大的隱私保障性來保護患者與機構數據。
上述突破性試驗是基于取自 BraTS 2018 數據集的腦腫瘤分割數據實施的。BraTS 2018 數據集包含有 285 位腦腫瘤患者的 MRI 掃描結果。
該數據集旨在評估面向多模態與多級分割任務的聯邦學習算法。在客戶端一側,研究團隊改寫了一個原本用于數據集中式訓練的一流訓練管道,并將其用作 NVIDIA Clara Train SDK 的一部分。
此外,研究團隊還將 NVIDIA V100 Tensor Core GPU 用于訓練與推理。
相比于數據集中式系統,聯邦學習所提供的方法可以在不共享機構數據的情況下實現相當大的分割性能。此外,試驗結果顯示,隱私保護與受訓模型質量之間產生了自然折中。而且,通過使用稀疏向量技術,聯盟學習系統可以實現嚴格隱私保護,且對模型性能僅產生合理的輕微影響。
深度學習是一種從醫學數據中自動提取知識的強大技術。聯邦學習有望有效聚合各機構從私有數據中本地習得的知識,從而進一步提高深度模型的準確性、穩健性與通用化能力。
此項研究為部署安全聯邦學習方面做出了巨大的推動,并將廣泛推動數據驅動型精準醫學的進步。
點擊教程鏈接:https://www.nvidia.com/en-us/events/miccai/,閱讀論文詳情。