12 月 17 日消息,人工智能(AI)日趨一日地在醫療領域變得越來越重要,尤其是在醫學影像分析方面。醫生們可以通過 AI 更快更準地診斷疾病,制定治療方案。而要讓 AI 更聰明,就需要大量高質量的醫學影像數據來“喂養”它,也就是進行訓練。
然而,由于患者隱私保護、高昂的數據標注成本等多種因素,要獲得高質量、多樣化的醫學影像數據往往存在障礙。為此,近年來,研究者們開始探索使用生成式 AI 技術合成醫學影像數據,以此來擴充數據。
為了解決這個問題,北京大學與溫州醫科大學的研究團隊建立一種生成式多模態跨器官醫學影像基礎模型(MINIM),可基于文本指令以及多器官的多種成像方式,合成海量的高質量醫學影像數據,為醫學影像大模型的訓練、精準醫療及個性化診療等提供有力技術支持。
該成果已于 12 月 11 日發表在國際權威期刊《自然?醫學》上(附 DOI:10.1038 / s41591-024-03359-y)。
簡單來說,MINIM 就像一個“圖像生成器”,它可以通過 AI 技術,根據文字描述,自動合成出海量的醫學影像數據,包括 CT、X 光、磁共振等等,涵蓋了各種器官。
北京大學未來技術學院助理研究員王勁卓介紹說,“目前公開的醫學影像數據非常有限,我們建立的生成式模型有望解決訓練數據不夠的問題。”
這些合成的影像數據有多逼真呢?研究團隊利用多種器官在 CT、X 光、磁共振等不同成像方式下的高質量影像文本配對數據進行訓練,最終生成海量的醫學合成影像,其在圖像特征、細節呈現等多方面都與真實醫學圖像高度一致。
實驗結果表明,使用 MINIM 生成的合成數據,在醫生主觀評價和客觀檢測標準上都達到了國際領先水平。在真實數據的基礎上,使用 20 倍合成數據在眼科、胸科、腦科和乳腺科的多個醫學任務準確率平均可提升 12% 至 17%。
王勁卓還表示,MINIM 生成的合成數據應用前景廣闊,既可以單獨用來訓練醫學影像大模型,也可以和真實數據混合使用,從而提高模型在實際應用中的性能,推動 AI 在醫學和健康領域更廣泛的應用。
目前,在疾病診斷、醫學報告生成和自監督學習等關鍵領域,利用 MINIM 合成數據進行訓練已展現出顯著的性能提升。