面向CNN的類激活映射算法研究
信息技術與網絡安全 1期
楊繼增,關勝曉
(中國科學技術大學 信息科學技術學院,安徽 合肥230026)
摘要: 類激活映射(CAM)是卷積神經網絡(CNN)解釋中的一種直觀的方法,通常由CNN的最后一個卷積層生成,可以突出顯示輸入圖片中目標類的不同區域。之前的CAM方法只依賴于最后的卷積層,生成的解釋圖只能顯示模糊的物體位置信息。提出了一種新的方法即分層加權類激活映射方案(SL-CAM),通過加權合并CNN淺層到深層的信息來生成類激活圖。由淺層特征圖及其對應的梯度生成的激活圖包含詳細、準確但噪聲大的位置信息;而由深層特征圖生成的激活圖包含噪聲少但模糊的位置信息。在LSVRC2012 Val上的實驗表明,SL-CAM多項指標上均優于Grad-CAM、Grad-CAM++和Score-CAM。
中圖分類號: TP183
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.010
引用格式: 楊繼增,關勝曉. 面向CNN的類激活映射算法研究[J].信息技術與網絡安全,2022,41(1):63-68.
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.010
引用格式: 楊繼增,關勝曉. 面向CNN的類激活映射算法研究[J].信息技術與網絡安全,2022,41(1):63-68.
A class activation mapping algorithm for CNN
Yang Jizeng,Guan Shengxiao
(School of Information Science and Technology,University of Science and Technology of China,Hefei 230026,China)
Abstract: Class activation mapping(CAM) is a straightforward method in the interpretation of convolutional neural networks(CNN), usually generated by the last convolution layer of CNN, which can highlight different object regions of the target class. Several previous CAM methods only depend on the final convolution layer, so the class activation map, generated by these, can only show the rough object position information. A new method called score-weighted & layer-wise class activation mapping(SL-CAM) was proposed to generate class activation maps by merging shallow to deep information of CNN. The class activation map generated from the shallow feature map and its corresponding gradient contains detailed and accurate location information with more noise. The activation map generated from the deep feature map contains less noise with rough location information. SL-CAM outperforms Grad-CAM, Grad-CAM++ and Score-CAM on ILSVRC2012 Val.
Key words : class activation mapping;convolutional neural networks;visualization
0 引言
近年來,以CNN為代表的深度學習在計算機視覺領域取得了突出的成果。使用端到端模型訓練分類器的CNN可以很好地完成大量的圖像處理任務。然而,端到端模型的黑盒屬性使CNN能夠直接基于輸入給出結果。早期的人工智能系統的內部機制主要是邏輯和符號,CNN的解釋方法被提出后,可視化成為最直接的策略。換句話說,可視化網絡預測結果與輸入圖片的一些關聯區域,如輸入特征的重要性或學習的權重,已經成為最直接的方法?;谔荻萚1]、基于擾動[2]、基于CAM[3]是三種被廣泛采用的方法。
基于梯度的方法通常獲取含有大量噪聲的低質量的解釋圖。其步驟如下:首先,通過網絡的反向傳播得到輸入空間的梯度圖;其次,對梯度圖進行處理得到表示輸入圖片對特定類輸出結果貢獻程度的熱力圖?;跀_動的方法[2,4]通常用擾動噪聲改變原始輸入來觀察模型預測得分的變化。然而,此方法需要花費大量時間來迭代查詢模型預測結果。
本文詳細內容請下載:http://www.j7575.cn/resource/share/2000003938
作者信息:
楊繼增,關勝曉
(中國科學技術大學 信息科學技術學院,安徽 合肥230026)
此內容為AET網站原創,未經授權禁止轉載。