摘要:針對圖像中相似冗余背景造成的顯著目標識別的干擾問題,提出了一種基于超像素的冗余信息抑制的顯著目標檢測方法。首先,引入超像素的概念,利用超像素優化的空間特征分割圖像,獲取圖像的相似區域;其次,為消除像素間的相關性,計算超像素的香農熵來表示圖像的像素信息,并據此建立圖像的信息圖,最后,為了更有效地去除圖像中的相似信息,利用自相似性抑制方法克服冗余信息,建立高效的圖像顯著圖。最后的仿真結果表明, 所提算法與傳統方法相比,不僅可以準確識別顯著目標,而且可以更有效地抑制背景中的冗余信息。
0引言
人類所獲知的信息中,有80%來源于人類的視覺感知。面對如此多的信息,人類視覺系統(HVS)能夠快速、準確地對其進行處理,主要是由于HVS在掃描外部場景時,可以引導人眼專注于細節信息豐富的區域,這種快速專注的過程則稱為視覺注意機制。近些年,視覺注意機制在目標探測、圖像壓縮、圖像搜索和機器視覺等方面廣泛應用,使其受到了越來越多的關注[1]。
Itti模型是Itti和Koch提出的最早、最具代表性的顯著模型之一,該模型先提取圖像的基本特征,如強度、顏色、紋理,然后再通過計算加權中央周邊差,將這些特征結合起來,得到最終的顯著圖像[2];高大山等人提出了一種新穎的從復雜背景中提取顯著目標的算法,該算法通過訓練學習,最優化多種圖像特征[3];侯曉迪等人[4]使用圖像的光譜殘余(SR)構建了新的顯著圖像算法,該算法通過分析輸入圖像的log譜,在頻域獲取圖像的光譜殘留信息,再在空域構建相應的顯著圖;Gopalakrishnan等人提出了一個穩定性強的顯著區域檢測模型,該模型使用顏色和方向分布特征分別得到兩幅顯著圖像,再用一種非線性疊加的方法組合兩幅顯著圖像得到最終的顯著圖像[5]。另外,還有其他一些模型,比如Bruce提出的基于信息最大化原則的AIM模型[6],Koch提出的基于圖論的GBVS模型[7],Achanta提出的基于頻率調整的FT模型[8]等。以上這些注意模型的立足點都是基于細小特征的數據信息[9],但對視覺識別過程中的冗余信息大都缺乏有力的解決辦法。事實上,視覺注意力主要集中于信息最豐富的區域,背景冗余由于攜帶了較少的信息,往往被大腦抑制,而獲得較少的關注。因此,在圖像視覺處理過程中,應盡可能地抑制冗余信息,這樣的處理過程更加符合人類視覺感知的基本過程。
為了模擬這樣的處理過程,本文提出一種基于超像素和局部空間視覺冗余信息抑制的顯著目標檢測方法。所提算法首先使用線性迭代聚類算法從圖像中提取均勻的紋理和灰度的超像素;再通過超像素定義,對圖像的空間特征進行優化;在此基礎上,利用超像素的空間特征對圖像結構的自相似性進行刻畫,并計算超像素的香農熵來建立圖像的信息圖;最后,利用自相似性抑制圖像的冗余結構,從而實現從復雜圖像的信息中獲取圖像的顯著圖。將最后的仿真結果與4種典型顯著算法相比,所提算法不僅有效地抑制了背景的冗余信息,而且所識別的顯著目標也是較好的。
1基于NLmeans算法的顯著估計
在自然圖像中,冗余區域往往包含了很少的信息,這使得它們獲得的關注度往往較小。因此,在識別過程中,這些冗余通常被大腦立即處理掉,從而提高識別的效率。與之相反,信息豐富的區域往往更加復雜,當然也會吸引大部分的注意,并得到進一步的處理。因此,本文嘗試通過計算圖像的冗余信息,并快速過濾掉這些冗余,來使顯著目標凸顯出來。
NLmeans算法是一種處理圖像空間冗余的有效方法[10],從NLmeans的觀點看,在非局部鄰近區域中冗余區域與其他區域是高度相似的。因此,通過計算周邊結構相似度,可以直接測量每個區域的冗余,采用NLmeans過濾公式來測量自相似性[11]。假設f(x)是一個標量圖像,符號f(x)和f(y)分別表示局部區域Ω(x)和Ω(y)中連接所有列形成的向量。這兩個區域之間的相似性由以下公式來衡量:
σx代表區域Ω(x)的相關參數,τ是規范化系數,用于在非局部區域規范化S(x,y)的總和使其成為1。
像素之間的自相似性依靠區域之間的相似性,利用區域的相似性可得到像素之間的自相似性。然后,用像素之間的自相似性修改正常熵,丟棄冗余信息。最后,結合顏色和尺度空間,創建了基于冗余減少的自然圖像的顯著估計模型。仿真結果如圖1所示。
由圖1可知,NLmeans算法顯著模型對一些微小的變化反應不敏感,并且對象區域能夠有效地突出。然而,該模型直接使用圖像像素值計算圖像的自相似性,并且因為使用歐氏距離函數,對灰度級比對結構和文本更敏感。因此,本文使用超像素優化的空間特征[12]測量圖像結構的自相似性,以改進NLmeans算法[10]。
2基于超像素優化空間特征的圖像分割
21超像素
由于圖像空間的一致性特性,圖像的像素表示通常是冗余的。為了減少這種冗余性,Ren and Malik[13]最早提出了超像素的概念。超像素處理是指利用像素之間特征的相似性,將像素分組,用少量的超像素代替大量的像素來表達圖像特征的過程。
本文使用簡單的線性迭代聚類算法,從圖像中提取大致均勻的紋理和灰度的超像素。
22超像素的空間特征優化
一般來說,圖像中的獨特區域通常遠少于超像素的數量,如圖2所示。因此鄰近區域內有影響的超像素和相似的超像素要被優化。通過對鄰近和相似的超像素優化,可使圖像中相似冗余的信息得到進一步聚類。因此利用超像素空間特征優化算法使得鄰近和相似的超像素優化得到圖像的相似冗余信息。
超像素空間特征優化算法的主要過程如下:
(1)對輸入圖像使用線性迭代聚類算法提取超像素。
(2)為每個超像素搜索鄰近的超像素。在鄰近的超像素之外找到SN個相似的超像素,SN=log(X×Y),X是圖像的寬度,Y是圖像的高度。
(3)根據公式(2)、(3)、(4),迭代每個超像素的集群中心和成員。如果max(U(k)-U(k+1)/U(k))≤ε,則進行第(4)步,否則,k←k+1,繼續第(3)步。
(4)使用PSO方法優化影響率1、2。如果在連續五個迭代或進化一代達到最大時滿足|J(U,V)t-J(U,V)(t+1)|/J(U,V)(t)≤δ,則迭代停止,得到超像素的空間特征α(x,y);否則,返回到步驟(3)。
其中,模糊級別m=2,初始化閾值ε=01%,δ=01%;設置初始矩陣U(t),t是迭代次數,uij是U的基礎;影響率參數1、2,初始化1=2=0。
23基于超像素的優化空間特征的圖像分割
在本文中,通過使用超像素的優化空間特征提高原來的NLmeans 算法來衡量圖像結構的自相似性。
由22節得到空間特征優化后的超像素區域R,使用α(x1,y1)和α(x2,y2)分別表示超像素區域R(x1,y1)和R(x2,y2)的空間特征,像素(x1,y1)和(x2,y2)分別表示超像素區域R(x1,y1)和R(x2,y2)的中央像素。像素(x1,y1)和(x2,y2)之間的相似性依靠超像素區域之間的相似性。像素(x1,y1)和(x2,y2)的相似性SS(x1,y1;x2,y2)由公式(5)測量:
參數λ控制了指數函數的衰減并有一定程度的過濾。τ是歸一化系數,它的作用是將非局部區域內的SS(x1,y1;x2,y2)的總和歸1。
3基于局部空間冗余抑制的顯著估計
31自相似性結構的刻畫
圖像結構的自相似性表明了圖像結構的冗余。自相似性越大,冗余也就越大。因此需要對圖像結構的自相似性進行刻畫。根據人類視覺系統的研究,兩個相近的區域之間的相似性遠遠高于較遠的區域。為了估計像素(x1,y1)的冗余,定義一個周邊區域Ω,為方便計算這里只考慮區域Ω內的像素的相似性,區域Ω外的像素忽略不計。此外,更加重視中心像素(x1,y1)附近的像素。像素(x1,y1)的自相似性如下定義:
32基于香農熵的信息度描述
在信息理論中信息測量香農熵是一種有效的測量,它基于事件的統計概率。根據香農信息理論,圖像信息總是基于像素的強度分布測量的。對于一個像素x,信息是基于局部區域的香農熵測量的,這里使用優化的超像素的空間特征計算像素的信息。給定一個像素(x,y),圖像信息圖定義如下:
這里N(α(x,y))是超像素區域的特征總量,N(αi)是超像素區域中αi的特征量,pi是像素(x,y)基于特征αi在超像素區域的概率。
33顯著圖生成
根據視覺注意機制集中于最豐富區域的特性,可以認為顯著圖像是人的大腦冗余抑制的結果,因此關注對象被模擬成視覺信息的冗余抑制。所以需要考慮圖像信息測量的結構冗余。為了模擬顯著圖像,有效地抑制冗余信息,利用結構的自相似性抑制圖像信息圖的圖像結構冗余,并從復雜圖像信息中提取出有用的信息。根據公式(6)和公式(7),冗余抑制的顯著圖像估計如下:
SM(x,y)=(1-φ(x,y))IM(x,y)(8)
由公式(11)可得到冗余抑制的顯著圖像估計,并且該顯著圖像的值的范圍是0~1。
4實驗結果與分析
為了驗證本文算法的優越性,將其與多個顯著目標檢測方法進行比較。實驗結果表明,本文的算法取得的效果比其他方法好。
41與NLmeans算法模型比較
本文算法與NLmeans算法的比較結果如圖2所示。其中第一列是原始圖像,第二列是NLmeans算法的顯著圖像,第三列是本算法的顯著圖像。
圖2中的原始圖像具有自相似紋理和背景,并且背景是非常多余的。NLmeans算法的顯著圖像,強調了對象的邊界,但背景干擾了響應。本文模型有效地顯著了整個對象區域,同時降低了背景紋理。
42與經典方法比較
與四個最經典的顯著估計方法(FT、SR、Gvbs和Itti)進行比較。圖3顯示了與這些經典方法的主觀比較。圖3(a)介紹了原始圖像,圖3(b)是ground truth,圖3(c~f)顯示了四個最經典的顯著估計方法的結果。本文算法的顯著圖像是圖3(g)。比較結果表明,本文方法可以產生良好的顯著評估結果。在測試圖像中,第一幅圖像和第二幅圖像,顯著對象很小,大多數方法都能夠估計顯著對象。但本文的算法能更好地檢測整個對象。當圖像是一個很大的顯著對象和簡單的背景時,如第三幅圖,其他的方法突出了邊界,但本文的算法幾乎強調整個對象。此外,在復雜背景的圖像場景中,如第五幅圖,本文的算法比別的算法對背景紋理更不敏感。
5結論
本文在NLmeans算法基礎上提出了一個新穎的顯著檢測方法。該方法基于超像素和冗余抑制對給定的圖像自動估計顯著圖像。顯著圖像是除去結構冗余后的圖像信息圖。通過與NLmeans算法和四個其他經典算法的實驗比較可見,本文的算法達到了更好的效果。
參考文獻
[1] ALEXANDER T.Computational versus psychophysical bottomup image saliency: a comparative evaluation study[J]. IEEE Transactions on Pattern Analysis and Machine intelligence, 2011, 33(11):2131-2146.
[2] ITTI L, KOCH C, NIEBUR E. A model of saliencybased visual attention for rapid scene analysis[J]. IEEE Tranctions on Pattern Analysis and Machine Intelligency, 1998,20(11):1254-1259.
[3] GAO D, VASCONCELOS N. Integrated learning of saliency, complex features, and object scenes[C]. In Proceedings of the 2005 Conference on Computer Vision and Pattern Recognition (CVPR′05), CA, USA, 2005: 282-287.
[4] HOU X, ZHANG L. Saliency detection: a spectral residual approach[C].IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2007:1-8.
[5] VISWANATH G, RQUN H, DEEPU R. Salient region detection by modeling distributions of color and orientation[C]. IEEE Trans. Multimedia, 2009, 11(5):892-905.
[6] BRUCE, N, TSOTSOS J. Saliency based on information maximization[C]. In Proc. Advances in Neural Information Processing Systems,2005:155-162.
[7] HAREL J, KOCH C, PERONA P. Graphbased visual saliency[C]. Advances in Neural Information Processing Systems, MIT Press, Cambridge, 2007:545-552.
[8] ACHANTA R, HEMAMI S, ESTRADA F, et al. Frequencytuned salient region detection[C]. In: IEEE Conference on Computer Vision and Pattern Recognition, 2009, CVPR 2009, IEEE, 2009: 1597-1604.
[9] 胡玉蘭,趙子銘,片兆宇,等.高分辨雷達一維距離像的融合特征識別[J].微型機與應用,2015,34(4):52-54,57.
[10] WU J, QI F, SHI G, et al. Nonlocal spatial redundancy reduction for bottomup saliency estimation[C].Visual Communication and Image Representation, 2012:1158-1166.
[11] BUADES A, COLL B, MOREL J. A nonlocal algorithm for image denoisin[C]. In: Proc.IEEE Conf. Computer Vision and Pattern Recognition, 2005: 60-65.
[12] Tian Xiaolin, Jiao Licheng.The image segmentation based on optimized spatial feature of superpixel[J]. Visual Communication and Image Representation, 2015(26):146-160.
[13] REN X, MALIK J. Learning a classification model for segmentation[C], In: International Conference on Computer Vision, 2003:10-17.