文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.10.005
中文引用格式: 杜玉龍,李建增,張巖,等. 基于強獨特性二進制描述子的無人機目標識別算法[J].電子技術應用,2016,42(10):24-28,32.
英文引用格式: Du Yulong,Li Jianzeng,Zhang Yan,et al. Objection recognition algorithm of UAV based on strong uniqueness binary description[J].Application of Electronic Technique,2016,42(10):24-28,32.
0 引言
目標識別是計算機視覺領域內的經典問題,隨著多媒體技術的發展,人類接收的信息量與日俱增,使用計算機代替人力實現目標識別已逐漸成為發展趨勢。在軍事應用方面,為了節省人力以及減少人員傷亡,無人機目標識別技術同樣得到了廣泛研究,而無人機的迅猛發展為該技術提供了研究條件和工程應用基礎。目標識別中特征描述算法可分為浮點型和二進制兩類,與采用歐氏距離作為特征點匹配判定條件的浮點型算法不同,二進制算法通過異或操作即可完成判斷,有效降低計算量,確保圖像的實時處理,考慮到無人機目標識別應用對于實時性的要求,選用二進制算法作為本文算法的基礎。
代表性的二進制算法主要包括BRIEF[1](Binary Robust Independent Elementary Features)算法、ORB[2](Oriented Fast and Rotated BRIEF)算法、BRISK[3](Binary Robust Invariant Scalable Keypoints)算法以及FREAK[4](Fast Retina Keypoints)算法等。其中BRIEF算法在特征點鄰域內隨機選取采樣點對,通過灰度對比生成特征描述符,雖然算法運行速度很快,但采樣點選取策略的隨機性導致算法的特征表達能力有限,且旋轉不變性與尺度不變性較差。ORB算法在其基礎上引入方向特性,具備良好的旋轉不變性,但采樣點選取策略并沒有得到改進。BRISK算法設計了一種固定采樣模型,基于該模型的特征描述有效改善算法對于各種變換的魯棒性,但模型內采樣點感受域之間重疊率低,信息連續性較差,導致特征描述不夠充分。FREAK算法根據人眼視網膜原理,在BRISK算法的基礎上進一步優化采樣模型結構,增加了相鄰采樣點感受域之間的交疊帶,改善了特征描述的信息含量,但重疊區域過大導致信息冗余,降低了描述子的獨特性。
針對傳統無人機目標識別特征描述算法的不足,提出了一種基于改進采樣模型的強獨特性二進制描述算法,算法首先對比BRISK和FREAK采樣模型,確定影響模型性能的參數,并通過理論建模逐項優化選取參數最優值,根據人眼視網膜中細胞的分布特性得到改進模型。在此基礎上,對圖像進行灰度劃分及排序,將改進模型映射其中,增加對圖像層次信息的表達,在眾多描述子中選取具有強區分性和低相關性作為最終的特征描述子,改善算法的魯棒性能。
1 構建采樣模型
在特征描述階段,通過比較采樣模型內采樣點對的灰度值生成二進制描述字符串,因此合理的采樣模型是保證描述子性能的關鍵。在設計采樣模型前,首先對比BRISK和FREAK采樣模型以確定影響模型性能的參數,模型示意圖如圖1所示。
1.1 傳統采樣模型分析
兩種采樣模型均采用圓形對稱結構。通過對比分析得出影響性能的主要參數分別為:采樣點密度、采樣環層數和采樣點感受域重疊度。
三個參數之間相互聯系和制約,由于同一采樣環上的采樣點之間不存在重疊,采樣點密度決定了每個采樣點的感受域,相鄰采樣環之間的距離決定了采樣點感受域之間的重疊范圍,采樣點密度與采樣環層數決定了采樣模型內的采樣點個數,三者之間相互作用共同決定了采樣模型的性能。
1.2 采樣環層數與采樣點密度
首先對采樣點全局均勻分布類模型性能進行測試,結果如圖2所示。
實驗結果表明:此類模型的正確匹配率隨總采樣點數和采樣環層數的增加逐漸上升,當采樣點數為57個,采樣環達到6層時,模型獲取的所有信息中特征信息占比最高,描述子位特征方差和均值達到最佳,模型性能最優。為了滿足圖像實時處理的要求,選取57個采樣點均勻分布在6層采樣環上的模型作為此類最優模型,基于此模型的算法正確匹配率為74%。
對相同層采樣點數類分布模型性能進行測試,結果如圖3所示。
實驗結果表明:此類模型的正確匹配率隨層采樣點數和采樣環層數的增加逐漸上升,對應的總信息中特征信息比重逐漸增大,當達到極值時,特征信息利用率最高,算法性能達到最優并逐漸趨于穩定。因此,綜合考慮算法的精確度和復雜度,將7層采樣環,每層均勻分布8個采樣點的模型作為此類最優模型,基于該模型的算法正確匹配率為78%。
1.3 感受域范圍重疊度
在生成描述子時,采樣點的感受域越大,包含的信息越多,特征點的描述子獨特性越強,但過大的感受域會使重疊度增大,從而導致信息冗余。對不同重疊度下模型獲取的信息量進行統計,以確定最優重疊度,結果如圖4所示,當重疊度為20%~25%時特征信息含量達到極值,因此在設計采樣模型時,將每個采樣點的感受域重疊度調整為23%左右。
1.4 本文采樣模型
研究[4]表明:人眼在觀察目標時,通過視網膜中央區域識別目標的細節信息;而周邊區域主要用于檢測目標的輪廓信息;其細胞分布的數學模型符合高斯分布[8]。根據人眼視網膜中的細胞分布規律,提出一種基于高斯分布的強獨特性描述子采樣模型。模型性能測試結果如圖5所示。
根據測試結果,當模型的采樣環達到6層后算法性能逐漸趨于穩定,此時的正確匹配率為83%,性能優于前兩類模型。根據這一結論得到本文模型分布如圖6所示。
2 構建二進制描述子
在傳統無人機目標識別特征描述子的生成過程中,僅在特征點的單一鄰域內利用采樣模型中采樣點對比結果生成二進制字符串,缺乏對圖像層次信息和旋轉信息的表達,且忽略了圖像中像素的聚類特征,導致描述子在圖像中存在各種仿射變換和噪聲干擾情況下的魯棒性能較差。針對這一局限性,本文在改進采樣模型的基礎上,通過對圖像分層處理提升算法的獨特性。
如圖7所示,將灰度值劃分為幾段,對應不同區間可得到多組子圖像,分別對每一幅子圖像進行多尺度高斯平滑,高斯核越大,特征點的魯棒性能越強,因此優先描述高尺度平滑子圖像特征點,并賦予較高的權重。將通過不同灰度劃分計算法得到的描述子在按順序排列成矩陣形式,分別計算矩陣的方差和協方差,篩選出其中具有強區分性和低相關性的列作為最終的特征描述子。
3 實驗分析
為了測試本文無人機目標識別算法的魯棒性能,采用由Mikolajczyk[10]所提供的國際標準測試圖像集進行實驗。
3.1 魯棒性能測試
在測試中統一采用FAST-Hessian算法進行特征點檢測,利用Precision-Recall曲線對算法的魯棒性能進行分析,其中Precision代表查準率,即所有匹配特征點中正確匹配點所占的比例;Recall代表查全率,表示正確匹配特征點數與特征點總數的比值,其計算公式分別為:
其中,#correct matches表示錯誤匹配的特征點數,#match keypoints表示匹配成功的總點數,#corresponding keypoints表示兩幅圖像之間對應的特征點總數。采用各個測試集中的第一幅與第四幅圖像進行實驗,測試結果如圖8所示。
圖8中測試曲線表明:本文算法在各種變換下的魯棒性能優于其他四種算法,這是由于采樣模型中采樣點感受域之間的交互重疊使得模型能夠充分獲取特征點的周邊信息,信息更加連續,保證模型對于視點變換具有更強的魯棒性。在生成描述子時,對子圖像進行了多尺度高斯平滑,并引入灰度排序信息,通過計算描述子矩陣的方差和協方差,篩選其中具有強區分性和低相關性的特征描述子,從而能夠更好地克服各種變換對目標識別帶來的影響,保證算法在無人機戰場偵察中對于各種復雜環境的穩定性能,有利于對于敵方情報的實時掌控,控制戰爭走向。
3.2 實時性
在測試圖像集中,分別統計各無人機目標識別算法的總匹配特征點數Num、特征描述總耗時t和每個特征點描述平均耗時Ave,通過數據對比分析算法性能,統計結果如表1所示。
其中SIFT和SURF算法作為浮點型算法通過計算特征點之間的歐氏距離判斷是否匹配,因此耗時嚴重。而二進制BRISK和FREAK描述算法,只需在特征點鄰域內按照采樣模型選取點對進行灰度比較,將生成的二進制描述字符串作為特征描述子,因此算法運行速度有較大提升,滿足實時性處理的實際應用要求;本文采樣模型在設計過程中,通過合理選取采樣點密度和采樣環層數,按高斯模型分布采樣點,優化感受域重疊度,從而增強模型獨特性,并提高算法的精度與速度。但本文算法在生成描述子時引入了灰度排序信息,在改善描述子性能的同時,算法耗時相對有所提高,根據表1數據,本文算法耗時在BRISK和FREAK算法之上,但遠少于浮點型算法的耗時,基本滿足實際應用中實時性的要求,結合識別性能中的測試結果,本文所提出的無人機目標識別算法能夠同時滿足戰場應用對于識別精度和速度的要求,且相對傳統算法有較大的提升,因此本文算法具有一定的優越性。
4 結論
針對傳統無人機目標識別算法中特征描述子獨特性有限導致算法誤匹配率較高,目標識別精度較低的不足。本文首先對影響模型性能的主要因素進行分析,然后通過理論建模獲取最優參數,結合仿生學原理,提出一種基于高斯分布的強區分性采樣模型,最后結合灰度排序信息和高斯平滑,通過計算方差和協方差篩選出具有強區分性和低相關性的特征描述子;實驗結果表明本文算法不僅能較好地克服戰場偵察圖像中各種變換帶來的影響,同時滿足實際應用中實時性處理的要求。
本文在構建采樣模型時,只在兩種約束模型條件下進行了討論分析,進一步優化時可考慮采樣模型的所有可能分布,從而獲得絕對最優模型,且只對目標識別中的特征描述算法進行了優化,對于特征檢測算法的改進可作為下一步研究方向。
參考文獻
[1] CALONDER M,LEPETIT V,OZUYSAL M,et al.BRIEF:binary robust independent elementary features[J].IEEE Transactions on Model Analysis and Machine Intelligence,2012,34(7):1281-1298.
[2] RUBLEE E,RABAUD V,KONOLIDGEK,et al.ORB:an efficient alternative to SIFT or SURF[C].Proceedings of the 13th IEEE International on Conference Computer Vision.Los Alamitos:IEEE Computer Society Press,2011,2011:2564-2571.
[3] LEUTENEGGER S,CHLI M,SIEGWART R.BRISK:binary robust invariant scalable keypoints[C].Proceedings of the 13th IEEE International Conference on Computer Vision.Los Alamitos:IEEE Computer Society Press,2012:2548-2555.
[4] ALAHI A,ORTIZ R,VANDERRGHEYNST P.FREAK:fast retina keypoint[C].Proceedings of Computer Version and Model Recognition.Los Alamitos:IEEE Computer Society Press,2011:510-517.
[5] MARI E,HAGER G,BURSCHKA G,et al.Adaptive and generic corner detection based on the accelerated segment test[C].Proceedings of the 11th European Conference on Computer Vision,2010,6312:183-196.
[6] 惠國保,李東波,童一飛.挖掘圖像補丁特征信息增強二進制描述子獨特性[J].計算機輔助設計與圖形學學報,2014,26(9):1419-1429.
[7] 白豐,張明路,張小俊,等.快速優化篩選多尺度矩形域的二進制描述[J].中國圖像圖形學報,2016,21(3):303-313.
[8] 林森,苑瑋琦,宋輝.二進制魯棒不變尺度特征在非接觸掌紋識別中的應用[J].儀器儀表學報,2013,34(12):2785-2792.
[9] BEKELE D,TEUTHCS M,SCHUCHERT T.Evaluation of binary keypoint descriptors[C].Proceedings of the 20th IEEE International Conference on Image Processing,2013:3652-3656.
[10] MIKOLAJCZYK K,SCHMID C.A performance evaluation of local descriptors[J].IEEE Transactions on Model Analysis and Machine Intelligence,2005,27(10):1615-1630.
[11] 王燦進,孫濤,陳娟.基于FREAK特征的快速景象匹配[J].電子測量與儀器學報,2015,29(2):204-212.