国产区综合,国产黄色自拍视频,日日操夜夜骑

基于ERNIE-CAB-CNN的稀土專利文本分類模型

摘要：針對稀土專利文本專業性強的特點以及現有的文本分類方法存在的不足，鑒于類別注意力在計算機視覺領域的廣泛應用和取得的良好效果，提出了一種用于文本分類的類別注意力模塊（Category Attention Module，CAB），并結合預訓練模型ERNIE和卷積神經網絡（Convolutional Neural Networks，CNN）構建了一個用于稀土專利文本分類的創新模型ERNIE-CAB-CNN。模型使用ERNIE對專利文本進行向量化，得到語義信息更加豐富的向量表示后，通過CAB為文本中各個類別的重要特征賦予較高權值，使模型可以更準確地區分不同類別的特征。最后用CNN進一步提取文本中其他關鍵局部特征，得到的最終文本向量表示用于分類。通過Patsnap專利數據庫官方網站檢索下載稀土專利數據構建數據集進行實驗，實驗結果表明，稀土專利文本分類模型ERNIE-CAB-CNN在測試集上分類的準確率、精確率、F1分數分別為82.68％、83.2％、82.06％，取得了良好的分類效果。

基于動態自適應計算引擎的MobileNetV3網絡加速器設計

摘要：現有面向高效輕量化MobileNetV3網絡的加速方法通常采用高度定制的計算引擎進行模型計算，從而限制了加速器的可擴展性使其僅適用于小型網絡或資源豐富的硬件平臺。針對此問題，提出了基于動態自適應計算引擎的MobileNetV3網絡加速器。首先，設計了局部感知區域卷積的流水線推理架構實現特征、權重的高度并行處理和緩沖調度。其次，提出全局自適應的點卷積方法優化點卷積，并結合空間探索獲得最優的參數配置以實現最大計算并行性。此外，加速器可以根據模型參數變化動態配置以適應不同場景。實驗結果顯示加速器推理速度為8 F/s，是現有方法速度的2.7倍。

基于多頭注意力的社交網絡用戶身份鏈接方法

摘要：隨著社交網絡的快速發展，人們在社交網絡中擁有越來越多的虛擬身份，識別同一自然人不同網絡虛擬身份的網絡用戶身份鏈接問題變得越來越重要。用戶身份鏈接有助于挖掘網絡用戶的隱信息，構建全面的網絡用戶畫像，進而促進跨網絡的推薦、鏈接預測、信息傳播等多個研究領域發展。現有的基于用戶屬性和基于網絡結構的用戶身份鏈接方法，沒有考慮不同用戶之間影響力差異因素，收斂速度較慢。基于深度游走的用戶身份鏈接方法，融入多頭注意力機制，對用戶間影響力進行建模，實驗結果表明，該方法可以很好地改進算法有效性，提高訓練效率。

基于改進YOLOv5n的腐敗水果檢測模型

摘要：為了實現多種水果在采摘后自動化篩選和分揀中腐敗水果識別的問題，提出了改進的YOLOv5n模型，命名為mobile-YOLO。首先將YOLOv5n的主干網絡替換為MobileNetV3并引入深度可分離卷積，相較于原模型，這種改進在計算效率和速度上都有所提升，并且準確率也得到了提高。為了進一步提升速度，將C3模塊替換為C2f模塊，實現輕量化的同時獲得了更豐富的梯度流信息。最后將原有的CIoU替換為α-CIoU，以加快收斂速度并保證圖像框位置的準確性。mobile-YOLO相較于原始的YOLOv5n，mAP@.5（mean Average Precision）達到了98.1%，mAP@.5：.95達到了94.2%，同時在P（Precision）值為97.1%和R（Recall）值為96.8%的情況下，參數量幾乎與YOLOv5n保持一致。

融合圖文預訓練的漢越多模態神經機器翻譯

摘要：由于漢語和越南語之間存在顯著的語法差異及語料稀缺，漢越神經機器翻譯任務面臨名詞翻譯不準確的挑戰。提出了一種新穎的多模態神經機器翻譯方法，該方法融合了文本預訓練模型和視覺語言聯合預訓練模型。通過文本預訓練模型，能夠捕獲深層的語言結構和語義；而視覺語言聯合訓練模型則提供了與文本相關聯的視覺上下文，這有助于模型更準確地理解和翻譯名詞。兩種模型通過一個簡潔高效的映射網絡結合，并通過Gumbel門控模塊動態地整合多模態信息，以優化翻譯輸出。在漢越及越漢翻譯任務中，該方法相比傳統Transformer模型分別提升了7.13和4.27的BLEU值。

基于改進AlexNet卷積神經網絡人臉識別的研究

摘要：近期，人臉識別技術在社會上廣受關注，其非接觸式的識別特性相較于指紋等傳統接觸式識別方法展現出明顯優勢。在深度學習領域，由于傳統卷積神經網絡在人臉識別任務上的準確性和速度尚有提升空間，因此提出采用改進的AlexNet卷積神經網絡進行人臉識別。通過實驗驗證，與傳統卷積網絡相比，改進后的AlexNet在人臉識別上不僅準確度更高，而且識別過程更為穩定。

計及可再生能源接入配電網的負荷預測和優化

摘要：目前，可再生能源大量接入配電網，但是太陽能、風能、光伏及風電等可再生能源的間歇性和隨機性不可避免地會造成配電網的波動。考慮電網內可再生能源發電功率與用電負荷隨時間變化的特點，提出一種基于小波變換和神經網絡的可再生能源接入配電網的負荷預測和優化方法。首先采集配電網的發電與負荷數據，利用小波變換處理收集到的數據，得到局部尺度和頻率分解的特征參數，建立神經網絡預測模型；然后，對經過小波變換后得到的特征參數進行訓練，根據預測負荷對可再生能源的發電量進行調節，保持配電網供需側的動態平衡。結果表明，所提方法能夠對負荷進行有效預測，通過提前預測負荷量，保證配電網用電穩定性的同時，最大化利用可再生能源。

基于Transformer殘差網絡的事件重建算法

摘要：目前的人工視覺系統仍然無法處理一些涉及高速運動場景和高動態范圍的真實世界場景。事件相機因其低延遲和高動態范圍捕捉高速運動的優勢具有消除上述問題的能力。然而，由于事件數據的高度稀疏和變化性質，在保證其快速性的同時將事件重建為視頻仍然具有挑戰性。因此提出了一種基于Transformer殘差網絡和光流估計的事件流重建算法，通過光流估計和事件重建的聯合訓練，實現自監督的重建過程，并引入去模糊預處理和亞像素上采樣模塊來提高重建質量。實驗結果表明，在公開數據集上，提出的方法可以有效提高事件流的重建效果。

基于拓撲結構的度量學習與拓撲傳播的miRNA-疾病關聯預測算法

摘要：miRNA的突變和異常表達可能導致各種疾病，因此預測miRNA與疾病的潛在相關性對于臨床醫學和藥物研究的發展具有重要意義。拓撲結構是miRNA-疾病預測算法的重要組成部分，然而當前算法并未有效利用拓撲結構導致預測結果并不理想。與此同時，如何有效地融合多源數據也是當前的研究趨勢。針對上述問題，提出一種自適應融合異質節點結構信息算法（MMTP），通過利用節點的一階鄰居和元路徑誘導網絡學習結構特征，并利用度量學習和拓撲傳播自適應地融合異質節點結構信息，以提升miRNA-疾病預測精度。5折交叉驗證實驗結果表明，MMTP在HMDD v3.2數據集上的受試者操作曲線下面積（AUC）為94.81，高于其他模型。并且在基于腎癌的案例研究中，該模型所預測的前30個miRNAs全部得到證實。上述研究證明，所提的MMTP模型可有效預測miRNA-疾病相關性。

基于毫米波雷達三維點云的室內跌倒檢測

摘要：全球老齡化時代的到來引發的老年人健康監護問題不可忽視，而室內跌倒對獨居的老年人有非常大的安全隱患。因此，為準確檢測到跌倒動作，使用毫米波雷達三維點云信息進行室內跌倒檢測，并提出一種基于外部注意力機制的PointLSTM網絡實現三維點云在時序的分類。通過MIMO體制的毫米波雷達芯片采集人體動作的回波信號，利用集成雷達基帶處理器的微控制器實現信號處理的部分，可將原始數據實時轉換成三維點云，并提高點云處理中的計算速度及雷達硬件的整體性能。基于外部注意力機制的PointLSTM網絡可實現點云在時空中的提取特征和分類識別，網絡改進了PointLSTM幀間點信息的流失問題，并在信息提取中對所有數據實現特征聯系，外部注意力機制通過獨立的可學習參數優化了網絡復雜度和識別精確率。實驗結果表明，所提出的方法在室內環境下檢測準確率可以達到98.3%，可以有效區分動作的類別，并驗證了使用毫米波雷達三維點云檢測人體跌倒的可行性。

基于云計算的蛋白質折疊空間結構預測

摘要：構建基于云計算的蛋白質折疊空間結構預測框架，通過數據云存儲設備獲取蛋白質序列原始數據，采用HDFS（Hadoop Distributed File System）分布式存儲方式保存于云端。資源和隊列管理器RQM（Resource Queue Management）開啟云端虛擬機后，以之作為掃描節點（Sensor Node， SN），SN基于二維AB非格點模型建立最小蛋白質分子能量優化函數，采用局部搜索機制改進的量子遺傳算法對其作優化求解。利用云端GPU設備處理模型訓練數據，即可實現蛋白質折疊空間結構的自動化預測。實驗結果表明：蛋白質序列能量勢函數計算結果更小、執行效率更高、GDT-TS（Geothermal Development and Testing Tool Suite）評價指標值更大。

基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法

摘要：喬木在維持生態平衡、保護生物多樣性以及調節氣候和改善空氣質量等方面發揮著至關重要的作用。針對復雜背景下喬木識別準確率較低的問題，提出了一種基于樹木多特征融合和知識蒸餾的亞熱帶常見喬木識別模型MFFMN-KD-TA。該模型采用3個并行的MobileNetV3_Small主干網絡分別提取樹葉、樹干和樹木整體特征；并通過知識蒸餾和嵌入Triplet Attention模塊的方法優化訓練。試驗結果表明，MFFMN-KD-TA模型在自建樹木測試集上的準確率、精確率和F1分數分別為0.960 9、0.962 1和0.960 8，較MFFMN模型分別提升了3.05%、2.83%和3.07%。與三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比，提出的多特征融合模型MFFMN-KD-TA參數量較小且能夠較準確地識別喬木種類，為亞熱帶和其他地區的樹種識別提供了新思路和新方法。

用于主動學習的時序特征融合預測損失網絡

摘要：通過主動學習模型來選取最有價值的數據點進行標注是深度學習減少標注數據量的一種方式。預測損失模型是一類與任務無關的主動學習模型，該類模型在多個任務中都有不錯的表現。但是這類模型均不是端到端的模型，不斷變化的輸入特征會導致損失預測網絡在訓練時出現輸入偏差。提出了時序特征融合預測損失模型用于解決該模型的輸入偏差問題。實驗證明，提出的算法在各個任務中的性能與以往最先進的算法相比，平均提升約1.5%，與原預測損失模型相比，平均提升5%。

混合CNN-SVM的心音信號分類算法的研究

摘要：針對當前心音信號識別算法檢測精度不佳問題，提出了一種混合卷積神經網絡-支持向量機模型（CNN-SVM）的心音信號分類方法。通過PASCAL挑戰實驗數據，整理出正常與不正常兩類心音信號數據庫，通過預處理濾波及MFCC、一二階差分特征提取、PCA降維，輸入CNN-SVM模型進行訓練。并從準確率、召回率、特異性、精確率和F分數5個方面進行性能評估。為了驗證此算法的有效性，將混合CNN-SVM模型與單一SVM、CNN模型分別進行了對比。實驗結果表明，該方法能夠以較高識別率將兩種心音信號區分開，其平均識別準確率接近于99%，相較于單一CNN方法提高了2.48%，同樣高于單一SVM算法。

融合蛋白質語言模型與深度神經網絡的植物蛋白質相互作用預測研究

摘要：預測植物中的蛋白質-蛋白質相互作用（PPI）具有重要的生物學意義。同時采用了4種編碼方法及深度神經網絡構建了蛋白質相互作用預測模型。結果表明，提出的融合蛋白質語言模型Ankh與深度神經網絡的方法構建的PPI預測模型性能在3種植物數據集上均獲得了最優的AUPR和AUC值，Sen及MCC值也均優于其他4種蛋白質相互作用預測模型。當模型在水稻、大豆的植物PPI數據集上進行測試時，所提出的模型AUPR值分別為0.802 5、0.730 1，AUC值分別為0.956 2、0.950 7。這些優異的結果表明，融合蛋白質語言模型Ankh的PPI模型可以作為植物蛋白質相互作用預測的一個有前途的工具。

全局通道注意力增強的毫米波圖像目標檢測

摘要：針對主動毫米波圖像中目標與背景紋理區分度較低導致隱匿目標漏檢問題，并根據安檢實時性要求，提出一種基于全局通道注意力增強的主動毫米波圖像目標檢測方法。該方法以YOLOv5s為載體，在坐標注意力位置方向上引入全局通道注意模塊，增強對隱匿目標全局通道信息的關注，從而提升在隱匿目標與背景紋理區分度較低時的檢測能力；再利用K-means++聚類算法重新生成適合毫米波圖像目標檢測的錨框。實驗結果表明，無論是陣列圖像數據集還是線掃圖像數據集，該方法增強了對隱匿目標的特征注意，提高了召回率，在滿足安檢實時性的前提下，提升了檢測性能。通過增加少量參數，在陣列圖像數據集上，精度、召回率和mAP@.5達到了92.0%、90.93%和95.32%；在線掃圖像數據集上，精度、召回率和mAP@.5達到了94.65%、92.67%和97.73%。平均單張圖像推理時間在兩個數據集上均達到1 ms，滿足實時性要求。

基于貝塞爾曲線的智能汽車避障軌跡規劃方法研究

摘要：開展了一種基于貝塞爾曲線的智能汽車避障局部軌跡規劃，即路徑規劃和速度規劃方法研究。路徑規劃時，為了適應各種形狀道路，將道路笛卡爾坐標轉換為Frénet坐標，以路徑的長度、曲率和連續性，以及車輛碰撞風險為代價函數，其中引入危險勢場理論，描述車輛碰撞風險，并采用序列二次規劃方法來求解路徑規劃這一非線性優化問題；速度規劃時，以行車效率和舒適性為目標，實現速度規劃，該方法可以通過調整各子目標函數的權重來滿足不同駕駛需求。為了驗證基于貝塞爾曲線軌跡規劃算法的有效性，設計了直道和彎道上靜態和動態避障場景的仿真實驗，結果表明，提出的軌跡規劃方法能夠在各種形狀道路上完成避障任務，且避障過程中車輛狀態變化平穩，能夠保證乘坐舒適性。

基于詞匯增強和表格填充的中文命名實體識別

摘要：中文命名實體識別主要包括中文平面命名實體識別和中文嵌套命名實體識別兩個任務，其中中文嵌套命名實體識別任務難度更大。提出了一個基于詞匯增強和表格填充的統一模型TLEXNER，該模型能夠同時處理上述任務。該模型首先針對中文語料分詞困難的問題，使用詞典適配器將詞匯信息融合到BERT預訓練模型，并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中；然后通過條件層歸一化和雙仿射模型構造并預測字符對表格，使用表格建模字符與字符之間的關系，得到平面實體與嵌套實體的統一表示；最后根據字符對表格上三角區域的數值判斷實體類別。提出的模型在平面實體的公開數據集Resume和自行標注的軍事領域嵌套實體數據集上F1分別是97.35%和91.96%，證明了TLEXNER模型的有效性。

具有自主學習與記憶功能的智能政務問答系統研究

摘要：任務型問答系統一旦構建好，通常是固定不變的，能回答的問題非常有限，難以滿足用戶的需求。對此，提出一種自動實時更新知識庫的方法，當用戶提了一個問答系統回答不了的問題，系統會把該問題自動發送給人工客服，人工客服利用專業知識回復后，系統能夠自動實時獲取用戶提的問題和人工客服回復的答案，并把這個問答對自動實時更新到知識庫，之后如果其他用戶提了類似的問題，問答系統就能夠快速給出對應的答案。以政務領域的問答系統為例，應用文本向量化方法ERNIE構建知識庫自動實時更新的問答系統。經過計算機實驗證明，提出的方法能夠實現知識庫自動實時更新，構建的問答系統具有自主學習與記憶功能，提高了任務型問答系統的智能化水平。

融合GhostNet的YOLOv5垃圾分類方法

摘要：垃圾分類是建設生態文明的重要一環，為解決重量級模型難以部署移動端設備的問題，提出基于YOLOv5網絡改進的垃圾圖像分類方法。采用融合GhostNet的主干網絡，用線性運算代替傳統卷積運算，降低了模型的參數量，提高了模型推理速度；通過在網絡中加入改進版通道注意力模塊，強化重要的通道特征，獲取更多深層次的特征信息；采用加權邊界融合方法，提升檢測框的定位精度。經實驗證明，該方法在自制數據集中較原模型的精度提高了8.5%，參數量減少了46.7%，平均推理速度提高了1.22 ms，實現了精度和推理速度的綜合提升。

基于RoBERTa和多層次特征的中文事件抽取方法

摘要：針對中文事件抽取中語義表征不充分、特征提取不全面等問題，提出一種基于RoBERTa和多層次特征的中文事件抽取方法。通過RoBERTa預訓練模型構建字向量，并基于詞性標注和觸發詞語義信息融入進行字向量擴展；其次使用雙向長短時記憶網絡和卷積神經網絡抽取全局特征和局部特征，并通過自注意力機制捕捉不同特征之間的關聯，加強對重要特征的利用；最后通過條件隨機場實現BIO序列標注，完成事件抽取。在DuEE1.0數據集上，觸發詞抽取和事件論元抽取的F1值達到86.9%和68.0%，優于現有常用事件抽取模型，驗證了該方法的有效性。

融合多教師模型的知識蒸餾文本分類

摘要：針對簡單文本分類模型精度不高，預訓練模型結構復雜，在實際環境中難以直接使用的問題，提出多教師知識蒸餾的文本分類方法。該模型使用“教師-學生網絡”的訓練方法，教師模型為BERT-wwm-ext和XLNet預訓練模型，將兩個模型輸出的概率矩陣通過權重系數融合為軟標簽。學生模型為BiGRU-CNN網絡，使用均方差函數計算軟標簽誤差，使用交叉熵損失函數計算硬標簽誤差，通過硬標簽和軟標簽訓練學生模型使損失函數值達到最小。實驗結果表明，提出的方法精度較學生模型有較大的改進，接近預訓練模型，在保證分類精度的前提下減少了運行時間，提高了效率。

一種基于深度學習模型的無人機巡檢輸電線路山火檢測方法

摘要：輸電巡檢圖像的背景復雜，目標檢測易受干擾，基于YOLOX神經網絡模型，提出一種輸電線路山火檢測方法。首先采用YOLOX的主干特征提取網絡框架，并將其中多尺度特征提取模塊的常規卷積替換為可變形卷積；其次在加強特征提取階段增加了通道注意力和空間注意力模塊的融合，能夠自適應火焰的外形多變特點，更加有效地提取到山火特征，從而提高目標檢測的準確率。經實驗驗證，所提方法能夠較為準確地檢測到山火，滿足日常巡檢的需求。

結合不確定性估計的輕量級人體關鍵點檢測算法

摘要：人體關鍵點檢測在智能視頻監控、人機交互等領域有重要應用。針對基于熱圖的人體關鍵點檢測算法依賴高分辨率熱圖、計算資源消耗大的問題，提出一種結合不確定性估計的輕量級算法。使用低分辨率熱圖，結合不確定性估計預測誤差分布的尺度參數，提高了預測結果的可信度；利用尺度參數監督和約束熱圖，緩解梯度消失，增強了網絡的魯棒性。COCO數據集上實驗結果表明，與積分姿態回歸算法相比，改進后算法的平均精度提高了3.3%，降低了資源占用。

基于多尺度注意力融合網絡的胃癌病理圖像分割方法*

摘要：近年來，隨著深度學習技術的發展，基于編解碼的圖像分割方法在病理圖像自動化分析上的研究與應用也逐漸廣泛，但由于胃癌病灶復雜多變、尺度變化大，加上數字化染色圖像時易導致的邊界模糊，目前僅從單一尺度設計的分割算法往往無法獲得更精準的病灶邊界。為優化胃癌病灶圖像分割準確度，基于編解碼網絡結構，提出一種基于多尺度注意力融合網絡的胃癌病灶圖像分割算法。編碼結構以EfficientNet作為特征提取器，在解碼器中通過對多路徑不同層級的特征進行提取和融合，實現了網絡的深監督，在輸出時采用空間和通道注意力對多尺度的特征圖進行注意力篩選，同時在訓練過程中應用綜合損失函數來優化模型。實驗結果表明，該方法在SEED數據集上Dice系數得分達到0.806 9，相比FCN和UNet系列網絡一定程度上實現了更精細化的胃癌病灶分割。

融入翻譯記憶庫的法律領域神經機器翻譯方法*

摘要：面向法律領域的神經機器翻譯對于合同文本翻譯等應用場景具有重要價值。由于法律領域雙語對齊語料稀缺，翻譯效果還不理想。針對該問題，目前有效的方法是融入翻譯記憶或翻譯模版等外部信息，但法律領域的文本多具有固定的表達結構且用詞準確規范，在翻譯記憶庫中同時利用翻譯結構信息和語義信息能夠進一步提升法律領域翻譯性能。基于此，提出一種融入翻譯記憶庫的法律領域機器翻譯方法。提出了一種新的法律領域翻譯記憶庫，首先基于語義和結構信息的相似性訓練跨語言檢索模型以充分利用單語數據，然后從翻譯記憶庫中檢索與輸入源句相關的一組翻譯記憶和翻譯模版，進而引導翻譯模型生成目標句子。實驗表明，在MHLAW數據集上，提出的方法可以使譯文較基線模型提升1.28個BLEU點。

基于改進Stacking集成分類算法的用戶用電信息異常識別

摘要：隨著電力用戶信息采集系統的發展，更豐富的用戶用電信息被用于用戶用電信息異常的識別。基于FDI攻擊進行虛假數據注入，構造用戶用電信息異常數據集，并提出了一種基于召回率的改進Stacking集成分類算法。該算法采用K-近鄰算法（k-Nearest Neighbors，KNN）、隨機森林模型（Random Forests，RF）、支持向量機（Support Vector Machine，SVM）以及梯度決策樹（Gradient Boosting Decision Tree，GBDT）作為Stacking結構的基分類模型；采用邏輯回歸（Logistic Regression，LR）作為Stacking結構的元分類模型。并基于召回率為基分類模型的輸出結果進行權值賦值，從而作為元分類模型的輸入數據集。通過實驗驗證，所提的基于召回率的改進Stacking集成分類算法相比于傳統Stacking集成分類算法擁有更高效的分類性能。

一種多教師模型知識蒸餾深度神經網絡模型壓縮算法

摘要：為了能將龐大的深度學習模型壓縮后部署到算力和存儲能力有限的設備中時盡可能減小精度損失，對知識蒸餾模型壓縮方法進行研究，提出了一種改進后帶篩選的多教師模型知識蒸餾壓縮算法。利用多教師模型的集成優勢，以各教師模型的預測交叉熵為篩選的量化標準篩選出表現更好的教師模型對學生進行指導，并讓學生模型從教師模型的特征層開始提取信息，同時讓表現更好的教師模型在指導中更具有話語權。在CIFAR100數據集上的VGG13等分類模型實驗結果表明，與其他壓縮算法相比在最終得到的學生模型大小相同的情況下，精度上有著更好的表現。

基于點云補全的三維目標檢測

摘要：LiDAR技術的發展為自動駕駛提供了豐富的3D數據。然而，由于遮擋和某些反射材料的原因引起信號丟失，LiDAR點云實際上是不完整的2.5D數據，這對 3D 感知提出了根本性挑戰。針對這一問題，提出對原始數據進行三維補全的方法。根據大多數物體形狀對稱且重復率高的特點，通過學習先驗對象形狀的方法估計點云中遮擋部分的完整形狀。該方法首先識別被遮擋和信號缺失影響的區域，在這些區域中預測區域所包含對象形狀的占用概率。針對物體間遮擋的情況，通過形狀的占用概率和共享同類形狀形態進行三維補全。對自身遮擋的物體，通過自身鏡像進行恢復。最后通過點云目標檢測網絡進行學習。結果表明，通過該方法能有效地提高生成點云3D邊框的mAP（mean Average Precision）。

一種乳腺X線影像腫塊的多特征融合檢測算法

摘要：針對在單視圖的乳腺腫塊檢測算法中漏檢率和假陽性率較高的問題，提出了一種改進的自動檢測算法。將擴張殘留網絡（Dilated Residual Network，DRN）結合重新設計的特征金字塔網絡（Feature Pyramid Network，FPN）用于對乳腺腫塊的檢測。首先利用DRN中的膨脹卷積，減少對圖像的下采樣次數；再擴充網絡的深度，使其輸出滿足FPN所需的輸入；在FPN結構中，采用注意力機制降低不同特征圖直接融合所造成的信息損失，同時采用密集連接代替原有的橫向連接，充分融合淺層特征中目標的位置和細節信息。仿真實驗顯示，所設計的模型在CBSI-DDSM數據集上的檢測精度相比于基準模型提升了7.1%。

基于Hammerstein-Wiener模型的CSTR反應器辨識

摘要：針對化工過程中廣泛應用的連續攪拌反應釜（CSTR）反應器，提出一種新的基于極限學習機的Hammerstein-Wiener模型的辨識建模方法。其中，Hammerstein-Wiener模型的兩個非線性環節采用兩個不同的極限學習機逼近，線性環節采用自回歸ARX模型。因極限學習機的特殊結構，此模型可以表示成線性回歸的形式，最終利用廣義最小二乘法求解模型的參數。此方法辨識過程簡單，辨識過程的計算量較小。最后對CSTR的辨識結果表明，在相同條件下與基于多項式的Hammerstein 模型和ARX-LSSVM Hammerstein 模型相比，該方法具有較高辨識精度，表明了該方法的有效性。

基于OpenMV的共享單車規范停車檢測

摘要：為了解決城市中共享單車亂停亂放的問題，提出了一種基于OpenMV的共享單車規范停車系統。系統主要由OpenMV開發板、BC20通信定位模塊以及OneNET云服務器等組成。其中OpenMV完成對停車狀態的檢測與識別，借助BC20內置的網絡模塊與OneNET云服務器進行數據交互，并將檢測結果反饋至小程序客戶端，從而實現對共享單車的停車檢測和控制。系統通過大量的測試，實驗結果表明系統運行穩定，識別準確率為94.1%，可以實現共享單車的規范停車自動檢測，具有良好的市場應用前景與價值。

基于單頁語義特征的垃圾網頁檢測

摘要：為解決垃圾網頁檢測中特征提取難度高、計算量大的問題，提出一種僅基于當前網頁的HTML腳本提取語義特征的方法。首先使用深度優先搜索和動態規劃相結合的記憶化搜索算法對域名進行單詞切割，采用隱含狄利克雷分布提取主題詞，基于Word2Vec詞向量和詞移距離計算3個單頁語義相似度特征；然后將單頁語義相似度特征融合單頁統計特征，使用隨機森林等分類算法構建分類模型進行垃圾網頁檢測。實驗結果表明，基于單頁內容提取語義特征融合單頁統計特征進行分類的AUC值達到88.0%，比對照方法提高4%左右。

基于動態圖卷積的點云補全網絡

摘要：大多數傳統的深度學習點云補全學習方法僅僅使用了全局特征而忽略了局部特征，為了更好地提取和使用點云的局部特征，提出了一個基于深度學習的端到端點云補全網絡。在點云補全網絡（PCN）的基礎上，編碼部分引入針對局部特征改進的動態圖卷積（DGCNN），使用多個不同維度的邊卷積提取較為豐富的局部特征，并按照距離弱化遠點的特征；然后用深度殘差網絡連接的思想優化網絡結構以實現多尺度特征的融合，并加入平均池化彌補全局池化造成的信息損失；在解碼部分引入折疊網絡（FoldingNet），使輸出的點云更加完整。實驗結果表明，該點云補全網絡相對PCN等點云補全網絡有部分提升，驗證了新方法的有效性。

面向臨床決策支持系統的醫療文本分析模型

摘要：醫療文本的特征提取及分析在建設臨床決策支持系統方面具有較大的實用價值。針對包含各種術語和縮寫的原始醫療文本難以提取特征的情況，提出了一種基于BERT與Word2vec的醫療文本分析模型。該模型對醫療病歷中關鍵醫療實體進行識別，基于知識建立權重評分機制，對醫學文本進行語義分析。實驗數據表明，模型在醫療文本特征提取方面具有一定優勢，對高血壓性腦出血病歷的分析診斷性能良好，能有效應用于臨床決策支持系統。

基于增強語義信息理解的場景圖生成

摘要：場景圖生成（SGG）任務旨在檢測圖像中的視覺關系三元組，即主語、謂語、賓語，為場景理解提供結構視覺布局。然而，現有的場景圖生成方法忽略了預測的謂詞頻率高但卻無信息性的問題，從而阻礙了該領域進步。為了解決上述問題，提出一種基于增強語義信息理解的場景圖生成算法。整個模型由特征提取模塊、圖像裁剪模塊、語義轉化模塊、拓展信息謂詞模塊四部分組成。特征提取模塊和圖像裁剪模塊負責提取視覺特征并使其具有全局性和多樣性。語義轉化模塊負責將謂詞之間的語義關系從常見的預測中恢復信息預測。拓展信息謂詞模塊負責擴展信息謂詞的采樣空間。在數據集VG和VG-MSDN上與其他方法進行比較，平均召回率分別達到59.5%和40.9%。該算法可改善預測出來的謂詞信息性不足問題，進而提升場景圖生成算法的性能。

基于CNN的智慧農場圖像分類方法

摘要：為解決新疆兵團農業現代化建設中有感知無決策的問題，提出一種基于注意力機制模塊（SENet）與卷積神經網絡混合模型遷移學習的圖像分類方法（TL-DA-SE-CNN）。該方法選擇4種不同的CNN模型進行權重采集，包括VGGNet、ResNet、InceptionNet和MobileNet。模型使用SENet分類器代替卷積神經網絡的全連接層，提取圖像的結構性高階統計特征進行主題分類，并使用BP算法進行參數調整，分類準確度達98.20%。實驗結果表明，將CNN與遷移學習、數據增強和SENet相結合的技術提高了牲畜圖像分類的性能，是卷積神經網絡在農場自動化分群中的有效應用。

基于改進TOPSIS模型的出租車運營決策優化方法

摘要：以降低出租車運營損失為目標，分別利用排隊論對司機等待的平均時間成本進行量化，以及通過熵值法改進的TOPSIS模型對不同時段載客可能性進行量化，進而完成空載潛在損失參數的量化，通過量化指標構建出出租車運營損失模型，并基于此模型給出了降低損失的運營決策方法。引用洛陽北郊機場航班及出租車數據的驗證，證明了該決策方法能夠有效降低出租車的運營損失。

基于YOLOX融合自注意力機制的FSA-FPN重構方法

摘要：隨著目前目標檢測任務輸入圖像分辨率的不斷增大，在特征提取網絡的感受野不變的情況下，網絡提取的特征信息會越來越局限，相鄰特征點之間的信息重合度也會越來越高。提出一種FSA（Fusion Self-Attention）-FPN，設計SAU（Self-Attention Upsample）模塊，SAU內部結構通過CNN與自注意力機制（Self-Attention）進行交叉計算以進一步進行特征融合，并通過重構FCU（Feature Coupling Unit）消除二者之間的特征錯位，彌補語義差距。以YOLOX-Darknet53為主干網絡，在Pascal VOC2007數據集上進行了對比實驗。實驗結果表明，對比原網絡的FPN，替換FSA-FPN后的平均精度值mAP@［.5：.95］提升了1.5%，預測框的位置也更為精準，在需要更高精度的檢測場景下有更為出色的使用價值。

基于深度學習的變壓器故障信號識別算法

摘要：針對變壓器結構復雜、維護成本高等特點，提出一種基于深度學習的變壓器故障信號識別算法。首先分析變壓器工作狀態下的聲紋信號并進行二維圖像信號的轉換，利用VGG16神經網絡在圖像中的優勢，并在此基礎上提出一種MCA注意力機制，該注意力機制能夠同時保留背景信息和細節信息；其次對VGG16中的最大池化下采樣進行優化，采用一種軟池化的采樣方法，減少圖像中最大池化下采樣帶來的特征損失；最后為避免過擬合現象的發生，將VGG16頂層結構中的激活函數進行優化，引用可以自歸一化的SELU激活函數。實驗證明，廣義S變換是將一維時域信號轉換為二維圖像信號的最佳選擇，所提算法對于6類故障信號的平均識別率達到99.15%。

一種深度神經網絡的分布式訓練方法

摘要：深度神經網絡在高維數據的分類和預測中取得了巨大成功。訓練深度神經網絡是數據密集型的任務，需從多個數據源收集大規模的數據。這些數據中通常包含敏感信息時，使得深度神經網絡的訓練過程容易泄露數據隱私。針對訓練過程中的數據隱私和通信代價問題，提出了一種深度神經網絡的分布式訓練方法，允許基于多個數據源共同訓練深度神經網絡。首先，提出了分布式訓練架構，由1個計算中心和多個代理組成。其次，提出了基于多代理的分布式訓練算法，允許代理在數據不出本地和減少通信代價的情況下，通過切割深度神經網絡，實現分布式地共同訓練模型。然后，分析了算法的正確性。最后，實驗結果表明該方法是有效的。

機器人與LoRa的普鐵接觸網狀態監測系統設計

摘要：為提升普鐵接觸網檢修作業時的安全性以及傳輸信息的抗干擾性，設計了一套基于人工智能機器人技術加LoRa通信技術的普鐵接觸網狀態監測系統。該系統主要由在作業現場內具有驗電、掛接地線與回流線功能的機器人作為數據采集裝置和作業現場外對狀態信息的傳遞、處理以及在終端實現可視化監測的模式構成。經過監測模擬測試，機器人數據采集抗干擾結果符合預期，同時LoRa網關與云服務器數據傳輸正常，PC端可實現監測狀態信息可視化查看。

基于改進BERT-BiGRU模型的文本情感分類研究

摘要：針對目前網絡評論文本情感分類準確性不高的問題，提出一種基于BERT和雙向門控循環單元（BiGRU）的改進模型，使用能夠表征文本豐富語義特征的BERT模型進行詞向量表示，結合能夠長期保留文本上下文關聯信息的BiGRU神經網絡提高模型的分類效果，并在此基礎上引入注意力機制，突出文本中更能表達分類結果的情感詞權重，提高情感分類的準確率。將上述模型分別在Acllmdb_v1和酒店評論兩個公開數據集上進行測試，實驗結果表明，該模型在中、英文文本情感分類任務中都獲得了良好的性能。

基于Darknet23和特征融合的交通標志檢測方法

摘要：道路交通標志檢測是智能交通的重要環節之一，針對交通標志檢測存在背景復雜、目標較小、檢測速度慢等問題，選取工業界青睞的YOLOv3模型提出一種改進的檢測方法。利用雙向特征金字塔結構實現圖像低、中、高層特征語意信息的雙向融合，提升低層預測目標的分類和高層預測目標的定位能力；將原模型的主干特征提取網絡進行改進，提出Darknet23網絡，以提高網絡的提取能力和減少計算量；根據目標形狀的特點，使用K-means聚類算法得到用于訓練合適的錨點框，并在邊框回歸中引入靈活性更強的L_(α-CIOU)損失函數，使網絡朝著預測框與真實框重疊度較高的方向去優化。實驗結果表明，該方法在CCTSDB數據集上mAP@0.75達到86.10%、mAP@0.5：0.05：0.95達到70.017%，相比原網絡分別提升10.17％和5.656％，參數量減少3 622 091，速度提升8.27 f/s，且優于SSD和Faster RCNN等主流的檢測網絡。

基于BERT-CNN的新聞文本分類的知識蒸餾方法研究

摘要：近年來，隨著大數據時代進入人類的生活之后，人們的生活中出現很多無法識別的文本、語義等其他數據，這些數據的量十分龐大，語義也錯綜復雜，這使得分類任務更加困難。如何讓計算機對這些信息進行準確的分類，已成為當前研究的重要任務。在此過程中，中文新聞文本分類成為這個領域的一個分支，這對國家輿論的控制、用戶日常行為了解、用戶未來言行的預判都有著至關重要的作用。針對新聞文本分類模型參數量多和訓練時間過長的不足，在最大限度保留模型性能的情況下壓縮訓練時間，力求二者折中，故提出基于BERT-CNN的知識蒸餾。根據模型壓縮的技術特點，將BERT作為教師模型，CNN作為學生模型，先將BERT進行預訓練后再讓學生模型泛化教師模型的能力。實驗結果表明，在模型性能損失約2.09%的情況下，模型參數量壓縮約為原來的1/82，且時間縮短約為原來的1/670。

基于深度學習的詞語級中文唇語識別

摘要：在無聲或噪聲干擾嚴重的環境下，或對于存在聽覺障礙的人群，唇語識別至關重要。針對詞語級中文唇語識別的問題，提出了SinoLipReadingNet模型，前端采用Conv3D+ResNet34結構用于時空特征提取，后端分別采用Conv1D結構和Bi-LSTM結構用于分類預測，并引入Self-Attention、CTCLoss對Bi-LSTM后端進行改進。最終在新網銀行唇語識別數據集上進行實驗，結果表明，SinoLipReadingNet模型在識別準確率上明顯優于中科院D3D模型，多模型融合的預測準確率達到了77.64%，平均字錯率為21.68%。

融合輕量化與梯形結構的學生行為檢測算法

摘要：為了解決常見目標檢測算法在課堂場景中難以有效應用的問題，提出了一種融合輕量化與梯形結構的學生行為檢測算法。該算法基于YOLOv4架構，針對目標分類和分布空間的特點，提出一種新的“梯”形特征融合結構，并結合MobileNetv2思想，優化模型參數得到梯形-MobileDarknet19特征提取網絡，既減少了網絡的計算量，提高了工作效率，同時加強了目標特征的信息傳輸，提升了模型學習能力；在尺度檢測階段引入5層的DenseNet網絡，增強網絡對小目標的檢測能力。實驗結果表明，提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%，相比于其他主流算法，在學生課堂行為檢測任務中具有較好的實用性。

關聯動態特征的目標自適應跟蹤算法

摘要：在復雜的靶場試驗場景中，試驗現場常常涉及揚塵、強光、遮擋等多變的自然環境。針對這種情況下快速運動的目標物體跟蹤，提出了一種關聯動態特征的單目標跟蹤算法。首先使用門控循環單元(Gated Recurrent Unit，GRU)提取待跟蹤目標的時序動態特征，獲得候選處理目標框集合；然后利用卷積網絡(Convolutional Neural Network，CNN)提取候選目標框的深度卷積特征并確定目標位置，同時分離出背景卷積特征；在跟蹤過程中，使用分離出的背景卷積特征圖對網絡進行參數更新，增強網絡的魯棒性與自適應性。實驗結果表明，所提出的算法可以對靶場圖像采集系統中的被試移動目標進行自適應跟蹤，并且在復雜環境背景下算法仍能保持優異的魯棒性與適應性。

基于動態圖注意力聚合多跳鄰域的實體對齊

摘要：實體對齊是實現對不同來源知識庫進行融合的重要技術方法，在知識圖譜、知識補全領域具有廣泛應用。現有基于圖注意力的實體對齊模型多使用靜態圖注意力網絡且忽略了實體屬性中的語義信息，導致模型存在有限注意、難以擬合、表達能力不足等問題。針對這些問題，開展基于動態圖注意力結構建模實體對齊方法研究，首先使用圖卷積層建模目標實體的單跳節點表示，其次應用動態圖注意力網絡獲得多跳節點注意力系數并建模，再次利用逐層門控網絡聚合圖卷積層與動態圖注意力層輸出的單跳、多跳節點信息，最后拼接通過外部知識預訓練自然語言模型提取的實體名稱屬性嵌入并進行相似度計算。該方法在DBP15K的三類跨語言數據集中都獲得了一定的提高，證明了應用動態圖注意力網絡與融入實體屬性語義在提高實體表示能力上的有效性。

基于DBN-BP深度算法的熱軋板帶橫斷面預測

摘要：隨著各工業領域的快速發展，市場對薄規格、高強度板帶產品的需求快速增加。而熱軋板帶橫斷面形狀是熱軋板帶產品質量的主要評價指標。基于數據挖掘技術，對軋機數據庫中的數據進行分析與處理，其中數據挖掘技術采用深度置信網絡(Deep Belief Neural，DBN)和BP(Back Propagation)算法相結合，構建板帶橫向厚度分布的預測模型。DBN-BP算法由多個限制玻爾茲曼網絡(Restricted Botlzmann Machine，RBM)逐層堆疊而成，并使用無監督的逐層訓練的方式得到網絡的權值矩陣和偏置供BP算法使用，而BP算法通過誤差反向傳播的方式對整個網絡進行微調。該方法克服了BP算法因隨機初始化權值參數而陷入局部最優和訓練時間長的缺點。通過與BP算法相比較可知，采用DBN-BP方法預測終軋道次穩定軋制時板帶中點厚度誤差在±5.6 μm范圍內的概率可達95%；而BP算法的預測誤差范圍為±11 μm。并且通過對板帶橫斷面形狀的預測結果分析可知，相比于BP算法，DBN-BP深度學習方法對于板帶邊部厚度的預測更具有優勢。

基于加權KNN算法的腦電信號情緒識別

摘要：情緒與人類的行為、家庭及社會密切相關。情緒不僅能反映人類的各種感覺、思想和行為，而且也是各種外部刺激所產生的心理和生理反應，所以在很多領域中對情緒的正確識別十分重要。情緒的變化會導致腦電圖(EEG)信號發生變化，反之，這些變化也反映了情緒狀態。基于DEAP數據庫，對EEG信號進行時域特征和頻域特征提取，通過PCA主成分分析法對特征進行降維處理。利用加權KNN算法進行5折交叉驗證訓練，最終對興奮(excited)、放松(relaxed)、沮喪(depressed)、憤怒(angry)4種情緒狀態的識別準確率達到80%。

基于人機交互的智能電臺系統的設計與實現

摘要：在信息化戰爭中，人機交互在指揮控制裝備中的應用日益廣泛。采用語音識別方式代替鍵盤、旋鈕、按鍵等方式更改電臺參數，使其操作更智能化、更便捷。本系統將LD3320語音識別芯片采集到的語音進行處理，通過主控芯片STM32F407發送相關協議控制電臺的系列操作。通過實驗表明，該系統在語音識別識別率達到95%左右，能實現對電臺的改頻、開關等操作。

基于邊緣計算的局部放電模式識別

摘要：局部放電是設備處于高電場強下，由于電場分布不均而導致的絕緣介質放電現象，設備產生局部放電對于絕緣層的危害很大，迅速檢測識別設備的放電類型是工業正常運作的保障。針對電氣設備局部放電類型識別問題，考慮到電氣設備監測系統在診斷識別方面的時效性及精度，提出了基于邊緣計算的局部放電模式識別方法，利用邊緣計算架構的優勢，基于云層訓練、邊緣推理思路，將復雜的識別算法訓練優化過程部署在云層，將計算量大的識別算法卸載到邊緣層，而計算量小的特征提取保留在終端設備層處理。通過構造局部放電相位分布譜圖提取局部放電的統計特征參數，采用粒子群優化算法對廣義回歸神經網絡模型進行優化，最后將統計特征參數作為神經網絡的輸入量，對放電類型進行識別。結果表明，所提模式識別方法識別準確率高，識別效率高。

融合用戶行為和評論文本的圖神經網絡推薦

摘要：現有的基于圖神經網絡的推薦算法能夠利用圖結構信息使得推薦效果得到較好的提升，但主要的圖結構都是圍繞著用戶和項目的一種交互，卻忽略了用戶的多種行為，如點擊、收藏、分享、加入購物車等都表達著用戶不同的語義；又如評論信息，可能影響著該類型物品的下一次購買意圖。為此提出一種基于用戶行為和評論信息的圖神經網絡推薦算法，算法通過圖卷積網絡學習用戶行為的強度及語義，再利用評論文本圖表示學習評論中用戶和商品的偏好，最后進行融合提升推薦效果。實驗結果表明，該算法對于推薦效果有一定的提升。

基于XGBoost與LightGBM集成的電動汽車充電負荷預測模型

摘要：隨著電動汽車規模化發展，充電站負荷對電網造成一定影響，為保障電網平穩運行，提出一種基于極端梯度提升(eXtreme Gradient Boosting，XGBoost)與輕量級梯度提升機(Light Gradient Boosting Machine，LightGBM)融合的電動汽車充電負荷預測模型。該方法運用Stacking集成學習的策略：首先根據時間特征與歷史負荷數據采用XGBoost與LightGBM算法構建負荷預測的基學習器，然后采用嶺回歸(Ridge Regression，RR)算法將基學習器的輸出結果進行融合之后輸出負荷預測值。為了對比多種不同的負荷預測模型，采用上海市嘉定區的充電站訂單數據進行試驗，結果表明，該方法所構建的負荷預測模型相比單一算法模型具有更高的預測準確度，對電網平穩運行有一定理論及實用價值。

極化SAR影像地物智能分類技術進展

摘要：對基于極化SAR影像的地物分類技術發展進行歸納與總結。首先提出地物分類技術的價值需求和應用特點，對其所要解決的科學問題進行歸納；其次總結分析極化SAR影像分類的一般技術流程；進一步對國內外研究現狀與技術算法特點進行分類梳理，提出其在理論方法與地物分類應用中的技術優缺點，尤其對基于人工智能理論的極化SAR影像地物分類技術進行探討；最后結合SAR遙感的發展趨勢，指出未來極化SAR影像地物智能分類技術的研究方向。

一種基于深度強化學習的任務卸載方法

摘要：隨著車聯網的快速發展，車載應用大多是計算密集和延遲敏感的。車輛是資源受限的設備，無法為這些應用提供所需的計算和存儲資源。邊緣計算通過將計算和存儲資源提供給網絡邊緣的車輛，有望成為滿足低延遲需求的有效解決方案。這種將任務卸載到邊緣服務器的計算模式不僅可以克服車輛資源的不足，還可以避免將任務卸載到云可能導致的高延遲。提出了一種基于深度強化學習的任務卸載方法，以最小化任務的平均完成時間。首先，把多任務卸載決策問題規約為優化問題。其次，使用深度強化學習對優化問題進行求解，以獲得具有最小完成時間的優化卸載策略。最后，實驗結果表明，該方法的性能優于其他基準方法。

基于YOLOv3-tiny的視頻監控目標檢測算法

摘要：目標檢測算法在視頻監控領域有著較大的實用價值。針對當前在資源受限的視頻監控系統中實現實時目標檢測較為困難的情況，提出了一種基于YOLOv3-tiny改進的目標檢測算法。該算法在YOLOv3-tiny架構的基礎之上，通過添加特征重用來優化骨干網絡結構，并提出全連接注意力混合模塊來學習到更豐富的空間信息，更適合資源約束條件下的目標檢測。實驗數據表明，該算法相比于YOLOv3-tiny在模型體積降低39.2%，參數量降低39.8%，且在VOC數據集上提高了2.7%的mAP，在提高檢測精度的同時顯著降低了模型資源占用。

基于YOLOv5l的囊型肝包蟲病病灶檢測研究

摘要：針對臨床醫生在診斷肝包蟲病時需要通過個人經驗判斷囊型肝包蟲病分型，研究基于目標檢測算法的肝包蟲病灶自動檢測與分類模型，實現對肝包蟲病超聲影像的自動識別與分類。使用YOLOv5l模型作為囊型肝包蟲病病灶目標檢測的模型，利用本地肝包蟲病超聲影像數據集對網絡模型進行訓練。基于YOLOv5l模型與隨機梯度下降算法(SGD)優化算法的肝包蟲病病灶自動檢測分類模型可以很好地對5種類型的病灶進行有效的檢測，平均精度均值(mAP)為88.1%，經過測試，該模型的測試速度可達40 f/s。實驗結果表明，基于YOLOv5l與SGD算法的肝包蟲病病灶自動檢測分類模型能夠較好地識別病灶的具體位置，可以很好地輔助醫生診斷肝包蟲病。

基于改進YOLOv5的車輛屬性檢測

摘要：車輛屬性檢測是一個基礎任務，其屬性檢測結果可以被應用到很多下游的交通視覺任務。提出了一種基于YOLOv5的車輛屬性檢測改進算法。針對檢測目標較小的問題，加入了卷積注意力模塊，讓網絡模型把更多的注意力放在小目標對象上；針對數據集樣本種類較少的問題，改進了YOLOv5的馬賽克數據增強方式；使用自門控激活函數Swish，起到抑制噪聲、加快收斂速度并提升模型魯棒性的作用。此外，還在公開車輛數據集VeRi-776的基礎上進行了詳細的車輛屬性標注，構建了一個車輛屬性數據集。實驗結果表明，改進后的算法比原始YOLOv5的平均精確率提升了4.6%，能夠準確地檢測到車輛圖像的通用屬性，可以供下游任務使用。

基于SGCN的化合物致癌性預測模型

摘要：癌癥患者的激增引起了全世界的關注，許多研究者將目光放在了對化合物致癌性的評估上，但這是一項極其具有挑戰性的任務。本實驗獲取了341種實驗數據，利用三維圖卷積網絡(SGCN)，建立了對化合物致癌性的預測模型。結果表明：對化合物進行致癌性預測的SGCN分類模型準確率高達96.9%，比其余模型效果更好，這表明SGCN模型能夠準確地對化學品進行分類，并且在實際應用中具有相當大的潛力。

基于改進BCCSA和深層LSTM的空氣質量預測方法

摘要：現有的空氣質量預測方法很少考慮季節性因素，且預測的效果不佳，因此提出一種基于改進二元混沌烏鴉搜索算法(Binary Chaotic Crow Search Algorithm，BCCSA)和深層長短期記憶神經網絡(Long Short Term Memory，LSTM)的空氣質量預測方法。首先提出季節調整的方法對收集的原始空氣質量數據進行預處理，以消除季節對預測的影響；然后提出改進BCCSA，對空氣質量數據進行優化處理；最后，將自注意力機制加入到深層LSTM中，對空氣質量數據進行預測。實驗結果表明，該方法能有效地提高空氣質量的預測精度。

基于支持向量機和PCA的腦電α波運動想象分類研究

摘要：針對腦電信號(EEG)運動想象分類過程中弱相關特征量影響分類準確度的問題，提出一種篩選方法，該方法是基于α波和主成分分析(PCA)算法的。基于腦機接口(BCI)系統，通過聽覺誘發刺激產生向左和向右兩種運動想象任務對應的腦電信號，并對其做小波包分解處理，然后進行腦電α頻段信號的重構，從而提取出α波形并對其進行統計特征提取。再結合PCA技術和支持向量機(SVM)方法，實現弱相關特征的剔除和特征分類。根據篩選后的數據進行分類，所得結果準確率更高，信號分類的準確度由90.1%提高至94.0%。

面向多說話人分離的深度學習麥克風陣列語音增強

摘要：隨著近年來人機語音交互場景不斷增加，利用麥克風陣列語音增強提高語音質量成為研究熱點之一。與環境噪聲不同，多說話人分離場景下干擾說話人語音與目標說話人同為語音信號，呈現類似的時、頻特性，對傳統麥克風陣列語音增強技術提出更高的挑戰。針對多說話人分離場景，基于深度學習網絡構建麥陣空間響應代價函數并進行優化，通過深度學習模型訓練設計麥克風陣列期望空間傳輸特性，從而通過改善波束指向性能提高分離效果。仿真和實驗結果表明，該方法有效提高了多說話人分離性能。

一種基于改進的馬爾可夫鏈的交通狀況預測模型

摘要：城市交通日益擁堵的今天，為用戶推薦最快行駛路線成為一個研究熱點。行駛路線推薦的核心問題是對路線將來某段時間(途徑這段線路時)交通狀況的預測。交通狀況受到路線本身狀況、行駛時間、天氣狀況、駕駛員習慣等多種因素影響，其變化快、變化方式復雜，難以準確預測。對多階馬爾可夫鏈模型進行了改進，提高了運算效率和響應速度，建立一種高效的交通狀況預測模型，經北京市實際交通數據的檢驗，得到了比較好的預測效果。

基于深度學習的口罩佩戴檢測與跟蹤

摘要：佩戴口罩可以有效預防病毒的傳播，為減少通過人工方式檢查口罩佩戴情況所消耗的大量人力資源，提出一種基于深度學習的口罩佩戴檢測與跟蹤方法，該方法分為檢測和跟蹤兩個模塊。檢測模塊在YOLOv3網絡的基礎上引入空間金字塔池化結構，實現不同尺度的特征融合；然后將損失函數改為CIoU損失，減少回歸誤差，提升檢測精度，為后續跟蹤模塊提供良好的條件。跟蹤模塊采用多目標跟蹤算法Deep SORT，對檢測到的目標進行實時跟蹤，有效防止重復檢測，改善被遮擋目標的跟蹤效果。測試結果表明，該方法的檢測速度為38 f/s，平均精度值達到為85.23%，相比原始YOLOv3算法提高了4%，能達到實時檢測口罩佩戴情況的效果。

面向水下目標的雙目視覺測距方法

摘要：針對水下機器人對于探測海洋具有的高靈敏度、低成本、易攜帶特點的要求，設計和實現面向水下目標的雙目視覺測距檢測方法。采用張正友標定算法，通過使用9×9棋盤獲取水下雙目相機的內外矩陣模型的參數，采用SGBM(Semi-Global Block Matching)立體匹配算法，增強了圖像的對比度，削弱了圖像色斑的影響，保證了算法的魯棒性，提升了匹配搜索速度。將視差圖通過矩陣運算轉化成深度圖，并將其映射成可視化點云，構建目標物體的三維立體信息。

基于混合聚類與融合用戶興趣的協同過濾推薦算法

摘要：推薦效率低、推薦質量有待提高等問題普遍存在于傳統協同過濾推薦算法中，為了改善并解決這些問題，在協同過濾推薦算法中將混合聚類與用戶興趣偏好融合，經過驗證推薦質量有顯著提升。首先根據用戶的個人相關信息構建Canopy+bi-Kmeans的一種多重混合聚類模型，采用提出的混合聚類模型把所有用戶劃分成多個聚類簇，將每個用戶的興趣偏好融合到生成的聚類簇中，形成新的相似度計算模型；其次利用基于TF-IDF算法的權重歸類方法計算用戶對標簽的權重，并使融入時間系數的指數衰減函數捕捉用戶興趣偏好隨時間的變化；最后使用加權融合將用戶偏好和混合聚類模型相結合，匹配到更相似的鄰居用戶，計算出項目評分并進行推薦。利用公開數據集對比實驗證明，提出的方法能夠提高推薦質量和推薦可靠性。

面向船載遠程會議的麥克風陣列高精度DOA估計

摘要：隨著船舶智能化水平提高，船載遠程會議系統對提高應急處理能力、推進船岸一體化網絡建設有重要意義，麥克風陣列是保證遠程會議系統語音效果和支持多模態交互的重要語音前端。但船舶艙室狹小尺寸一方面導致只能采用小尺寸麥陣，另一方面小艙室導致的強混響以及嘈雜艙室噪聲也使傳統麥克風陣列算法性能嚴重下降。考慮船舶艙室復雜環境下小尺寸麥陣DOA估計場景，提出了一種輕量級Mask-DOA估計神經網絡模型。該方法在DOA估計神經網絡引入Mask算法降低噪聲和混響的干擾，并提取增強后的GCC-PHAT作為網絡特征，從而在小尺寸麥陣上實現高精度DOA估計。仿真和實驗結果表明，所提出的Mask-DOA模型面對復雜的船舶艙室環境更魯棒，泛化能力更強。

標簽結合現實場景的交通標志分類檢測研究

摘要：交通標志在車輛的安全行駛和自動駕駛中都有著大量的研究。由于交通標志的種類繁多且受各種因素的影響，交通標志的分類檢測也是一個具有挑戰的難題。為此，提出了一種標簽結合現實道路場景的交通標志分類檢測方法，該方法分為數據生成部分和目標檢測部分。實驗結果表明，利用該方法生成訓練數據，能夠有效地訓練深度卷積神經網絡，實現現實場景交通標志的分類檢測，并且優化的檢測模型相比文中提到的模型具有更小的體積和更快的速度。

基于全連接神經網絡的車輛短預瞄電磁導引方案

摘要：電磁導引是一種車輛自動導引方案，廣泛應用于工業、物流等領域。為解決現有電磁導引方案對車輛機械結構要求較高、易受傳感器預瞄距離短的限制、難以應用于小型自動導引車輛的問題，提出了一種基于全連接神經網絡的導引方案。通過數據分析尋找有限預瞄距離內的最優傳感器排布方案，設計和訓練全連接神經網絡模型，對車身姿態及車后道路的信息進行全面預測，以彌補傳感器短預瞄所造成的前向道路探測能力的不足。經模擬和實際測試，該方案能極大改善較小體積車輛的短預瞄電磁導引系統的控制效果，實現車輛的穩定快速運行。

基于雙向GRU模型的網絡流量預測的研究

摘要：當前使用門控循環單元(Gated Recurrent Units，GRU)神經網絡進行流量預測時，普遍存在滯后性以及預測準確性不高的問題，因此提出一種改進的GRU模型進行流量預測的方法。首先基于GRU神經網絡提出一種雙向GRU神經網絡和人工神經網絡堆疊的網絡模型，適用于流量特征、時間特征、事件特征等多維向量的輸入；同時為解決部分時間段準確度不高的問題，將訓練樣本進行日期分類，針對每一類日期生成單獨的網絡模型，能大幅提升預測的準確度以及改善預測的滯后性。最后，為了提升流量峰值的預測準確度，采用樣本的再平衡手段以及自定義損失函數，實驗結果表明，能較好地達成預期目標。

基于深度殘差神經網絡的博彩網頁識別算法設計

摘要：互聯網對人民群眾的生活和工作產生了重要影響，然而網絡空間中隱藏著大量有害的博彩網站或賭博網站，很容易給網民造成損失和困擾，甚至可能擾亂社會秩序，因而研究對此類網站進行高效識別的方法具有重要意義。提出利用深度殘差神經網絡解決博彩類網頁識別問題，基于深度殘差網絡的原理設計了算法GamblingRec。經驗證，算法準確率達到了95.16%,正樣本召回率為93.21%，表明基于深度殘差神經網絡的方法能夠用于博彩類網頁識別，并能達到較高的識別性能。

基于YOLOv5的姿態交互球類陪練機器人

摘要：針對當下球類陪練機器人人機交互能力不足的問題，提出一種基于樹莓派和YOLOv5目標檢測算法的新型人機交互模式，使機器人實現前進、后退、左移、右移、拋球、踢球6種不同的動作；通過對在3種不同環境(室內、室外晴天、室外陰天)下搜集的人體姿態數據集進行標定、訓練后，得到6種姿態在3種環境中測試集上的識別準確率分別為：室內96.33%、室外晴天95%、室外陰天94.3%。相比基于特征匹配和其他利用手勢等小目標檢測的算法，基于該算法的機器人具有更高的檢測速度和準確性，使機器人更加智能化。

基于深度學習的智能垃圾分揀車系統

摘要：針對生活垃圾的高效分類及搬運處理，設計了一款以邊緣嵌入式AI設備Jetson Nano為控制器的光電智能小車系統，該系統設計以YOLOv5為目標檢測算法，以Pytorch1.8.1為深度學習框架。使智能小車從指定區域出發，通過自身的光電傳感器在指定范圍內搜尋垃圾，利用六軸機械臂對垃圾進行分揀并送到指定分類地點。對采集到的5 048張圖片(包括5種垃圾類別)進行300次的迭代訓練，實驗測試結果表明：平均精確度達到91.8%，準確率達到94.5%，召回率達到89.03%。

基于VGG16網絡的人臉情緒識別

摘要：近年來，如何通過人工智能對人的面部表情進行識別分析成為一個研究熱點，利用人工智能可以快速地分析人的面部情緒，并以此為基礎進行進一步研究。在深度學習中，傳統的卷積神經網絡存在對面部表情特征的提取不充分以及計算機參數量較大的問題，導致分類準確率較低。因此，提出了基于VGG16網絡的人臉表情識別算法，通過與InceptionV3、InceptionResNetV2、ResNet50等模型實驗對比，結果表明，VGG16神經網絡在FER2013PLUS測試數據集上的識別準確率為79%，準確率比傳統的卷積神經網絡高。

改進型DSSD算法在道路損傷檢測中的應用研究

摘要：在自動檢測中，由于道路損傷數據集存在小目標損傷難檢測與類別不平衡問題，導致道路損傷檢測的準確率低、虛假率高。為此，在DSSD(Deconvolutional Single Shot Detector)網絡模型的基礎上，提出一種結合注意力機制和Focal loss的道路損傷檢測算法。首先，采用識別精度更高的ResNet-101作為DSSD模型的基礎網絡；其次，在ResNet-101主干網絡中添加注意力機制，采用通道域注意力和空間域注意力結合的方式，實現特征在通道維度上的加權與空間維度上的聚焦，提升對小目標道路損傷的檢測效果；最后，為了減少簡單樣本的權重，增大難分類樣本的權重，使用Focal loss來提高整體的檢測效果。在Global Road Damage Detection Challenge比賽所提供的數據集上進行驗證，實驗結果表明，該模型的平均精度均值為83.95%，比基于SSD和YOLO網絡的道路損傷檢測方法的準確率更高。

基于自然語言理解的軟件產業政策關聯性分析技術

摘要：針對公共政策的語義分析對比是行政管理重要的研究方向，隨著深度學習、知識圖譜應用越來越廣泛，任何在這一領域改進技術方法的嘗試都可能帶來較大的進步。將自然語言理解相關技術應用于產業政策研究有利于政策的制定與管理。針對軟件產業政策提出一套基于自然語言理解的技術分析方法，旨在構建政策之間的關聯關系網絡，以期輔助政府決策。

面向傳感網絡多源數據融合的SVM方法

摘要：由于多源傳感數據及其噪聲構成復雜的非線性可分空間，數據融合是目前在資源受限的傳感網絡中安全、準確和高效地消除冗余數據的重要方法。結合SVM泛化能力強、凸優化的特點，側重分析了非線性可分多源數據集轉化為高維線性可分空間的可行性方法。仿真實驗結果表明，寬度參數范圍預估方法可以加速高斯核寬度參數的確定。針對多分類情形，仿真實驗結果表明，通過控制誤差積累，更能確保分類的有效性。

智能運維在中國移動IT云中的應用與實踐

摘要：介紹了中國移動IT云針對IaaS層的智能運維場景體系規劃，選擇了數據基礎較好的兩個典型應用場景“智能化指標異常檢測”和“智能化告警關聯與溯源”進行了研究和論證，分別分析了兩個場景適用的算法和實現過程，論述了兩個場景實施后的效果評估方法，并經實際生產驗證了場景實施的效果。

基于注意力特征金字塔的輕量級目標檢測算法

摘要：基于深度學習的目標檢測算法因其模型復雜度和對計算能力的要求，難以部署在移動設備等低算力平臺上。為了降低模型的規模，提出一種輕量級目標檢測算法。該算法在自頂向下的特征融合的基礎之上，通過添加注意力機制構建特征金字塔網絡，以達到更細粒度的特征表達能力。該模型以分辨率為320×320的圖像作為輸入，浮點運算量只有0.72 B，并在VOC數據集上取得了74.2%的mAP，達到了與傳統單階段目標檢測算法相似的精度。實驗數據表明，該算法在保持了檢測精度的同時顯著降低了模型運算量，更適合低算力條件下的目標檢測。

一種基于成詞率和譜聚類的電力文本領域詞發現方法

摘要：考慮到當前電力行業仍缺少有效的領域詞發現方法，以電力行業科技項目文本為原始語料庫，將基于互信息與左右熵的統計特征與傳統語言構詞規則特征相融合，提出了電力文本成詞率的概念。所提方法首先利用成詞率對電力文本進行無監督篩選得到初始候選詞集，然后對候選詞集進行文本切片算法和常用詞過濾操作，最后進行詞嵌入和譜聚類得到最終所需的電力文本領域詞。實驗結果表明，所提出的方法準確有效，為電力文本的領域詞發現提供了一種新方法。

基于背景直方圖的Staple目標跟蹤算法

摘要：針對Staple算法在由于相機運動出現模糊情況下跟蹤精度下降的問題，提出一種基于背景權重直方圖的改進Staple目標跟蹤算法。首先，針對傳統顏色直方圖忽略空間性的問題，提出對直方圖引入位置權重；其次，利用背景區域顏色直方圖抑制背景信息對目標區域直方圖的影響，提出引入背景權重直方圖，并完成直方圖分類器的構建。該算法在OTB2015測試集上與其他5個先進算法進行實驗比較，結果表明在距離精度和成功率上總體效果相對Staple分別提升了3.7%和2%。

基于CNN-LSTM的支撐電容容值軟測量

摘要：實時監測功率變流器中支撐電容的老化狀態，及時發現并更換存在缺陷的電容，對提高功率變換器的可靠性具有重要意義。基于相關電壓電流數據，通過建立數據集，確定網絡模型參數和模型訓練，最終得到基于CNN-LSTM的神經網絡模型，并通過不同工況下的數據集對神經網絡模型的準確性進行了驗證。結果表明，該模型可對電容容值進行可靠預測。

一種基于語音指令的電子門鎖解鎖方法及系統

摘要：為了滿足人們對更好解鎖方式的需求，提出了一種基于語音指令的電子門鎖解鎖方法及系統。該方法的設計理念是：利用手機號碼的唯一性識別用戶身份；利用語音識別技術，實現利用不同的語音指令打開不同門鎖。該系統由電子門鎖、手機和互聯網服務器組成。對該方法及系統進行了詳細設計和說明，據此即可進行代碼編寫、電路設計等產品化設計工作。基于本方法及系統的電子門鎖適用范圍寬、解鎖便捷，并具有更好的安全性、更高的性價比，對電子門鎖或智能門鎖行業的發展將會產生重要影響。

集成機器學習模型在不平衡樣本財務預警中的應用

摘要：基于上交所主板市場A股企業的財務指標數據來預測企業的財務風險，樣本數據包括1 227家正常上市企業和42家被財務預警的企業，數據嚴重不平衡，通過重采樣技術解決了分類器在不平衡樣本中失效的問題，運用Bagging思想的集成機器學習對預測模型進行提升與優化。正確挑選出有財務危機企業的概率最高達到92.86%,在此基礎上，樣本的整體準確率在經過模型的集成之后提高了5.4%。集成模型提高了對上市企業的財務預警能力，能為企業的正常經營和投資者的安全投資提供一定的借鑒。

Faster RCNN和LGDF結合的肝包蟲病CT圖像病灶分割

摘要：針對人工閱片工作量大、閱片質量不佳且容易出現漏檢、錯判等問題，將Faster RCNN目標檢測模型應用于肝包蟲病CT圖像的檢測，并對目標檢測模型進行改進：基于圖片分辨率低、病灶大小不同的特點，使用網絡深度更深的殘差網絡(ResNet101)代替原來的VGG16網絡，用以提取更豐富的圖像特征；根據目標檢測模型得出的病灶坐標信息引入LGDF模型進一步對病灶進行分割，從而輔助醫生更高效的診斷疾病。實驗結果表明，基于ResNet101特征提取網絡的目標檢測模型能夠有效提取目標的特征，檢測準確率相比原始檢測模型提高2.1%，具有較好的檢測精度。同時，將病灶坐標信息引入LGDF模型，相比于原始的LGDF模型更好地完成了對肝包蟲病病灶的分割，Dice系數提高了5%，尤其對多囊型肝包蟲病CT圖像的分割效果較好。

基于強化學習的特征工程算法研究

摘要：特征工程可以自動地處理和生成那些判別性高的特征，而無需人為的操作。特征工程在機器學習中是不可避免的一環，也是至關重要的一環。提出一種基于強化學習(RL)的方法，將特征工程作為一個馬爾可夫決策過程(MDP)，在上限置信區間算法(UCT)的基礎上提出一個近似的方法求解二分類數值數據的特征工程問題，來自動獲得最佳的變換策略。在5個公開的數據集上驗證所提出方法的有效性，FScore平均提高了9.032%，同時與其他用有限元變換進行特征工程的方法進行比較。該方法確實可以得到判別性高的特征，提高模型的學習能力，得到更高的精度。

基于邊緣計算中極端姿態和表情的人臉識別

摘要：隨著信息技術的發展，人臉識別在支付、工作和安防系統中應用的越來越多。在邊緣計算系統中，為了處理的速度，通常選擇較小的神經網絡進行人臉識別，這樣會導致識別率低。并且在實際應用中大多都是對于圖片質量較高的人臉可以很好地識別，但對于受光照影響較大、表情和姿態變化大的圖片識別率不是很高。因此，選擇SqueezeNet輕量級網絡，該網絡層數小，可以很好地運用于邊緣計算系統中。采用了預處理的方法來對圖片進行預處理，然后改進了SqueezeNet網絡的損失函數以及加入了ResNet網絡中的殘差學習方法。最后通過對LFW和IJB-A數據集進行測試，該研究方法明顯提高了識別率。

一種基于圖神經網絡的電信詐騙識別方法

摘要：通信技術的普及給人們帶來便捷的同時，電信欺詐行為也急劇增加。由于詐騙行為特征、號碼類型等與正常業務具有極高相似性，傳統基于統計的電信欺詐檢測方法難于篩選。提出將用戶通信關系轉換為一組拓撲特征，建立通信社交有向圖，將具有統計特征的頂點表示用戶，具有關系特征的邊表示他們之間的活動。在通信社交圖基礎上，通過圖卷積模塊捕獲用戶的通信行為規律和通信社交關系特征，通過池化讀出機制聚合通信社交網絡的潛在特征，以識別電信欺詐行為。真實通信歷史數據驗證表明了該方法的有效性。

基于改進MTCNN算法的低功耗邊緣人臉檢測跟蹤系統

摘要：邊緣設備的快速發展和深度學習的落地應用越來越多，兩者結合的趨勢越發明顯。而針對低功耗邊緣設備AI應用的潛力還未完全開發出來，大量設備隱藏著大量計算能力，釋放其潛力所帶來的社會效益和經濟效益是非常明顯的。因此，以目標檢測任務中較為常見的人臉檢測為例，將MTCNN人臉檢測算法改進并移植到資源極其緊張的低功耗嵌入式平臺，在一定環境條件下，最終成功地檢測到人臉，并繪制出人臉候選框，結合舵機云臺具備了一定的人臉跟蹤能力。

基于DBN的網絡安全態勢評估和態勢預測建模研究

摘要：計算機通信網絡技術高速發展，日新月異，隨之涌現的網絡攻擊、破壞現象形態各異、層出不窮。態勢感知系統為網絡安全提供了全面保障，提高態勢評估和態勢預測建模的穩定性、精準性和快速性是態勢感知系統研究的重要方向。深度信念網作為一種深度學習智能算法，為網絡安全態勢評估和態勢預測的精確性、理論化帶來新方向。考慮深度信念網算法采用受限玻爾茲曼機作為基礎網絡，逐層預訓練和微調為網絡核心部分。構建廣義網絡安全態勢評估指標體系，并建立計算機通信網絡安全的態勢評估和態勢預測數據驅動模型。通過入侵檢測數據集CIC-IDS2017進行實驗仿真，驗證了該模型的精準性和有效性。

基于爬蟲和TFIDF-NB算法的微博情感分析

摘要：針對微博網絡輿情信息量大、無規則、隨機變化的特點，提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析，設計與實現了一個基于Scrapy框架的微博評論爬蟲，將某熱點事件的若干條微博評論進行爬取并存進數據庫，然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類，最后使用TFIDF-NB算法進行情感分類。實驗結果表明，TFIDF-NB算法平均準確率高于線性支持向量機算法和K近鄰算法，在精確率和召回率方面高于K近鄰算法，具有較好的情感分類效果。

一種基于機器學習的Tor網絡識別探測技術

摘要：Tor是一種基于洋蔥路由通信協議建立的隱蔽加密通信系統。該系統基于互聯網現有路由、數據加密等協議，構建了一套保護通信實體的身份隱匿機制，使得經過Tor網絡傳播的數據難以被有效追蹤和分析。然而近年來這項隱蔽通信技術被罪犯大量使用，已成為網絡犯罪和非法交易的溫床。為有效應對該問題，提出一項基于機器學習的Tor網絡識別檢測技術，通過主動生成Tor網絡流量，基于機器學習技術實施流特征提取與檢測，從而發現參與Tor通信的網絡實體及其通信類型，進而檢出潛在的惡意暗網用戶。實驗表明，該方法可有效識別Tor通信實體以及通信行為，如電子郵件和FTP應用等。

GSDCPeleeNet：基于PeleeNet的高效輕量化卷積神經網絡

摘要：卷積神經網絡在各個領域都發揮著重要的作用，尤其是在計算機視覺領域，但過多的參數數量和計算量限制了它在移動設備上的應用。針對上述問題，結合分組卷積方法和參數共享、密集連接的思想，提出了一種新的卷積算法Group-Shard-Dense-Channle-Wise。利用該卷積算法，在PeleeNet網絡結構的基礎上，改進出一種高效的輕量化卷積神經網絡——GSDCPeleeNet。與其他卷積神經網絡相比，該網絡在具有更少參數的情況下，幾乎不損失識別精度甚至識別精度更高。該網絡選取1×1卷積層中卷積核信道方向上的步長s作為超參數，調整并適當地選取該超參數，可以在網絡參數量更小的情況下，擁有更好的圖像分類效果。

基于HLS工具的CNN加速器的設計與優化方法研究

摘要：基于軟硬件協同設計的思想，利用HLS工具，在PYNQ-Z2平臺上設計并實現了一個卷積神經網絡加速器，對卷積運算采用矩陣切割的優化方法，均衡了資源消耗和計算資源，使得加速器的性能達到了最優。利用MNIST數據集對加速器IP核進行性能測試，實驗結果表明：對單張圖片的測試，該加速器相對于ARM平臺實現了5.785的加速效果，對于1 000張圖片的測試則可達到9.72的加速效果，隨著測試圖片數量的不斷增加，加速器的性能也將越來越優。

融合多特征TFIDF文本分析的汽車造型需求提取方法

摘要：針對汽車造型智能設計領域中如何有效提取用戶需求的問題，提出一種融合多特征TFIDF(詞頻-逆向文件頻率)文本分析的汽車造型需求提取方法。首先，通過基于互信息與邊界自由度獲取大量未登錄的專業詞匯，優化和修正簡單分詞后的詞匯；然后針對經典TFIDF算法的局限性，引入詞匯特征因素與情感特征因素，獲取用戶需求特征候選集；最后根據設定的閾值得到有效的用戶需求。實驗結果表明，融合多特征TFIDF文本分析算法在特征提取方面有一定優勢，能有效提取文本中關于汽車造型的用戶需求。

一種基于鴿群優化算法的入侵檢測技術

摘要：群體智能在解決非確定性多項式(NP)問題或搜索空間過大的問題時有著顯著優勢。將鴿群優化(Pigeon Inspired Optimization，PIO)算法應用于入侵檢測系統的特征選擇中。提出基于Sigmoid的PIO(SPIO)和基于Cosine余弦相似度的PIO(CPIO)算法對入侵檢測數據集KDDCUP99進行特征選擇，并用機器學習的方法進行實驗，建立模型并評估結果。

基于改進的Faster R-CNN的古建筑地磚缺陷檢測

摘要：缺陷檢測對于古建筑的保護和修繕具有重要的意義，傳統的地磚缺陷檢測通過目視檢查，存在受人力影響大、耗時長等限制。基于深度學習的良好應用前景，建立故宮地磚缺陷的數據集，提出改進型Faster R-CNN的網絡。首先，構建可變形卷積，通過網絡學習并提取地磚中的缺陷特征；然后，將特征圖輸入區域生成網絡中生成候選區域框，將生成的特征圖和候選區域框進行池化操作；最后，輸出缺陷檢測結果。在故宮地磚圖片數據集的測試下，改進后的模型平均準確率均值到達92.49%，與Faster R-CNN模型相比提高了2.99%，更適用于地磚缺陷檢測。

基于ADAS的汽車倒車防碰撞系統設計與研究

摘要：深入分析了當前倒車影像系統在實際使用場景上的不足，介紹了雷達存在的輻射面有限、角度盲區、物體識別方面的缺陷，以及毫米波雷達的高成本難以普及應用。提出了基于ADAS的汽車倒車防碰撞系統設計，對系統倒車功能做了深入的原理分析，針對基于倒車攝像頭圖像分析的ADAS算法詳細介紹了其技術關鍵點和基于倒車場景融合特征的創新應用，算法識別效果精準有效。針對不同車輛攝像頭安裝位置和朝向的差異創新設計了靈活的預警和報警區域的調節功能，結合TTS語音提醒和圖文顯示提醒司機采取合適的操作保障行車安全，極大地改善了該倒車防碰撞系統的用戶體驗和實際作用，為司機的安全行車提供了有力保障。

塊LBP-TOP稀疏表示表情與車輛檢測技術研究

摘要：提出基于分塊LBP-TOP(Local Binary Patterns from Three Orthogonal Planes)特征和改進的加權稀疏表示分類解決微表情識別與專用線車輛狀態檢測問題。首先利用LBP-TOP特征描述符對從分塊圖像中選擇出的有效塊進行提取特征，將提取的特征作為字典，采取加權稀疏表示(Weighted Sparse Representation，WSRC)和對偶增廣拉格朗日乘子法(Dual Augmented Lagrange Multiplier，DALM)相結合的算法(WSRC_DALM)進行稀疏表示分類；然后利用不同尺寸的塊劃分圖像，選擇有效塊提取特征，特征融合后參與分類。在CASME Ⅱ與SAMM表情數據庫上采用“留一人交叉驗證”(Leave One Subject Out, LOSO)的分類方法進行5分類，得到的識別率分別達到了77.30%與58.82%，在車輛狀態檢測檢測數據庫上的實驗達到了84.60%的檢測率。實驗結果表明了所提出算法的有效性。

基于深度密集連接控制網絡的單幅圖像去雨

摘要：雨線造成的圖像質量退化嚴重影響圖像有效應用及計算機視覺算法，因此圖像去雨十分必要。目前主流的深度學習去雨方法僅對單一尺寸的雨線有效，并且存在雨線去除不完全、模糊背景等問題。針對以上難點，提出了基于深度密集連接控制網絡的單幅圖像去雨算法。通過引入多尺度特征網絡加強對不同尺寸雨線的提取能力，引入注意力機制模塊提升對有雨區域的關注度，引入密集連接控制網絡以完整表示雨線特征。實驗表明，該方法在合成數據集以及真實數據集對比主流去雨方法效果均有提升。

基于改進CapsNet的色素性皮膚病識別的研究

摘要：皮膚病是醫學上的常見的、多發性疾病，因此皮膚檢測技術越來越受關注。卷積神經網絡是常見的皮膚檢測方法，其模型結構會丟失很多信息。CapsNet(膠囊網絡)是在卷積神經網絡之后的一種新的神經網絡。CapsNet的矢量化特征能夠較好地表達空間關聯性，每一個capsule(膠囊)獨立地服務各自的任務。分析了CapsNet的基本結構和主要算法，改進了網絡模型從而避免過擬合現象發生，試圖基于改進CapsNet針對預處理之后的皮膚圖像進行識別，并與傳統卷積神經網絡的模型作對比。實驗結果表明，使用改進CapsNet對色素性皮膚病進行識別可以有較好的識別效果，并且準確率比傳統方法高出8%～10%。

基于生成對抗網絡合成噪聲的語音增強方法研究

摘要：在語音增強領域，深度神經網絡通過對大量含有不同噪聲的語音以監督學習方式進行訓練建模，從而提升網絡的語音增強能力。然而不同類型噪聲的獲取成本較大，噪聲類型難以全面采集，影響了模型的泛化能力。針對這個問題，提出一種基于生成對抗網絡(Generative Adversarial Networks，GAN)的噪聲數據樣本增強方法，該方法對真實噪聲數據進行學習，根據數據特征合成虛擬噪聲，以此擴充訓練集中噪聲數據的數量和類型。通過實驗驗證，所采用的噪聲合成方法能夠有效擴展訓練集中噪聲來源，增強模型的泛化能力，有效提高語音信號去噪處理后的信噪比和可理解性。

基于FP-growth算法的用電異常數據挖掘方法

摘要：隨著科學技術的不斷進步，不法分子竊電手段日趨專業化多樣化，而傳統的防竊電技術實時性及可行性較低。研究對運行中智能電能表用電信息的數據采集及特征提取，分析異常用電數據，應用機器學習的方法對特征值進行學習，并推導出用電異常的判斷閾值，采用關聯規則數據挖掘方法對獨立檢測的結果進行融合，從而實現竊電數據的挖掘。最后驗證了模型建立的準確性，并推導出用電異常案例的甄別方法。

基于邊窗濾波和擴張卷積的礦井行人檢測

摘要：在數字化礦山中，行人檢測系統能夠大幅減少事故傷亡，是保護工人安全的重要手段。為了構建高性能的行人檢測系統，提出了一種基于邊窗濾波和擴張卷積的礦井行人檢測模型。具體來說，針對復雜惡劣的礦井環境，采用邊窗濾波抑制視頻圖像中的干擾信號，提升圖像質量。此外，考慮到行人目標的多尺度特性，在模型中引入擴張卷積增加特征的感受野，進而提升檢測性能。大量的對比實驗證明了邊窗濾波和擴張卷積的有效性，模型在礦井數據集上獲得94.3 mAP和99.1%檢測率的優異性能。

基于權值交互思想的卷積神經網絡量化算法

摘要：傳統的卷積神經網絡量化算法廣泛使用對稱均勻量化操作對模型權值進行量化，沒有考慮到相鄰權值量化之間的相互關系，即上一個權值的量化操作產生的量化噪聲可以通過調整之后權值的量化方向加以彌補。針對上述問題，提出了一種基于權值交互思想的三值卷積神經網絡量化算法，達到了16倍的模型壓縮比，以ImageNet作為數據集，量化后的AlexNet和ResNet-18網絡上模型預測準確率只下降了不到3%。該方法達到了較高的模型壓縮比，具有較高的精度，可以用于將卷積神經網絡移植到計算資源有限的移動端平臺上。

基于幀循環網絡的視頻超分辨率技術

摘要：對比于單張圖像超分辨，視頻圖像超分辨率技術需要對輸入的連續時間序列圖像進行融合、對齊等處理。基于幀循環的視頻超分辨率網絡共分為三部分：(1)幀序列對齊網絡提取圖像特征，并將鄰居幀對齊到中心幀；(2)幀融合網絡將對齊完成的幀進行融合，使用鄰居幀的信息補充中心幀信息；(3)超分辨網絡將融合完成的圖像放大，得到最終的高清圖像。實驗表明，與現有算法相比，基于幀循環網絡的視頻超分辨率技術產生圖像更為銳利，質量更高。

基于卷積神經網絡的礦井安全帽佩戴檢測

摘要：在煤礦生產中，工人由于未佩戴安全帽而受傷的事故時有發生。為了構建數字化安全帽監測系統，提出了一種基于卷積神經網絡的安全帽佩戴檢測模型。采用先進的Darknet53網絡作為模型主干，用于提取圖片的特征信息。此外，在模型中引入注意力機制用于豐富特征之間的信息傳播，增強模型的泛化能力。最后，制作了安全帽佩戴預訓練數據集和實際礦井場景數據集，并在PyTorch平臺進行全面的對比實驗驗證了模型設計的有效性，模型在實際礦井場景數據集上獲得92.5 mAP的優異性能。

YOLOv3網絡在車標檢測中的應用

摘要：針對車標檢測存在檢測時間長、檢測率低、可識別類型少的問題，提出一種采用You Only Look Once(YOLOv3)網絡的方法。為了使該網絡適用于小目標的車標檢測，將目標特征提取結構Darknet-53換成Darknet-19，并且將多尺度預測層數減少為兩層以減少網絡參數數量。同時，為了增大車標在圖像中所占比例，讓卷積神經網絡能學習更多的車標特征，采用將車輛從圖像中裁剪后進行人工標注的方法，構建了一個包含46類車標的數據集(VLDS-46)。實驗結果表明，采用該模型進行車標檢測時能在實現高檢測率的同時達到實時性要求，檢測平均耗時為9 ms。

基于匹配層融合的識別算法研究與實現

摘要：提出一種基于音視頻匹配層自適應加權融合的身份識別方法。在不同程度的噪聲情況下，圖像與聲音的識別率會隨噪聲的增強而降低，憑借單個生物模態的識別，難以達到很好的預測結果；而且兩種模態融合時的權值不同，融合系統的穩定性效果也不同。采用雙模態的自適應加權融合不僅可以有效地彌補不同生物模態識別之間的優缺點，而且可以自適應選擇最優的權值進行決策。實驗表明，該方法的理論推測成立，比單模態的身份識別具有更高的識別率與魯棒性。

基于Faster R-CNN的道路裂縫識別

摘要：傳統的道路裂縫識別方法有基于R-CNN、SPPnet、HOG+SVM等多種方法，但識別精度低、檢測速度慢。針對這些缺點，提出一種基于Faster R-CNN的道路裂縫識別方法。首先，采集道路裂縫圖像，建立Pascal VOC數據集；其次，基于谷歌開發的TensorFlow深度學習框架，用數據集對Faster R-CNN進行訓練并分析各項性能參數指標。實驗結果表明，在迭代20 000次的情況下，可將訓練損失降到0.188 5，AP值達到0.780 2，取得了良好效果。

基于上下文特征與單類支持向量機的人臉活體檢測

摘要：非法入侵者通過偽裝人臉欺騙識別系統，給人臉識別應用帶來嚴重威脅。現有人臉活體檢測方法多為在同一數據集內進行訓練和測試，當應用在跨數據集場景中時效果并不理想。針對這一問題，提出了利用HOG等算法對上下文環境中的線索信息進行提取，提取出來的特征送入單類支持向量機進行訓練、分類。將分類結果與上下文環境中異常線索的探測結果相結合。算法在公開的數據集NUAA和CASIA-FASD上進行了驗證，實驗結果表明在跨數據集檢測時該算法的泛化能力及檢測準確率較已存在算法有所提高。

基于HybridDL模型的文本相似度檢測方法

摘要：為了提高文本相似度檢測算法的準確度，提出一種結合潛在狄利克雷分布(Latent Dirichlet Allocation，LDA)與Doc2Vec模型的文本相似度檢測方法，并把該算法得到的模型命名為HybridDL模型。該算法通過Doc2Vec對文檔訓練得到文檔向量，再利用LDA模型得到文檔主題與各個主題下特征詞出現的概率，對文檔中各主題及特征詞計算概率加權和，映射到Doc2Vec文檔向量中。實驗結果表明，新算法模型比傳統的Doc2Vec模型對相似文本的判斷更加敏感，在文本相似度檢測上具有更高的準確度。

一種面向科技項目文本的相似度度量方法

摘要：現有的文本相似度度量方法主要采用TF-IDF方法，把文本建模為詞頻向量，但未考慮文本的結構特征。現將文本的結構特征和TF-IDF方法進行融合，提出了一種面向科技項目文本的相似度度量方法。該方法首先對文本進行預處理，其次根據文本的結構特征提取模塊文本，然后使用TF-IDF方法提取每個模塊文本的TOP-N關鍵詞，作為模塊文本的特征向量表示，最后使用余弦聚類計算文本的相似度。實驗結果表明，在電力行業的科技項目文檔數據集上，所提方法優于TF-IDF方法。

基于深度神經網絡的偽裝人臉識別

摘要：偽裝人臉識別在刑偵安防領域有著巨大的應用價值。針對現階段對偽裝人臉識別的研究較少、算法魯棒性不強等缺點，提出了基于深度神經網絡的偽裝人臉識別算法。改進了SqueezeNet網絡模型，并將其與FaceNet網絡架構進行結合，用于人臉圖像的身份識別。通過在訓練數據集中引入偽裝人臉圖像，讓網絡學習到偽裝的特征。實驗結果表明，該算法識別準確率接近90%，相較于其他網絡模型，具有更好的識別效果。

鐵路道岔故障的智能診斷

摘要：傳統的道岔故障檢測方式不僅會耗費大量人力、物力、財力，而且檢測結果完全依賴于個人工作經驗。隨著人工智能的飛速發展，研究鐵路道岔的智能診斷器是亟待解決的問題。提出一種智能檢測系統，該系統從預處理數據、特征提取、構建不均衡數據的智能識別器以及設計更符合要求的評價標準方面進行了具體而深入的研究。最后，通過MATLAB軟件對廣州鐘村站W1902#和W1904#型號的道岔動作電流數據進行仿真實驗。實驗結果顯示，智能檢測系統不僅具有非常高的識別性能和泛化能力,而且識別時間僅為0.04 s, 滿足鐵路實時性要求。

基于特征融合的K-means微博話題發現模型

摘要：針對傳統話題檢測方法在微博短文本上存在高維稀疏的缺陷，提出了一種基于特征融合的K-means微博話題發現模型。為了更好地表達微博話題的語義信息，使用在句子中共現的詞對向量模型（Biterm_VSM）代替傳統的向量空間模型（Vector Space Model，VSM），并結合主題模型（Latent Dirichlet Allocation，LDA）挖掘出微博短文本中的潛在語義，把兩個模型得到的特征進行特征融合，并應用K-means聚類算法進行話題的發現。實驗結果表明，與傳統的話題檢測方法相比，該模型的調整蘭德系數（Adjusted Rand index，ARI）為0.80，比傳統的話題檢測方法提高了3%~6%。

基于人工神經網絡的HEMT器件參數提取方法研究

摘要：研究了利用人工神經網絡對不同頻帶、柵寬的砷化鎵高電子遷移率晶體管進行散射參數和噪聲參數提取，基于兩個神經網絡分別對兩組散射參數和噪聲參數進行訓練學習，比較不同隱含層和神經元數目得出平均相對誤差和均方誤差，找到對應散射參數和噪聲參數神經網絡的最佳的隱含層數和神經元數目是8-8-6和6-4。測試結果表明，散射參數平均相對誤差的平均值為2.79%，噪聲參數平均相對誤差的平均值為2.05%，與常規單個神經網絡結構相比，在平均相對誤差方面提高了31.3%，表明該模型具備更好的精度和可靠性，十分適用于寬禁帶、強非線性特征的射頻晶體管參數提取。

基于Seq2Seq與Bi-LSTM的中文文本自動校對模型

摘要：針對中文文本自動校對提出了一種新的基于Seq2Seq和Bi-LSTM結合的深度學習模型。與傳統的基于規則和概率統計的方法不同，基于Seq2Seq基礎結構改進，加入了Bi-LSTM單元和注意力機制，實現了一個中文文本自動校對模型。采用F0.5與GLEU指標評價，通過公開的數據集進行不同模型的對比實驗。實驗結果表明，新模型能有效地處理長距離的文本錯誤以及語義錯誤，Bi-RNN以及注意力機制的加入對中文文本校對模型的性能有顯著提升。

基于深淺特征融合的人臉識別

摘要：針對傳統的淺層特征所提取特征的判別性有限、深度特征需要大量帶標記樣本且訓練過程耗時長的問題，提出一種深度及淺層特征融合算法用于人臉識別。首先提取人臉的HOG特征并進行判別性降維；同時，提取人臉圖像的PCANet特征并降維；其次，將降維后的深淺特征進行融合，并進一步提取判別性特征；最后，采用SVM分類器進行分類并在AR和Yale B數據庫上對算法進行驗證。實驗結果證明，該算法能夠比單獨選用深度特征和淺層特征進行分類達到更高的識別率，且對特征維數具有更強的魯棒性。

基于FPGA加速的卷積神經網絡識別系統

摘要：針對卷積神經網絡(CNN)在通用CPU以及GPU平臺上推斷速度慢、功耗大的問題，采用FPGA平臺設計了并行化的卷積神經網絡推斷系統。通過運算資源重用、并行處理數據和流水線設計，并利用全連接層的稀疏性設計稀疏矩陣乘法器，大大提高運算速度，減少資源的使用。系統測試使用ORL人臉數據庫，實驗結果表明，在100 MHz工作頻率下，模型推斷性能分別是CPU的10.24倍，是GPU的3.08倍，是基準版本的1.56倍，而功率還不到2 W。最終在模型壓縮了4倍的情況下，系統識別準確率為95%。

卷積神經網絡人臉檢測算法

摘要：傳統人臉檢測算法往往不能自動地從原始圖像中提取有用的檢測特征，而卷積神經網絡可以輕易地提取高維度的特征信息，廣泛用于圖像處理領域。針對上述缺點，采用簡單高效的深度學習Caffe框架并通過AlexNet網絡訓練，數據集為LFW人臉數據集，得出一個模型分類器，對原始圖像數據進行圖像金字塔變換，并通過前向傳播得到特征圖，反變換得出人臉坐標，采用非極大值抑制算法得出最優位置，最后達到一個二分類的人臉檢測結果。該方法可以實現不同尺度的人臉檢測，具有較高的精度，可用于構建人臉檢測系統。

基于Transformer模型的中文文本自動校對研究

摘要：提出將Transformer模型應用于中文文本自動校對領域。Transformer模型與傳統的基于概率、統計、規則或引入BiLSTM的Seq2Seq模型不同，該深度學習模型通過對Seq2Seq模型進行整體結構改進，從而實現中文文本自動校對。通過使用公開數據集對不同模型進行對比實驗，采用準確率、召回率與F1值作為評價指標，實驗結果表明，Transformer模型相比較于其他模型，在中文文本自動校對的性能上有了大幅提升。

基于深度學習的圖像分類搜索系統

摘要：圖像分類是根據圖像的信息將不同類別的圖像區分開來，是計算機視覺中重要的基本問題，也是圖像檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務的基礎。深度學習是機器學習研究中的一個新的領域，其動機在于建立、模擬人腦進行分析學習的神經網絡，它模仿人腦的機制來解釋數據，例如圖像、聲音和文本。該系統基于Caffe深度學習框架，首先對數據集進行訓練分析構建深度學習網絡，提取數據集圖像特征信息，得到數據對應的分類模型，然后以bvlc-imagenet訓練集模型為基礎，對目標圖像進行擴展應用，實現“以圖搜圖”Web應用。

領域知識融合與共建研究

摘要：為建設國家電網客戶服務中心的智能對話系統，需要從大量文檔、知識庫、對話等數據中提煉知識形成知識圖譜，提出一種融合事實圖譜和事理圖譜的新型知識圖譜框架，能夠基于多源異構數據共建新型知識圖譜，在國網領域精準問答、客服系統知識支撐、對話管理引導、知識推理等方面均有較好性能。融合后的圖譜及應用系統在國網客服中心問答平臺中投入使用，大幅提升了客服人員工作效率和服務質量。

PSO優化BP神經網絡齒輪箱故障診斷

摘要：針對目前齒輪箱系統在利用神經網絡故障診斷時存在正確識別率低和依靠經驗選擇參數的問題，提出了基于粒子群優化BP網絡的齒輪箱故障診斷方法。簡要介紹利用齒輪振動原理提取特征參數建立故障模型，該模型以齒輪箱特征向量為輸入、故障類型為輸出，詳細分析了通過BP神經網絡、概率神經網絡和粒子群優化BP神經網絡實現齒輪箱故障診斷。仿真結果表明，BP神經網絡對齒輪箱故障診斷收斂速度慢，故障識別率為82%；概率神經網絡的模型故障診斷識別率依據經驗選取spread值決定，故障識別率最大為98%；粒子群優化后的BP神經網絡故障診斷分類識別率為100%且自適應能力強。

卷積神經網絡在肝包蟲病CT圖像診斷中的應用

摘要：探討卷積神經網絡(Convonlutional Neural Network，CNN)在肝包蟲病CT圖像診斷中的應用。選取兩種類型的肝包蟲病CT圖像進行歸一化、改進的中值濾波去噪和數據增強等預處理。以LeNet-5模型為基礎提出改進的CNN模型CTLeNet，采用正則化策略減少過擬合問題，加入Dropout層減少參數個數，對二分類肝包蟲圖像進行分類實驗，同時通過反卷積實現特征可視化，挖掘疾病潛在特征。結果表明，CTLeNet模型在分類任務中取得了較好的效果，有望通過深度學習方法對肝包蟲病提供輔助診斷和決策支持。

嵌入式平臺下的車輛跟蹤系統設計

摘要：設計并實現了NVIDIA嵌入式平臺Jetson TX2上的車輛跟蹤系統。從攝像頭采集YUV420格式的視頻數據，然后將數據送到Tegra Parker硬件HEVC編碼器進行編碼，輸出碼流經過RTP封裝后通過UDP廣播發送，利用Gstreamer多媒體框架開發接收及解碼程序，最后，針對獲取的視頻動態進行車輛的跟蹤與顯示。運行Yolo V2檢測算法，對車輛進行檢測，從而為跟蹤系統提供跟蹤對象。利用Kalman濾波算法對車輛的位置進行預測，再經過Meanshift算法進行車輛跟蹤。系統能夠實現幀率為60 f/s的超高清4K視頻實時編碼和傳輸，此系統中的HEVC 硬件編碼器編碼速率比PC端x265編碼器大3個數量級，PSNR比PC端x265編碼器高6 dB，更加適用于智能交通中。

神經網絡關聯存儲器的設計及應用

摘要：神經網絡的存儲能力一直是一個重大的缺陷，其存儲主要體現在權重系數上，因此參數量一多，訓練起來就十分困難。給神經網絡設計一個外部關聯存儲器，能有效對神經網絡的輸入進行關聯查詢，并將查詢的結果作為輔助輸入傳入到神經網絡中去。此外，設計了自然語言語句的向量嵌入模型，并將模型和關聯存儲器集合起來形成一個自動關聯語句語義向量的關聯存儲系統，其性能指標達到了設計要求。

基于目標多區域分割的抗干擾跟蹤算法研究

摘要：針對視頻序列中運動目標跟蹤過程中可能出現的目標旋轉、遮擋、形變等原因造成的跟蹤失敗問題，提出了一種基于目標多區域分割的跟蹤方法。主要通過將目標劃分為多個部分相互重疊的區域，然后選擇跟蹤過程中相對穩定的多個區域進行定位，進而對跟蹤的目標采用不同目標區域權重更新不同的模板更新策略，這樣選擇主要可以增加算法的抗遮擋、抗旋轉能力。實驗結果表明，該方法對目標遮擋、旋轉等具有一定的適應能力。

基于LSTM網絡的IGBT參數預測硬件系統設計

摘要：對絕緣柵雙極型晶體管進行參數預測可以有效地避免因其失效帶來的經濟損失和安全問題。對絕緣柵雙極型晶體管參數進行分析，設計了一個基于LSTM網絡的絕緣柵雙極型晶體管參數預測SoC硬件系統。該系統使用ARM處理器作為總控制器，控制各個子模塊的調用和數據的傳輸，FPGA內通過對矩陣向量內積算法進行優化提高LSTM網絡內部的數據運算速度，并且采用多項式近似的方法降低了激活函數所占用的資源。實驗結果表明,系統的預測平均準確率為92.6%，計算速度相比于CPU快了3.74倍，同時具有低功耗的特點。

基于卷積遞歸模型的文本分類研究

摘要：近年來卷積神經網絡和循環神經網絡在文本分類領域得到了越來越廣泛的的應用。提出一種卷積神經網絡和長短時記憶網絡特征融合的模型，通過長短期記憶網絡作為池化層的替代來獲得長期依賴性，從而構建一個聯合CNN和RNN的框架來克服單卷積神經網絡忽略詞語在上下文中語義和語法信息的問題。所提出的方法在減少參數數量和兼顧文本序列全局特征方面起著重要作用，實驗結果表明，可以通過更小的框架來實現相同級別的分類性能，并且在準確率方面超越了同類型的其他幾種方法。

支持向量機在多因子選股的預測優化

摘要：使用財務數據構建一個多因子選股模型，在支持向量機分類上進行預測優化。選股上使用排序法對數據進行預處理，再使用支持向量機對股票收益進行分類預測，最后使用數據到分離超平面的距離進行排序，優化支持向量機的分類預測。實證中，從中證500成分股中選出股票組合，在2016年四季度到2018年一季度獲得累計收益88.96%。擇時策略的均線策略和通道突破策略均能有效降低波動率和回撤。還使用高頻數據來降低均線策略的滯后性，波動率又得到進一步降低。本模型利用支持向量機性質提高預測精度，結合技術分析優化了策略的收益，為多因子選股和交易提供了新的研究視角。

基于知識圖譜的保險領域對話系統構建

摘要：在當前人工智能技術發展的熱潮中，對話系統已經越來越實用化。與一般的閑聊對話系統不同，特定領域的對話系統是基于知識，帶有上下文推理的實用性對話系統。保險領域是典型的特定領域，介紹了一種保險相關領域對話系統的基本構建方法，可以幫助用戶快速、實用地在某特定領域和場景下構建對話系統，且具有一定的推廣性和拓展性。

基于深度學習的人臉活體檢測算法

摘要：身份認證技術有了很大的發展，隨之不斷出現的是各種偽造合法用戶信息的欺詐手段。針對這一問題，提出一種基于深度學習人臉活體檢測算法，分析了真實人臉和欺詐人臉之間的區別，將真實人臉和照片進行數據去中心化、zca白化去噪聲、隨機旋轉等處理；同時，利用卷積神經網絡對照片的面部特征進行提取，提取出來的特征送入神經網絡訓練、分類。算法在公開的數據庫NUAA上進行了驗證，實驗結果表明該方法降低了計算的復雜度，提高了識別準確率。

基于FPGA的深度學習目標檢測系統的設計與實現

摘要：針對當前深度學習目標檢測算法計算復雜度高和內存需求大等問題，設計并實現了一種基于FPGA的深度學習目標檢測系統。設計對應YOLOv2-Tiny目標檢測算法的硬件加速器，對加速器各模塊的處理時延建模，給出卷積計算模塊的詳細設計。實驗結果表明，與CPU相比，CPU+FPGA的異構系統是雙核ARM-A9能效的67.5倍，Xeon的94.6倍；速度是雙核ARM-A9的84.4倍，Xeon的5.5倍左右。并且，當前設計在性能上超過之前的工作。

一種改進的RefineDet多尺度人臉檢測方法

摘要：針對車站、商場等大型場所中客流量大、背景復雜等原因導致多尺度人臉檢測精度低的問題，建立了一種基于RefineDet多層特征圖融合的多尺度人臉檢測方法。首先利用第一級網絡進行特征提取并在不同尺度的特征圖上粗略預估人臉位置；然后在第二級中通過特征金字塔網絡將低層特征與高層特征融合，進一步增強小尺寸人臉的語義信息；最后，通過置信度和焦點損失函數對檢測框進行二次抑制，達到邊框的精確回歸。實驗中將人臉候選區域的寬高比只設置為1:1，以此來降低運算量并提高人臉檢測精度。在Wider Face數據集上的實驗結果表明，該方法能有效檢測不同尺度的人臉，在Easy、Medium、Hard 3個子數據集上測試結果分別為93.4%、92%、84.4%的MAP，尤其對小尺寸人臉的檢測精度有明顯提高。

基于半監督學習的多示例多標簽改進算法

摘要：多示例多標簽學習框架是一種針對解決多義性問題而提出的新型機器學習框架，在多示例多標簽學習框架中，一個對象是用一組示例集合來表示，并且和一組類別標簽相關聯。E-MIMLSVM+算法是多示例多標簽學習框架中利用退化思想的經典分類算法，針對其無法利用無標簽樣本進行學習從而造成泛化能力差等問題，使用半監督支持向量機對該算法進行改進。改進后的算法可以利用少量有標簽樣本和大量沒有標簽的樣本進行學習，有助于發現樣本集內部隱藏的結構信息，了解樣本集的真實分布情況。通過對比實驗可以看出，改進后的算法有效提高了分類器的泛化性能。

基于小波神經網絡的數據中心KPI預測

摘要：時間序列預測是數據中心關鍵性能指標異常檢測的重要環節。針對時間序列，利用小波基函數作為隱含層節點傳遞函數來構造小波神經網絡進行預測；同時選取動量梯度下降法提高神經網絡學習效率；再根據粒子群算法訓練得到最優解作為神經網絡參數初始值；最后使用MATLAB進行仿真，以較高準確性對關鍵性能指標時間序列進行了預測。

基于主題提取模型的交通違法行為文本數據的挖掘

摘要：長期以來，各類交通事故嚴重影響了人們生命財產安全和社會經濟發展。交通事故分析是對交通事故資料進行調查研究，發現事故動向和各種影響因素對事故總體的作用和相互關系，以便定量地認識事故現象的本質和內在規律。通過對交通事故中記錄駕駛員違法行為的文本數據進行分析，提出了一種文本主題提取模型和技術，來挖掘交通事故中駕駛員風險駕駛因素，解決以往交通事故統計中交通違法行為難以挖掘的問題，計算出影響交通事故的最大支配因素。最后以北京地區一般程序處理的交通事故為例，結合北京市交通管理專家經驗，驗證該模型可應用于交通事故中違法行為的主題提取，結論與長期治理經驗相吻合。

感知特征互補的圖像質量評價

摘要：針對圖像質量客觀評價方法在實際應用場景下性能退化的問題，將人眼視覺特性融入圖像特征處理的多個環節，提出一種融合視覺結構顯著和視覺能量顯著特征互補的方法。首先，根據人眼特性對圖像的灰度能量、對比度能量和梯度結構三層互補特征進行空域-頻域聯合變換處理；其次，分別提取前述三層視覺特征的多通道信息并進行評價；最后，基于視覺特性和圖像失真度將各層視覺特征評價從內層至外層逐步自適應綜合。實驗表明，本方法具有較高的水平和更好的穩定性，提高了實際應用場景下的評價性能。

K近鄰及其集成模型的股票價格預測

摘要：為了驗證股票的價格運動與過去應該是相似的這一假設，運用K近鄰算法，將價格運動簡單劃分為漲跌兩類進行預測，進行假設驗證。使用滑窗方法比較現在的價格運動與何時的歷史價格更為相似，將多個K近鄰模型組合成集成模型，實現模型的泛化和策略收益的調整。使用中證500指數的歷史價格數據進行預測實證，2017年～2018年9月的預測結果顯示單個K近鄰模型策略獲得76.72%的收益，現在的價格運動與遙遠的過去更為相似，集成模型能更好地控制風險。該模型利用K近鄰模型的含義驗證了股票價格運動具有相似性，可以作為證券交易的擇時策略。

基于深度集成學習的人臉智能反饋認知方法

摘要：人臉識別技術是深度學習的重要研究領域。為了克服傳統開環人臉認知模式以及深層神經網絡結構的缺陷，模仿人類實時評測認知結果自尋優調節特征空間和分類認知準則的認知模式，借鑒閉環控制理論思想，探索了一種基于深度集成學習的人臉智能反饋認知方法。首先，基于DEEPID網絡建立人臉圖像由全局到局部具有確定映射關系的非結構化特征空間；其次，基于特征可分性評測和變精度粗糙集理論，從信息論角度建立非結構化動態特征表征的人臉認知決策信息系統模型，以約減非結構化特征空間；再次，采用集成隨機權向量函數連接網絡，構建簡約非結構化特征空間的分類認知準則；最后，構建人臉認知結果熵測度指標，為人臉特征空間和分類認知準則的自尋優調節機制提供量化依據。實驗結果表明，較已有方法，該方法有效地提高了人臉圖像的識別率。

基于卷積神經網絡的火災視頻圖像檢測

摘要：隨著計算機技術的發展，融合計算機視覺、機器學習、深度學習等技術的火災圖像處理技術得到了廣泛的研究和應用。針對傳統圖像處理方法預處理過程復雜且誤報率高等問題，提出一種基于深度卷積神經網絡模型進行火災檢測的方法，其減少了復雜的預處理環節，將整個火災識別過程整合成一個單深度神經網絡，便于訓練與優化。針對識別過程中類似火災場景對火災檢測產生干擾的問題，利用火災的運動特性，創新性地提出利用火災視頻前后幀火災坐標位置變化來排除燈光等類似火災場景對檢測的干擾。對比了眾多深度學習開源框架后，選擇Caffe框架進行訓練及測試，實驗結果表明，該方法實現了對火災圖像的識別和定位，適應于不同的火災場景，具有很好的泛化能力和抗干擾能力。

基于BP神經網絡改進UKF的組合導航算法

摘要：針對在進近著陸的過程中，儀表著陸系統（ILS）易受到外界環境及空域的干擾，導致導航精度降低的問題，提出一種利用慣性導航系統（INS）與GBAS著陸系統（GLS）進行改進的組合導航算法，將組合導航系統輸出位置信息之間的差值作為BP神經網絡改進的無跡卡爾曼濾波器（UKF）的量測值，通過最優加權的方法得到系統的全局最優估計值。相比于傳統的聯邦濾波算法，該算法能有效降低測量噪聲，減小飛機進近著陸時的誤差，提高導航精度。

一種基于股票情感分析的股市趨勢預測方法

摘要：隨著互聯網應用的飛速發展和用戶人數的急劇增長，股市評論與觀點在很大程度上反映了股市行情，也影響著股市漲跌。因此，如何快速高效地分析到網民對股市的態度和觀點，對股市預測具有很大指導意義。論文研究通過分析不同專業人士發布股評的情感極性來預測股票上漲與下跌趨勢。提出了一種綜合金融詞組詞典和結尾段加權的情感分析方法，能解決情感字典分析方法對領域依賴性問題，有效地提高了情感分析準確度。另外，論文還提出了一種加窗的股票預測模型，可用于分析預測事件窗口的最佳值。實驗結果表明，基于股評情感分析來預測特定股票上漲或下跌趨勢具有較好效果。

基于深度學習的通信信號自動調制識別技術

摘要：基于特征提取和模式識別的多體制通信信號自動調制識別技術是軟件無線電領域中的重要研究課題，是復雜電磁環境下頻譜管理、頻譜檢測等非協作通信領域的關鍵技術之一。提出一種基于深度學習的通信信號調制模式識別算法，應用自編碼技術進行特征提取，獲得具有較好的抗干擾能力的特征集，然后使用 BP神經網絡對經過篩選的特征進行分類識別，實現了MQAM通信信號調制模式自動識別。仿真實驗結果表明，所提出的方法分類識別效果好，有效提高了數字調制信號自動識別的抗干擾能力。

一種語音識別中核心詞快速模型優化方法

摘要：針對國網客服電話語音識別在特定領域核心詞識別效果差的問題，提出一種基于HCLG領域詞權重增強和領域詞糾正的方法，能夠實時并快速地添加領域詞，從而動態地優化語言模型，提升語音識別效果。將該模型和算法優化應用在國網客服中心電話語音的咨詢、維修、投訴等各種領域場景中，其語音識別結果都得到大幅改善。

移動用戶維系挽留系統中K-means算法應用

摘要：4G網絡技術的成熟使得用戶對運營商的業務需求越來越高，如何維系用戶和通過對用戶屬性的研究來迎合用戶對業務的需求，建立方便快捷的體驗服務手段，建設維系挽留系統是我國通信運營商未來發展的重中之重。首先分析移動用戶維系發展現狀，提出用戶維系發展屬性。其次，采用數據挖掘方法建立以用戶穩定度和用戶價值評價為基礎的數據挖掘分析模型，并通過用戶數據進行驗證。最后，針對存量維系如何進行多渠道精準推送提出進一步展望。

雨密度感知分類引導擴張網絡對單張圖片去雨

摘要：由于圖像中的雨線條紋具有不同形狀、尺寸且分布不均勻，單一神經網絡學習分布不均勻的雨密度能力弱，去雨效果不顯著，對此提出雨密度感知引導擴張網絡對單張圖片去除雨的方法。網絡分為兩部分：(1)雨密度感知網絡對不同密度雨的圖片進行分類（大雨、中雨、小雨）；(2)聯合雨密度感知分類信息引導擴張網絡學習不同的雨密度特征細節，用于檢測雨線和去雨。實驗證明了該方法在合成和真實數據集上去雨的有效性。

基于深度神經網絡的個性化推薦系統研究

摘要：深度神經網絡由于結構類似于生物神經網絡，因此擁有高效、精準抽取信息深層隱含特征的能力和能夠學習多層的抽象特征表示，且能夠對跨域、多源、異質的內容信息進行學習等優勢。提出了一種基于多用戶-項目結合深度神經網絡抽取特征、自學習等優勢實現信息個性化推薦的模型，該模型通過對輸入多源異構數據特征進行深度神經網絡學習、抽取，再融合協同過濾中的廣泛個性化產生候選集，然后通過二次模型學習產生排序集，實現精準、實時、個性化推薦。通過真實數據集對模型評估實驗，實驗結果表明，該模型能夠很好地學習、抽取用戶隱特征，并且能夠一定程度上解決傳統推薦系統稀疏性、新物品等問題，同時實現了更加精準、實時、個性化的推薦。

基于改進ORB算法的移動機器人視覺SLAM方法研究

摘要：以移動機器人視覺導航為應用背景，針對傳統ORB算法在視覺SLAM中存在特征點分布不均勻、重疊特征點較多的問題，提出一種改進ORB算法。首先，對每層圖像的尺度空間金字塔進行網格劃分，增加空間尺度信息；其次，在特征點檢測時，采用改進FAST角點自適應閾值提取，設置感興趣區域；然后，采用非極大值抑制的方法，抑制低閾值特征點的輸出；最后，使用基于區域圖像特征點分布的方差數值評價待檢測圖像中特征點的分布情況。實驗結果表明，改進ORB算法特征點的分布較為均勻，輸出特征點重疊數量較少，執行時間較短。

UAV/UGV協同環境下的目標識別與全局路徑規劃研究

摘要：針對單獨機器人難以執行復雜環境中任務的問題，Unmanned Air/Ground Vehicle(UAV/UGV)協同系統近年來受到了廣泛關注。為了提高執行任務的工作效率，提出一種基于視覺傳感器下UAV/UGV協同系統中UAV目標識別下UGV全局路徑規劃的方法，無人機利用高空視野優勢獲取目標物與環境信息, SURF算法和圖像分割實現環境建模。無人車根據無人機獲取的信息，利用優化的A*算法完成全局路徑規劃，并且在典型搜救場景中進行了仿真驗證。實驗表明，SURF算法能滿足目標識別的精確度、實時性和魯棒性；并且利用優化的A*算法實現了UGV快速準確的全局路徑規劃。

基于卷積神經網絡的圖像著色

摘要：圖像著色的目標是為灰度圖像的每一個像素分配顏色，它是圖像處理領域的熱點問題。以U-Net為主線網絡，結合深度學習和卷積神經網絡設計了一個全自動的著色網絡模型。在該模型中，支線使用卷積神經網絡SE-Inception-ResNet-v2作為高水平的特征提取器，提取圖像的全局信息，同時在網絡中使用PoLU(Power Linear Unit)函數替代線性整流函數(ReLU)。實驗結果證明此著色網絡模型能夠對灰度圖像進行有效的著色。

基于膠囊網絡的指靜脈識別研究

摘要：針對卷積神經網絡(CNN)中空間上的指靜脈信息丟失的問題，提出了一種基于膠囊網絡(Capsule Network，CapsNets)的指靜脈識別算法。CapsNets在整個學習過程中以“膠囊”的形式從底層傳遞至高層，如此以向量的形式封裝指靜脈的多維特征，特征會在網絡中被保存，而不是丟失后進行恢復。采用60 000張圖像作為訓練集，10 000張圖為測試集，通過對圖像增強、裁剪后進行網絡學習。通過實驗表明，CapsNets的網絡結構特征相比CNN在處理脊線區域時效果更加明顯，對比VGG精確度增加了13.6%，loss值也收斂到0.01。

基于深度學習的實時識別硬件系統框架設計

摘要：設計了一種基于深度學習的實時識別硬件系統框架。該系統框架使用Keras完成卷積神經網絡模型的訓練并提取出網絡的參數，利用ZYNQ器件的FPGA+ARM軟硬件協同的方式，使用ARM完成對實時圖像數據的采集、預處理及顯示，通過FPGA實現卷積神經網絡的硬化并對圖像進行識別，再將識別結果發送至上位機進行實時顯示。系統框架采用MNIST和Fashion MNIST數據集作為網絡模型硬化試驗樣本，實驗結果表明，在一般場景下該系統框架能夠實時、準確地完成圖像數據的獲取、顯示及識別，并且具有可移植性高、處理速度快、功耗低的特點。

基于TensorFlow深度學習手寫體數字識別及應用

摘要：手寫體數字的識別是人工智能識別系統中的重要組成部分。因個體手寫數字的差異，現有識別系統準確率較低。基于TensorFlow深度學習框架完成手寫體數字的識別及應用，首先建立TensorFlow深度學習框架，并分析了Softmax、卷積神經網絡(CNN)模型結構，再對手寫體數據集MNIST的60 000個樣本進行深度學習，然后進行10 000個樣本的測試對比，最后移植最優模型到Android平臺進行應用。實測數據驗證，相對于傳統的Softmax模型，基于TensorFlow深度學習CNN模型識別率高達99.17%，提升了7.6%，為人工智能識別系統的發展提供了一定的科研價值。

基于深度學習的人體行為識別算法

摘要：為改善人體行為識別任務中準確率低的問題，提出了一種基于批歸一化的卷積神經網絡（CNN）與長短期記憶(LSTM)神經網絡結合的神經網絡。CNN部分引入批歸一化思想，將輸入網絡的訓練樣本進行小批量歸一化處理，經過全連接之后，送入長短期記憶神經網絡中。該算法采用時空雙流網絡模型結構，視頻數據的RGB圖像作為空間流網絡輸入，光流場圖像作為時間流網絡輸入，再將時空雙流網絡各自得到的識別結果進行加權融合得到最終的行為識別結果。實驗結果表明，本文設計的時空雙流神經網絡算法在人體行為識別任務上具有較高的識別準確率。

基于深度學習的美國媒體“一帶一路”輿情的情感分析

摘要：分析美國主流新聞媒體針對“一帶一路”倡議的關注熱點，研究相關輿情的情感傾向。用網絡爬蟲自動采集相關新聞，篩選高頻詞獲得媒體關注熱點。提出一種自動摘要-卷積神經網絡（Convolutional Neural Network，CNN）的集成式模型進行文檔級情感分析。該模型首先提取摘要去除原始文檔中非重要數據的干擾，再利用卷積神經網絡進行句子級情感分析，通過基于語義指向的方法獲得文檔級的情感分數，并對情感波動異常文章二次分析。在真實數據上的對比實驗表明，自動摘要-CNN的集成式文檔級情感分析模型在情感分析方面優于單一CNN的方法。

基于深度學習的人體行為識別算法

摘要：為改善人體行為識別任務中準確率低的問題，提出了一種基于批歸一化的卷積神經網絡（CNN）與長短期記憶(LSTM)神經網絡結合的神經網絡。CNN部分引入批歸一化思想，將輸入網絡的訓練樣本進行小批量歸一化處理，經過全連接之后，送入長短期記憶神經網絡中。該算法采用時空雙流網絡模型結構，視頻數據的RGB圖像作為空間流網絡輸入，光流場圖像作為時間流網絡輸入，再將時空雙流網絡各自得到的識別結果進行加權融合得到最終的行為識別結果。實驗結果表明，本文設計的時空雙流神經網絡算法在人體行為識別任務上具有較高的識別準確率。

基于TensorFlow深度學習手寫體數字識別及應用

摘要：手寫體數字的識別是人工智能識別系統中的重要組成部分。因個體手寫數字的差異，現有識別系統準確率較低。基于TensorFlow深度學習框架完成手寫體數字的識別及應用，首先建立TensorFlow深度學習框架，并分析了Softmax、卷積神經網絡(CNN)模型結構，再對手寫體數據集MNIST的60 000個樣本進行深度學習，然后進行10 000個樣本的測試對比，最后移植最優模型到Android平臺進行應用。實測數據驗證，相對于傳統的Softmax模型，基于TensorFlow深度學習CNN模型識別率高達99.17%，提升了7.6%，為人工智能識別系統的發展提供了一定的科研價值。

基于深度學習的實時識別硬件系統框架設計

摘要：設計了一種基于深度學習的實時識別硬件系統框架。該系統框架使用Keras完成卷積神經網絡模型的訓練并提取出網絡的參數，利用ZYNQ器件的FPGA+ARM軟硬件協同的方式，使用ARM完成對實時圖像數據的采集、預處理及顯示，通過FPGA實現卷積神經網絡的硬化并對圖像進行識別，再將識別結果發送至上位機進行實時顯示。系統框架采用MNIST和Fashion MNIST數據集作為網絡模型硬化試驗樣本，實驗結果表明，在一般場景下該系統框架能夠實時、準確地完成圖像數據的獲取、顯示及識別，并且具有可移植性高、處理速度快、功耗低的特點。

基于膠囊網絡的指靜脈識別研究

摘要：針對卷積神經網絡(CNN)中空間上的指靜脈信息丟失的問題，提出了一種基于膠囊網絡(Capsule Network，CapsNets)的指靜脈識別算法。CapsNets在整個學習過程中以“膠囊”的形式從底層傳遞至高層，如此以向量的形式封裝指靜脈的多維特征，特征會在網絡中被保存，而不是丟失后進行恢復。采用60 000張圖像作為訓練集，10 000張圖為測試集，通過對圖像增強、裁剪后進行網絡學習。通過實驗表明，CapsNets的網絡結構特征相比CNN在處理脊線區域時效果更加明顯，對比VGG精確度增加了13.6%，loss值也收斂到0.01。

基于卷積神經網絡的圖像著色

摘要：圖像著色的目標是為灰度圖像的每一個像素分配顏色，它是圖像處理領域的熱點問題。以U-Net為主線網絡，結合深度學習和卷積神經網絡設計了一個全自動的著色網絡模型。在該模型中，支線使用卷積神經網絡SE-Inception-ResNet-v2作為高水平的特征提取器，提取圖像的全局信息，同時在網絡中使用PoLU(Power Linear Unit)函數替代線性整流函數(ReLU)。實驗結果證明此著色網絡模型能夠對灰度圖像進行有效的著色。

深度學習中的卷積神經網絡系統設計及硬件實現

摘要：針對目前深度學習中的卷積神經網絡（CNN）在CPU平臺下訓練速度慢、耗時長的問題，采用現場可編程門陣列（FPGA）硬件平臺設計并實現了一種深度卷積神經網絡系統。該系統采用修正線性單元（ReLU）作為特征輸出的激活函數并使用Softmax函數作為輸出分類器。利用流水線技術并針對每一層的特征運算進行了并行處理，從而能夠在1個系統時鐘周期內完成整個CNN中的295次卷積運算。系統最后采用MNIST數據集作為實驗樣本，實驗結果表明，在50 MHz的工作頻率下，FPGA的訓練用時相較于通用CPU的訓練用時提升了8.7倍，經過2 000次迭代后系統識別的準確率為92.42%。

基于PSO-BP神經網絡的人體穴位定位系統設計

摘要：穴位的位置是否找準會直接影響治療效果，因此設計了一種基于粒子群算法優化神經網絡（PSO-BP）的穴位相對坐標預測模型，然后與ARM結合構成一個可以用于人體穴位定位的系統。首先采用PC進行MATLAB仿真訓練學習，然后將最優權值及閾值保存下來并簡化算法嵌入ARM內，將在線預測轉變為離線過程。實驗結果表明：經粒子群優化過的BP神經網絡有效地改善了局部極值缺陷，可應用于定位端預測穴位的位置，并在LCD中顯示穴位相關信息，控制端收到位置數據后可執行電機上的運動操作。

基于深度學習的煙霧識別研究

摘要：基于Google第二代人工智能學習系統TensorFlow構建神經網絡對煙霧圖像進行識別檢測，通過改進的運動檢測算法截取疑似煙霧區域圖像，并結合PCA降維算法和Inception Resnet v2網絡模型在TensorFlow平臺下進行煙霧特征的訓練識別。該算法實現了較大范圍的火災實時檢測報警，經過實驗證明整個檢測過程準確地識別了視頻流中的煙霧區域，相比于傳統煙霧識別方法具有更高的準確率和自適應性，為大范圍的火災煙霧報警提供了一種有效方案。

基于深度學習的胸部X光影像分析系統

摘要：提出一種應用嵌入式技術和深度學習技術實現對胸部X光影像分析的設計方案。采用NIVIDIA公司生產的Jetson TX2作為核心板，配備以太網模塊、WiFi模塊等功能模塊搭建該分析系統的硬件平臺。在GPU服務器上利用MobileNets卷積神經網絡對標注的胸部X光影像數據集進行訓練，將訓練好的神經網絡模型移植到Jetson TX2核心板，在嵌入式平臺下完成對胸腔積液、浸潤、肺氣腫、氣胸以及肺不張癥狀的檢測。利用美國國立衛生研究院提供的胸部X光影像數據進行測試，通過實驗證明，該方法在識別準確率上優于其他的檢測方法，同時識別所需時間比其他方法短。

基于深度學習的圖像分類方法

摘要：提出了一種用于圖像分類的卷積神經網絡，將不同池化方式對圖像分類的影響進行了分析對比，采用重疊池化和dropout技術，較好地解決過擬合問題。與傳統神經網絡相比，該方法在CIFAR-10數據集上獲得了較好的結果，在測試集上準確率比訓練集上準確率高9%左右。

基于機器視覺的智能導盲眼鏡設計

摘要：提出一種基于機器視覺的智能導盲眼鏡系統的設計方案。采用三星公司Cortex-A8架構的 S5PV210作為中央處理器，搭載Linux系統，配備雙目采集、GPS定位、語音播報、GSM短信、語音通話、無線傳輸六大核心功能模塊搭建智能導盲眼鏡系統的硬件平臺，結合深度學習算法在遠程云服務器上完成了對目標場景的智能識別，最后以語音的形式實時對盲人的行走作出準確引導。系統測試結果表明，該智能導盲眼鏡系統在測試環境下不僅能對盲人出行正確導航，還具有一定的目標識別能力，能幫助盲人進行簡易物品歸類。該系統還兼有GPS定位、語音通話、GSM短信等多項輔助功能。

基于深度學習的無人機識別算法研究

摘要：無人機的廣泛運用，在給人們帶來便利的同時，也引發了不良影響。比如，無人機飛入禁飛區引發安全問題，由于不正當的使用侵犯公民的隱私等，因此需要構建一個無人機警察系統，對無人機實施監控，遏制亂飛現象。采用傳統的識別方法，靈活性不足，精度也不夠高。為此提出一種基于深度學習的無人機識別算法，通過訓練一個基于卷積神經網絡（CNNs）的學習網絡，得出一個高效的識別模型，實現無人機和非無人機間的分類。模型的測試結果表明，該方法具有較高的識別率。

基于視覺引導的SCARA機器人自動裝配系統

摘要：現有生產線工業機器人抓取點固定，工件只能以固定的姿態提前擺放在固定的位置，這種裝配模式很難滿足復雜的工業生產要求且效率低下。設計了基于視覺引導的機器人裝配系統改進原有系統。設計了機器視覺系統，實現了工件的快速識別、定位以及姿態確定功能；設計了抓放系統，實現了工件的精確抓取和安裝功能；采用Visual Studio的MFC開發，實現圖像處理算法，并利用Socket通信將坐標和姿態數據發送給機器人。通過實驗驗證本系統具有良好的穩定性和快速性，可以滿足生產的要求，大幅提高生產效率。

六月丁香久久,五月婷婷久久综合,久久加久久,色狠狠网,国产一区二区三区久久精品,毛片亚洲毛片亚洲毛片

" 人工智能"的相關文章

期刊動態

官方微店訂閱