基于注意力與Bi-LSTM混合算法的車企輿情情感分析
信息技術與網絡安全
李宸嚴,劉 繼
(新疆財經大學 統計與數據科學學院,新疆 烏魯木齊830012)
摘要: 隨著大數據時代的來臨,網絡輿情對消費者情感分析和商家營銷策略產生重大影響。如何利用大數據技術提高車企輿情情感分析效能,受到文本挖掘研究者廣泛關注。針對傳統RNN在長文本分類中的長期依賴問題,提出了一種注意力機制與Bi-LSTM結合的混合分類算法(At-Bi-LSTM)。算法利用Bi-LSTM分析車企網絡評論的情感,引入注意力機制計算不同單詞對評論情感的貢獻權重,降低長文本中無關詞對分類結果的影響。實驗證明,At-Bi-LSTM算法在車企輿情情感分類上取得了比樸素貝葉斯、SVM、LSTM更好的分類效果。
中圖分類號: TP391.1
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.01.008
引用格式: 李宸嚴,劉繼。 基于注意力與Bi-LSTM混合算法的車企輿情情感分析[J].信息技術與網絡安全,2021,40(1):45-49.
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.01.008
引用格式: 李宸嚴,劉繼。 基于注意力與Bi-LSTM混合算法的車企輿情情感分析[J].信息技術與網絡安全,2021,40(1):45-49.
Public opinion sentiment analysis of automobile enterprises based on attention mechanism and Bi-LSTM
Li Chenyan,Liu Ji
(School of Statistics and Data Science,Xinjiang University of Finance,Wulumuqi 830012,China)
Abstract: With the advent of the era of big data, online public opinion has a significant impact on consumer sentiment analysis and business marketing strategy. How to use big data technology to improve the efficiency of sentiment analysis of automobile enterprises′ public opinion has been widely concerned by text mining researchers. Aiming at the long-term dependence of traditional RNN in long text classification, a hybrid classification algorithm(At-BI-LSTM) combining attention mechanism and Bi-LSTM is proposed. The algorithm uses Bi-LSTM to analyze the emotion of online reviews of automobile enterprises, and introduces attention mechanism to calculate the contribution weight of different words to the sentiment of comments, so as to reduce the influence of irrelevant words in long text on classification results. Experiments show that At-BI-LSTM algorithm achieves better classification effect than Naive Bayes, SVM and LSTM.
Key words : attention mechanism;Bi-LSTM;public opinion of car enterprises;emotion classification
0 引言
2020年7月,習近平總書記在一汽研發總院調研時指出:汽車制造業國際競爭激烈,要把民族汽車品牌搞上去,如何提升品牌的形象和溢價效應是首要問題。隨著互聯網的發展,車企的發展規劃、車輛品質、創新水平都受到廣泛關注[1]。網絡評論暗含網民豐富的情感,通過對評論情感的挖掘,車企可了解近期的網絡輿情,從而采取相應的應對措施。因此研究車企網絡輿情情感,對提高車企形象、維護車企利益具有十分重要的意義。
輿情情感識別的關鍵在于對文本情感的識別[2]。當前情感識別方法有兩類:基于情感詞典的方法、基于機器學習的方法。基于情感詞典的方法利用情感詞能映射情感傾向的特點,通過測度單詞與情感標簽的關聯度來構建情感詞典,依據文本中的情感詞判斷其情感類別[3]。此方法雖能實現文本的情感分類,但存在三方面問題:(1)網絡用語的盛行對情感詞典的構建和維護提出了新的挑戰;(2)處理二義性的詞語時分類效果不佳;(3)無法考慮上下文的語義信息。基于機器學習的方法逐步成了情感識別領域的主旋律。PANG B等[4]人最先在電影評論的情感分析中應用了最大熵、SVM、樸素貝葉斯三種機器學習方法。大量實驗證明,基于機器學習的方法在解決情感識別問題時的性能優秀。
本文詳細內容請下載:http://www.j7575.cn/resource/share/2000003316
作者信息:
李宸嚴,劉 繼
(新疆財經大學 統計與數據科學學院,新疆 烏魯木齊830012)
此內容為AET網站原創,未經授權禁止轉載。