地鐵運營崗位應急處置培訓的語音識別研究
信息技術與網絡安全 6期
周 楊,錢雪軍
(同濟大學 電子與信息工程學院,上海 201804)
摘要: 地鐵交通運營是一種整體性活動,離不開各部門間的協調配合,地鐵運營崗位應急處置培訓系統應用于多個崗位的聯合培訓。該系統通過語音識別來實現模擬崗位間語音交互及對培訓過程智能評價的功能。提出的語音識別方法可實現離線網絡下對地鐵培訓專業術語的高識別精度,利用深度全序列卷積神經網絡(DFCNN)和鏈接時序分類(CTC)構建聲學模型,對應急處置培訓用語進行整理并構建專業術語庫,基于統計學構建語言模型。實驗結果表明,該語音識別方法能夠有效識別地鐵應急處置培訓用語,為地鐵運營崗位人員的培訓和考核提供更全面的評價指標。
中圖分類號: U231.92;TP39
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.012
引用格式: 周楊,錢雪軍. 地鐵運營崗位應急處置培訓的語音識別研究[J].信息技術與網絡安全,2022,41(6):73-76,93.
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.012
引用格式: 周楊,錢雪軍. 地鐵運營崗位應急處置培訓的語音識別研究[J].信息技術與網絡安全,2022,41(6):73-76,93.
Speech recognition research on emergency disposal training for subway operation positions
Zhou Yang,Qian Xuejun
(School of Electronic and Information Engineering, Tongji University, Shanghai 201804, China)
Abstract: Metro transportation operation is a holistic activity, and it is inseparable from the coordination and cooperation between various departments. The subway operation post emergency response training system is used for joint training of multiple posts. The system needs voice recognition to simulate the function of voice interaction between posts and intelligent evaluation of the training process. The speech recognition method proposed in this paper realizes high recognition accuracy of subway training terminology under offline network. Using deep fully convolutional neural network (DFCNN) and connectionist temporal classification (CTC) technology to build acoustic models, collating and constructing professional terminology bases for emergency disposal training terms, and building language models based on statistics and terminology banks. Experimental results show that the speech recognition technology can effectively identify training terms and provide more comprehensive evaluation indicators for the training and assessment of personnel in operational positions.
Key words : metro emergency disposal training; speech recognition; convolutional neural networks
0 引言
地鐵行車事故和突發事件嚴重影響了地鐵的正常運營并威脅到了人民群眾的生命財產安全[1]。對于相應的應急預案而言,應急預案演練的效果直接決定了應急響應的速度和應急處置實施的有效性,其中應急處置培訓是應急預案演練的重點。
目前的聯合培訓系統需要所有培訓崗位均為在崗狀態,無法實現在聯合培訓中的單崗位培訓功能。因此在對各個崗位進行應急處置培訓過程中需要模擬各個崗位之間的語音交互,實現單個崗位獨立培訓時的智能互動,同時實現對培訓過程的記錄與智能評價。語音識別是語音交互的基礎。目前,國內外語音識別技術已經趨于成熟,走向真正實用化[2],在日常對話等常見領域已達到實用要求,但是在地鐵等專業應用領域的識別效果不佳[3]。
本文基于DFCNN-CTC框架提出新的語音識別聲學模型結構,以實現對應急處置培訓術語的高精度識別。實驗表明,該語音識別模型可應用于應急處置培訓系統中。
本文詳細內容請下載:http://www.j7575.cn/resource/share/2000004538
作者信息:
周 楊,錢雪軍
(同濟大學 電子與信息工程學院,上海 201804)
此內容為AET網站原創,未經授權禁止轉載。