《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 智能答疑系統的設計與研究
智能答疑系統的設計與研究
來源:微型機與應用2014年第5期
徐 曉
(江蘇聯合職業技術學院無錫機電分院,江蘇 無錫 214028)
摘要: 提出了一個高效的、科學的智能答疑系統。介紹了該系統開發的環境、分析了該系統組成的各個模塊以及關鍵技術,最后實踐證明了該系統提高了教學效率和教學手段,達到了較為理想的教學效果。
Abstract:
Key words :

摘  要: 提出了一個高效的、科學的智能答疑系統。介紹了該系統開發的環境、分析了該系統組成的各個模塊以及關鍵技術,最后實踐證明了該系統提高了教學效率和教學手段,達到了較為理想的教學效果。
關鍵詞: 智能答疑系統;知識庫中文分詞技術;RSS技術

 隨著Internet上遠程教學普及,遠程教學中的答疑成為人們關注的焦點之一。學習者從聽眾變成索求者,當遇到無法理解需要幫助時,及時的答疑和幫助成了必不可少的內容。在遠程教學中建立智能答疑系統,可以使得學生在任何時間、任何地點都可以得到解答。教師也不必一直在線回答學生問題或重復回答相似問題。答疑系統自動回答學生的問題,一方面提高學生學習熱情,提高解答效率,另一方面可以節約教師的時間,間接提高工作效率。
 本文通過.net建立一個簡單高效的智能答疑系統,教師將疑難問題按一定組織方式,存放到知識和信息庫中。學生提交問題時,通過中英文分詞技術來分析并自動地匹配學生所提出的問題,自動地給予問題解答。當在知識庫中沒有搜索到信息可以采用電子郵件或是通過在線方式征求解答,有人解答后,系統自動將解答發給學生。
1 開發環境
 系統采用C#編碼,利用VS2005+SQL2005數據庫平臺開發智能答疑系統,使用ADO.Net實現對數據庫的訪問。
2 模塊的設計
 智能答疑系統是一個智能適應性的知識庫系統,在教學設計階段,教師將最常見的疑難問題按一定的組織方式,存放到知識庫中,當學生在遇到疑難問題時,對學生以自然語言形式提出的問題進行預處理,主要是采用分詞技術對問題語句進行切分處理,提取出匹配所需要的關鍵詞,根據預先建立的基于關鍵詞的索引結構,將答案快速定位,找出問題匹配度最高的答案。若在知識庫中沒有搜索到信息可以采用電子郵件或是通過在線方式征求解答,有人解答后,系統自動將解答發給學生。總之,智能答疑系統是一種支持同步和異步答疑以及討論的系統。如圖1所示,該系統包括以下幾個模塊:

 (1)提問模塊
 學生可以使用提問模塊來尋求問題的答案,這是使用系統的基本手段之一。
對于問題文本首先采用正規表達式取出中文和英文,然后采用分詞技術,主要是按照一定的策略將要分析的字串與詞典中的詞條進行匹配來分解一系列的子串。然后在系統的知識庫中以及討論形成的材料中搜索與問題相關的材料,并按照相關程度返回結果。
 (2)討論模塊
 討論模塊是學生使用智能答疑系統的另外一種基本手段。用戶可以參加BBS和聊天室等來進行討論。
當學生在沒有得到系統滿意的問題解答時,系統提供了給教師發郵件模塊來請求教師解答,并且提供了給教師手機發短信模塊,以便提醒教師郵箱里有提示;還提供討論模塊,請求系統別的學生幫助解答;還提供了RSS閱讀器,可以在其中查看預訂的相關網上討論社區中的資源。
 (3)RSS模塊
 RSS模塊可以簡單地理解為一種方便的信息獲取工具。RSS獲取信息的模式與加入郵件列表模式相似,無需登錄到各個提供信息的站點即可自動獲取。該模塊主要建立一個RSS閱讀器來訂閱知識點,一旦網站上的這些知識點被更新,就會自動發送到鏈接源閱讀器中。這樣就可以不斷更新和擴充知識庫中的內容,如圖2所示。

3 關鍵技術
3.1 正規表達式

 正規表達式允許快速有效地處理文本。被處理的文本小到一個電子郵件地址,大到一個多行的輸入框內容。正規表達式的使用不僅允許使用一個定義模式來校驗文本,而且還允許從匹配一個給定模式的文本中提取數據。
 本系統使用正規表達式來取出學生問題中的中文和英文,然后執行相應的中英文分詞技術,如圖3所示。

3.2 中文分詞技術
 中文分詞(Chinese Word Segmentation)指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。現有的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統計的分詞方法。基于字符串匹配的分詞方法又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。按照掃描方向的不同,串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優先匹配的情況,可以分為最大(最長)匹配和最小(最短)匹配;《計算機基礎》課程的智能答疑系統采用的是機械分詞方法中的正向最大匹配算法。
3.2.1 分詞算法
 采用基于字符串匹配的分詞方法,它是按照正向最大匹配法(由左到右的方向);將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。
例如,對一個字符串S,從前到后掃描,對掃描的每個字,從詞庫中尋找最長匹配。比如假設S=“我是中華人民共和國公民”,詞庫中有“中華人民共和國”,“中華”,“公民”,“人民”,“共和國”……等詞。當掃描到“中”字,那么從中字開始,向后分別取1,2,3,……個字(“中”,“中華”,“中華人”,“中華人民”,“中華人民共”,“中華人民共和”,“中華人民共和國”,“中華人民共和國公”),詞庫中的最長匹配字符串是“中華人民共和國”,那么就此切分開,掃描器推進到“公”字。
3.2.2 數據結構
 哈希表是一種高效的數據結構。哈希表最大的優點,就是把數據的存儲和查找消耗的時間大大降低,幾乎可以看成是常數時間;而代價僅僅是消耗比較多的內存。然而在當前可利用內存越來越多的情況下,用空間換時間的做法是值得的。另外,編碼比較容易也是它的特點之一。
 本系統采用哈希表(Hashtable)記錄詞庫。首先將詞典中的詞進行處理,對每一個詞語,如果該詞語有N個字,則將該詞語的1,1~2,1~3,…,1~N個字作為鍵,插入相應詞長度的哈希表中,而同一個鍵如果重復插入,則后面的值遞增,如圖4所示。

 

 

 該智能答疑系統能在一定程度上減少答案域的搜索范圍,并能獲得準確的答案。實踐證明該智能答疑系統是有一定的智能性、主動性和方便性等特點,提高了教學效率和教學手段。
參考文獻
[1] 趙成龍.一個基于Web的智能答疑系統的設計與實現[D].南京:東南大學,2004.
[2] 陳銀鳳.RSS技術的應用和發展趨勢探討[J].內蒙古財經學院學報,2008,6(1):98-102.
[3] 余戰秋.中文分詞技術及其應用初探[J].電腦知識與技術,2004,(32):81-83.
[4] 陳挺.中文字段匹配算法[J].計算機工程,2003,29(13):118-120.
[5] 柳泉波,黃榮懷,何克抗.智能答疑系統的設計與實現[J].中國遠程教育,2000,121(8):43-45.

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 成av人电影在线观看 | 色视频网站色视频播放 | 伊人青青视频 | 国产亚洲精品俞拍视频 | 六月天综合网 | 国产成人高清视频 | 国产成人精品日本亚洲语言 | 精品久久久久久久 | 国产视频 每日更新 | 国产视频视频 | 天天躁日日2018躁狠狠躁 | 免费一区区三区四区 | 借种无删减版 | 欧美在线日韩在线 | 久久男人的天堂 | 五月综合久久 | 久久99精品久久久久久秒播放器 | 国产乱在线观看视频 | 青草青青在线视频 | 国产精品久久久久久网站 | 免费靠视频完整版 | 国产成人欧美 | 亚洲伊人成综合成人网 | 免费黄色网址在线播放 | 六月丁香网站 | 亚洲欧美另类精品久久久 | 久久国产一区二区三区 | 99精品国产在热久久 | 免费看毛片网 | 国内久久精品 | 久久免费视频1 | 免费在线观看a级毛片 | 国产成人精品cao在线 | 丁香婷婷激情网 | 多哥 电影| 久久婷婷激情综合中文字幕 | 奇米影视888四色首页 | 五月天播播网 | 精品123| 色涩五月 | 手机精品在线 |