《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于二次主成分分析模型解決病情確診問題
基于二次主成分分析模型解決病情確診問題
許延鑫 熊繼平
浙江師范大學 數理與信息工程學院,浙江 金華 321004
摘要: 通過主成分分析并結合SPSS軟件得到具有高信息含量的A第一主成分和A第二主成分,并分別確定A第一主成分和A第二主成分的函數解析式。在變量基礎上增加A第一主成分變量,并再次通過主成分分析得到具有高信息含量的B第一主成分和B第二主成分,并分別確定B第一主成分、B第二主成分和綜合主成分的函數解析式,對三者分別進行排序,確定患病與健康的判定指標。
關鍵詞: 醫療監護 成分分析
Abstract:
Key words :

摘  要: 通過主成分分析并結合SPSS軟件得到具有高信息含量的A第一主成分和A第二主成分,并分別確定A第一主成分和A第二主成分的函數解析式。在變量基礎上增加A第一主成分變量,并再次通過主成分分析得到具有高信息含量的B第一主成分和B第二主成分,并分別確定B第一主成分、B第二主成分和綜合主成分的函數解析式,對三者分別進行排序,確定患病與健康的判定指標。
關鍵詞: 主成分分析;多因子綜合分析;統計回歸分析;SPSS技術

  主成分分析是將多個變量通過線性變換以選出較少個數重要變量的一種多元統計分析方法。在實際課題中,為了全面分析問題,往往提出很多與此有關的變量,因為每個變量都在不同程度上反映這個課題的某些信息。但是,在用統計分析方法研究多變量的課題時,變量個數太多就會增加課題的復雜性。人們希望變量個數較少,同時得到較多的信息。變量之間存在一定的相關關系,當2個變量之間有一定相關關系時,可以解釋為這2個變量反映此課題的信息有些重疊。主成分分析是對原先提出的所有變量建立盡可能少的新變量,這些新變量在反映課題的信息方面盡可能保持原有的信息[1]。
    人們到醫院就診時,通常要化驗指標來協助醫生的診斷。診斷就診人員是否患腎炎時通常要化驗人體內各種元素含量,主要包括鋅(Zn)、銅(Cu)、鐵(Fe)、鈣(Ca)、鎂(Mg)、鉀(K)及鈉(Na)。表1是確診病例的化驗結果,其中1~30號病例是已經確診為腎炎病人的化驗結果,31~60號病例是已經確定為健康人的結果[2]。在論文中列出的數據是原始數據中1~10號病例及31~40號病例的數據,運用主成分計算時以所有數據為初始數據。

1 主成分分析模型

2  模型應用
2.1  問題分析解決
 

  因C1=[X1 X2 … X7]*[U11 U12 … U17]T,因為特征值的方差貢獻率為72.67 %,表明C1包含原變量中的絕大部分信息,則在原來7個因子的基礎上引入C1作為第8個因子,C1=[0.70502、0.6341、0.87415、0.80724、0.4212、0.62897、0.37992、0.85489、0.57495、0.71527、-0.74635、0.03003、-0.30047、-0.03826、-0.80605、-1.32826、-0.5588、-0.00363、0.37216、-3.19199]。再將其做標準化變化,再次通過主成分分析并結合SPSS軟件確定B第一主成分F1、第二主成分F2和綜合主成分F。根據對這8個因子通過SPSS的因子分析如表4、表5所示。

  由表5可知C1與5種元素有著顯著的相關性[5],可見許多變量之間直接的相關性比較強,證明它們存在信息上的重疊。
2.2  主成分表達式
    主成分個數提取原則為主成分對應特征值>1的前m個主成分。特征值在某種程度上可以被看成是表示主成分影響力度大小的指標,如果特征值<1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度,因此一般可以用特征值>1作為納入標準。通過表4可知,提取2個主成分,即m=2。從表5可知C1、Zn、Cu、Fe、Ca、Mg在B第一主成分上有較高的載荷,說明B第一主成分基本反映了這些指標的信息,K、Na在B第二主成分上有較高的載荷,說明B第二主成分基本反映了K、Na 2個指標的信息。所以提取2個主成分是基本反映全部指標的信息,所以決定用2個新的變量來代替原來的8個變量。通過SPSS將表5中的數據除以主成分相對應的特征值開平方根,得到兩主成分中每個指標所對應的系數。將得到的特征向量與標準化后的數據相乘,然后就可以得到主成分表達式[6]:
  

  

  由(1)、(2)、(3)式得到B第一主成分F1、B第二主成分F2和綜合主成分F的數據及排名,如表6所示。

  由表6可以看出第一主成分中以0為臨界值,0.1為修正值,即(-0.1,0.1)為不穩定狀態,此狀態下的就診人員將隨機被確定為患者和健康者中的1個。而當F1>0.1時,將此時對應的就診人員確定為健康者;當F1<-0.1時,將此時的就診人員確定為患者。經此方法判定的患者與健康者與表1中的患者與健康者基本一致,并且與用綜合主成分分析得到的結果基本一致。其判定的準確性可以達到95%以上,因此具備很強的可信性與科學性。
  本文創新點在于模型中連續做了2次主成分分析,即二次主成分分析,并伴有大量的數據處理和數據分析,合理的結論背后擁有強大的理論支持和數據支持,具有很強的科學性和可信性。不過,確診病人還是需要通過醫生的具體分析,以達到所需效果。
參考文獻
[1] 主成分分析[EB/OL].http://baike.baidu.com/view/45376.htm,2009-03.
[2]  北京工業大學數學建模競賽初賽試題B題[EB/OL].http://www.wendang.com/soft/16922.htm,2008-05.
[3] 主成分分析[EB/OL].http://ec.njue.edu.cn/tjx/wf_dytjfx/slides/chap03.2009-05.
[4]  張文霖.主成分分析在SPSS中的操作和應用[J].理論與分析,2005(12):31-35.
[5]  王林輝.基于主成分分析的棉花品種綜合評價及聚類分析[J].廣東農業科學,2009(1):29-32.
[6]  董寒青.解析SPSS對主成分分析的計算技術[J].知識叢林,2004(3):117-118.
 

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 欧美11一12周岁a在线观看 | 青青色在线观看 | 欧美狠狠 | 五月天.com| 国产精品久久久久电影 | 欧美一区精品 | 日本精品久久久久中文字幕 1 | 潦草影视2019 | 一级毛片免费视频观看 | 日本不卡免费新一区二区三区 | 国产成人综合高清在线观看 | 色婷婷色99国产综合精品 | 午夜国产在线 | 国产干美女 | 四虎影视国产884a精品亚洲 | 国产高清成人mv在线观看 | 国产精品原创永久在线观看 | 天天爽夜夜爽精品视频一 | 色人阁五月天 | 久久精品国产精品亚洲蜜月 | 久久久久久久久久国产精品免费 | 国产二区自拍 | 国产精品久久久久毛片 | 精品99在线观看 | 色老头久久久久久久久久 | 国产性自拍 | 国产精品视频一区二区三区不卡 | 国产成人精品视频 | 成人综合久久综合 | 国产一级毛片在线 | 免费视频久久久 | 日韩视频在线观看免费 | 久久久久久久男人的天堂 | 九九精品九九 | 国产门事件真实视频在线 | 欧美生活性色 | 国产在线精品网址你懂的 | 久久男女 | 中文精品久久久久中文 | 第四色网址 | 国产成在线人视频免费视频 |