中文久久久字幕|亚洲精品成人 在线|视频精品5区|韩国国产一区

歡迎來到優(yōu)發(fā)表網(wǎng),期刊支持:400-888-9411 訂閱咨詢:400-888-1571股權(quán)代碼(211862)

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

統(tǒng)計學(xué)的分析方法范文

時間:2023-07-28 16:33:42

序論:在您撰寫統(tǒng)計學(xué)的分析方法時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

統(tǒng)計學(xué)的分析方法

第1篇

一、統(tǒng)計學(xué)碩士教學(xué)的問題分析

1.教學(xué)課程缺乏

2011年統(tǒng)計學(xué)專業(yè)才作為一級學(xué)科在研究生專業(yè)中開設(shè),統(tǒng)計碩士的教學(xué)尚未形成體系。統(tǒng)計學(xué)專業(yè)在研究生專業(yè)中的開設(shè)歷史短,各大高校對統(tǒng)計學(xué)的學(xué)科建設(shè)及各個研究方向的培養(yǎng)計劃還不夠完善,導(dǎo)致教學(xué)模糊。課程安排也存在不合理的地方,統(tǒng)計碩士必須具有扎實的統(tǒng)計基礎(chǔ)才能更好地從事統(tǒng)計的研究工作。統(tǒng)計學(xué)專業(yè)的學(xué)習(xí)要求學(xué)生的數(shù)學(xué)基礎(chǔ)及數(shù)理統(tǒng)計基礎(chǔ)較好。統(tǒng)計碩士的培養(yǎng)計劃中,專門培養(yǎng)統(tǒng)計能力的課程較少,其余多是根據(jù)每個導(dǎo)師所研究的領(lǐng)域安排的課程,與統(tǒng)計直接相關(guān)的課程尤為缺乏。

2.教學(xué)形式單一,缺乏實例

隨著社會的進步,統(tǒng)計學(xué)的知識越來越豐富,統(tǒng)計學(xué)的應(yīng)用越來越廣泛,但統(tǒng)計碩士的教學(xué)形式卻還很單一。統(tǒng)計碩士教學(xué)多是板書或是通過多媒體教學(xué),大部分課程都是老師講、學(xué)生聽,只有極少數(shù)的課程由學(xué)生講解或討論。這些少數(shù)的課程是不同研究方向的課程討論,加深了學(xué)生在自己研究領(lǐng)域的知識領(lǐng)悟,但統(tǒng)計學(xué)基礎(chǔ)知識并沒有鞏固。統(tǒng)計學(xué)是一門綜合性學(xué)科,它的應(yīng)用范圍幾乎覆蓋了科學(xué)的各個領(lǐng)域。統(tǒng)計學(xué)應(yīng)用廣泛,通過各種軟件來實現(xiàn)取據(jù)的分析。高校開設(shè)的軟件課程一般包括SPSS、Matlab、R軟件等,掌握這些軟件最好的方法就是在實際中來運用。教學(xué)實例的欠缺,讓統(tǒng)計學(xué)專業(yè)的碩士研究生在學(xué)習(xí)或應(yīng)用統(tǒng)計知識時困難重重。

二、方法建議

1.合理規(guī)劃研究方向

目前統(tǒng)計學(xué)碩士教學(xué)中存在統(tǒng)計學(xué)各研究方向教學(xué)模糊。合理地規(guī)劃各個研究方向及培養(yǎng)計劃是培養(yǎng)統(tǒng)計碩士的基礎(chǔ)。如今統(tǒng)計學(xué)滲透于各行各業(yè),社會科學(xué)、自然科學(xué)都離不開統(tǒng)計學(xué)知識。統(tǒng)計學(xué)研究方向的劃分,需要結(jié)合統(tǒng)計學(xué)實際的運用及當(dāng)前的研究領(lǐng)域。不管研究方向如何設(shè)置,都要著眼于統(tǒng)計學(xué)的基礎(chǔ)知識及與之相結(jié)合的學(xué)科,例如教育統(tǒng)計,應(yīng)該結(jié)合統(tǒng)計知識與教育學(xué)的知識,而不是單方面的教育或統(tǒng)計知識,統(tǒng)計學(xué)的作用就是運用統(tǒng)計知識處理解決其他學(xué)科的實際數(shù)據(jù)等問題。

2.適當(dāng)增加教學(xué)課程、教學(xué)實例

研究生的課程較少,統(tǒng)計學(xué)更需要掌握好理論知識再運用于實踐。增加統(tǒng)計學(xué)的基礎(chǔ)課程,增設(shè)統(tǒng)計學(xué)學(xué)生都需要學(xué)習(xí)的課程,加強統(tǒng)計學(xué)知識的學(xué)習(xí)。統(tǒng)計學(xué)是研究搜集數(shù)據(jù)、分析數(shù)據(jù)并通過分析數(shù)據(jù)的結(jié)果正確地推斷出某種現(xiàn)象規(guī)律的科學(xué)。統(tǒng)計學(xué)教學(xué)與實際例子密不可分,增加教學(xué)實例不僅能加強專業(yè)方向的研究,還能引導(dǎo)學(xué)生深入研究以及加強對統(tǒng)計學(xué)專業(yè)知識的靈活運用。

3.采用多元化教學(xué)

統(tǒng)計碩士的教學(xué)存在教學(xué)手段單一的問題,多元化的教學(xué)手段是改變目前教學(xué)單一的一種方式。通過數(shù)據(jù)收集,根據(jù)所學(xué)統(tǒng)計知識運用統(tǒng)計軟件分析,最終得出結(jié)論及提出建議。在分析數(shù)據(jù)的過程中不僅學(xué)會運用,而且加強知識的理解和記憶。除了統(tǒng)計軟件的教學(xué),學(xué)生還可通過感興趣的實際案例來學(xué)習(xí)掌握知識。學(xué)生講課的形式也是一種可采用的教學(xué)方式,學(xué)生提前準(zhǔn)備要講的內(nèi)容。多元化的教學(xué)方式不僅能加強學(xué)生的學(xué)習(xí)興趣,而且能讓學(xué)生更好地掌握知識。

三、結(jié)束語

第2篇

Statistical and Machine

Learning Approaches for

Network Analysis

2012,344p

Hardcover

ISBN9783527331833

M·德默等編

圖形結(jié)構(gòu)被用于計算機可以識別的結(jié)構(gòu)信息時,對圖形信息進行統(tǒng)計分析就成為可能。生物信息學(xué)、分子與系統(tǒng)生物學(xué)、理論物理、計算機科學(xué)、化學(xué)、工程等多個領(lǐng)域都在利用這一特點充分發(fā)揮計算機在分析和統(tǒng)計方面的優(yōu)勢。本書的一個重要特點就是將諸如圖論、機器學(xué)習(xí)及統(tǒng)計數(shù)據(jù)分析之類的理論相互結(jié)合,形成一個新領(lǐng)域,以交叉學(xué)科的方式探索復(fù)雜網(wǎng)絡(luò)?;蚪M、蛋白質(zhì),信號以及代謝組學(xué)數(shù)據(jù)的大規(guī)模生成使得復(fù)雜網(wǎng)絡(luò)的構(gòu)建成為可能,它為理解生理學(xué)以及病理學(xué)狀態(tài)的分子基礎(chǔ)提供了一個嶄新的框架。網(wǎng)絡(luò)和基于網(wǎng)絡(luò)的方法用于生物學(xué)中以便表征基因組、遺傳機理以及蛋白質(zhì)信號。疾病被看作關(guān)鍵細胞網(wǎng)絡(luò)的異常干擾。如今,在對諸如癌癥、糖尿病等的復(fù)雜疾病的干預(yù)中,就使用網(wǎng)絡(luò)理論來分析。

本書共有11章:1.重構(gòu)及劃分生物網(wǎng)絡(luò)計算方法概論; 2.復(fù)雜網(wǎng)絡(luò)入門:度量、統(tǒng)計性質(zhì)及模型; 3.進化中的生物網(wǎng)絡(luò)建模; 4.內(nèi)含動力學(xué)的生物網(wǎng)絡(luò)的模塊性配置; 5.統(tǒng)計概算機對管理網(wǎng)絡(luò)大規(guī)模因果推理的影響; 6.加權(quán)頻譜分布:網(wǎng)絡(luò)結(jié)構(gòu)分析的度量; 7.進化中的隨機二部圖的結(jié)構(gòu); 8.圖形內(nèi)核; 9.用于早老性癡呆病的基于網(wǎng)絡(luò)的信息協(xié)同分析; 10.結(jié)構(gòu)化數(shù)據(jù)中基于密度的集合枚舉; 11.采用加權(quán)圖形內(nèi)核的下位詞析取。

本書第1主編是奧地利健康與生命大學(xué)生物信息學(xué)和轉(zhuǎn)化研究所所長,他在生物信息學(xué)、系統(tǒng)生物學(xué)和應(yīng)用離散數(shù)學(xué)領(lǐng)域130篇。他是Wiley出版的《復(fù)雜疾病醫(yī)學(xué)生物統(tǒng)計學(xué)》《復(fù)雜網(wǎng)絡(luò)分析》和《微陣列數(shù)據(jù)分析》等書的合作編者。

本書可用作應(yīng)用離散數(shù)學(xué)、生物信息學(xué)、模式識別、計算機科學(xué)專業(yè)跨學(xué)科研究生課程的補充讀物,對于這些領(lǐng)域的研究人員和專業(yè)人員,也是一本有價值的參考書。

胡光華,退休高工

(原中國科學(xué)院物理學(xué)研究所)

第3篇

【關(guān)鍵詞】統(tǒng)計學(xué)、教學(xué)方法方差分析(ANOVA)萊文方差等同性檢驗

一、引言

方差分析是一種常用的統(tǒng)計分析方法,屬于統(tǒng)計學(xué)教學(xué)中的重點和難點之一。從統(tǒng)計方法上課,方差分析是較為復(fù)雜的一種假設(shè)檢驗的方法,回歸分析的結(jié)果中也涉及到方差分析的內(nèi)容,所以對學(xué)習(xí)統(tǒng)計學(xué)課程的學(xué)生來說,正確理解和掌握方差分析的思想和原理顯然非常重要。但從授課教師的角度,一些教師往往會發(fā)現(xiàn)方差分析的內(nèi)容不好講,也講不好,無法讓學(xué)生較好地理解方差分析的原理。本文基于筆者多年統(tǒng)計學(xué)課程教學(xué)的經(jīng)驗總結(jié),圍繞方差分析的概念、原理和前提條件等教學(xué)內(nèi)容,與同行探討教學(xué)方法。

二、方差分析的概念

方差分析(AnalysisofVariance,縮寫為ANOVA),是由英國統(tǒng)計與遺傳學(xué)家,現(xiàn)代統(tǒng)計科學(xué)的奠基人之一,R.A.Fisher發(fā)明的,用于檢驗多個總體均值是否全相等的一種統(tǒng)計推斷方法。例如,一個國家不同地區(qū)的成年男性平均身高是否相等呢?對于該問題的分析就可以使用方差分析的方法。假設(shè)該國分為北部、中部和南部等三個區(qū)域,成年男性平均身高分別用來表示,則相應(yīng)零假設(shè)和備擇假設(shè)為:

H0:μ1=μ2=μ3H1:μj不相等,j=1,2,3

如果最后零假設(shè)無法被拒絕,可以得出三個地區(qū)成年男性的平均身高不存在顯著差異,即地區(qū)因素對身高沒有影響;反之,如果最后拒絕零假設(shè),從而支持被擇假設(shè),則可以得出三個地區(qū)成年男生的平均身高存在顯著差異,至少有一個地區(qū)的平均身高與另一個地區(qū)不一樣,說明地區(qū)因素對身高有影響。因此,方差分析也可以用于研究一個自變量(通常為分類變量)對別一個變量(數(shù)值變量)是否有影響的問題。如果只涉及到一個自變量,該方差分析方法稱為單因素方差分析,涉及兩個自變量則稱為雙因素方差分析。本文主要圍繞單因素方差分析的教學(xué)。方差分析的名稱容易造成學(xué)生的誤解,使一些學(xué)生誤認為方差分析是比較多個總體方差。其實,方差分析是用來比較總體均值是否相同的,但由于使用計算“方差”的方法,故把該方法稱作方差分析。

三、方差分析的原理

為了比較多個總體的均值是否相等,方差分析將通過計算樣本數(shù)據(jù)的方差大小進行判斷。假設(shè)在北部、中部和南部分別隨機、獨立地抽取一定樣本容量的樣本,這里為了便于分析,從三地分別抽取3名成年男性,樣本容量為9,并記錄身高的樣本數(shù)據(jù),如下圖所示。

方差分析就是比較樣本數(shù)據(jù)中北部、中部和南部這三組數(shù)據(jù)的組間方差和各組數(shù)據(jù)的組內(nèi)方差的大小,并構(gòu)造F檢驗統(tǒng)計量進行檢驗。組間方差度量樣本數(shù)據(jù)中組與組之間的變異,從數(shù)據(jù)結(jié)構(gòu)的角度看表現(xiàn)為數(shù)據(jù)的橫向差異。造成組間數(shù)據(jù)變異有兩個因素,一個是地區(qū)因素,另一個是隨機因素。組內(nèi)方差度量樣本數(shù)據(jù)中各組內(nèi)部的數(shù)據(jù)變異,是由于抽樣的隨機性導(dǎo)致,表現(xiàn)為數(shù)據(jù)的縱向差異。如果組間數(shù)據(jù)的方差明顯地超過組內(nèi)數(shù)據(jù)的方差,很可能表明地區(qū)因素會顯著影響成年男性的身高,從而不同地區(qū)成年男性的平均身高存在差異。

為了計算組間方差(MSA),需要先求組間平方和(SSA)和相應(yīng)的自由度(C-1),其中C為組數(shù),這里為3。組間方差等于組間平方和與相應(yīng)自由度的比值。

MSA=

組間平方和用每組的均值與所有數(shù)據(jù)的均值之差的平方再乘以該組觀測值的個數(shù)來表示。組間平方和越大,說明各組之間的數(shù)據(jù)差異越大,當(dāng)然如果組數(shù)越多組間平方和也會越大,因此這里不用直接用平方和直接進行比較。

為了計算組內(nèi)方差(MSW),需要先求組內(nèi)平方和(SSW)和相應(yīng)的自由度(N-C),其中N為所有觀測值的個數(shù),這里為9。組內(nèi)方差等于組內(nèi)平方和與相應(yīng)自由度的比值。

MSA=

組內(nèi)平方和用每組的觀測值與該組數(shù)據(jù)的均值之差的平方和來表示。組內(nèi)平方和越大,說明各組內(nèi)部的數(shù)據(jù)差異越大,當(dāng)然如果各組的觀測值越多,則組內(nèi)平方和也會越大。

有了組間方差和組內(nèi)方差,就可以造成出F檢驗統(tǒng)計量,再與臨界值比較,可以就以做出統(tǒng)計決策。

FSTAT=

其中,服從分子自由度為C-1,分母自由度為N-C的F分布,其臨界值可以在指定顯著性水平下通過查表獲得。

在樣本量較大情況下,手工計算顯然耗時耗力,方差分析的相關(guān)

算一般需要通過統(tǒng)計軟件來完成。以下是用EXCEL進行方差分析的輸出結(jié)果。

EXCEL共輸出2個表格,第一個表格是對樣本數(shù)據(jù)進行描述分析,從中可以發(fā)現(xiàn)各組觀測值的個數(shù)、均值和方差。第二個表格為方差分析的結(jié)果。方差分析把數(shù)據(jù)的差異區(qū)分為組間差異和組間差異,SS為平方差,從表中可以SSA=0.020,SSW=0.018,df為自由度,組間平方和對應(yīng)的自由度C-1=2,組內(nèi)平均和對應(yīng)的自由度為N-C=6。MS為均方,組間均方MSA=0.010,組內(nèi)均方MSW=0.003。F為檢驗統(tǒng)計量,其值為MSA/MSW=3.307。在0.05顯著性水平下,F(xiàn)的臨界值約為5.14。如果使用P值法進行假設(shè)檢驗,EXCEL也給了相應(yīng)的P值,約為0.108。根據(jù)EXCEL單因素方差分析的輸出結(jié)果,不管使用臨界值還是P值法,在0.05的顯著性水下,我們都可以得出不拒絕零假設(shè)的結(jié)論,即三個地區(qū)成年男性的平均身高不存在顯著差異,同時也表明地區(qū)因素沒有顯著地影響成年男生的身高。

四、方差分析的前提條件

在統(tǒng)計方法的教學(xué)過程中,都要強調(diào)使用某種統(tǒng)計方法的前提假設(shè)條件,如果條件滿足,就不能使用相應(yīng)的統(tǒng)計方法。在方差分析的教學(xué)過程中,同樣需要強調(diào)方差分析的三個前提假設(shè),即樣本是隨機、獨立抽樣的,每個總體是正態(tài)分布并且方差相等。其中抽樣的隨機性和獨立性相對容易做到,總體是否為正態(tài)分布可以通過直方圖等方法進行判斷。最后總體方差相等是一個非常重要的條件,如果該條件不滿足,就不能進行方差分析。如果各總組(各組)本身方差大小存在顯著差異,就不能從數(shù)據(jù)中發(fā)現(xiàn)由于地區(qū)因素造成的數(shù)據(jù)變異到底有多大。關(guān)于總體同方差假設(shè)是否成立可能用萊文方差等同性檢驗來解決。

萊文方差等同性檢驗第一步是對各組樣本數(shù)據(jù)排序,找中位數(shù);第二步計算各組觀測值與其中位數(shù)之差的絕對值;第三步對絕對值做單因素方差分析;第四步得出結(jié)論。

根據(jù)萊文方差等同性檢驗的EXCEL輸出結(jié)果,可以得出三個地區(qū)成年男性身高的方差不存在顯著差異,可以進行方差分析。

第4篇

【關(guān)鍵詞】醫(yī)學(xué)統(tǒng)計學(xué)方法;管理;醫(yī)療資源;策略;效果

隨著國民經(jīng)濟水平的增長,醫(yī)療行業(yè)也呈現(xiàn)欣欣向榮的勢態(tài)發(fā)展。在醫(yī)院建設(shè)發(fā)展以及日常管理中,醫(yī)療資源是最重要的部分,尤其是醫(yī)務(wù)人員、醫(yī)療設(shè)備等等。很多醫(yī)院正是由于醫(yī)療資源的管理方式欠缺妥當(dāng),導(dǎo)致了醫(yī)療資源分配不合理,對醫(yī)療衛(wèi)生服務(wù)的正常開展造成了嚴(yán)重的影響[1]。如何采取有效的管理方式提高醫(yī)療資源的管理水平和醫(yī)療資源的利用率是醫(yī)院發(fā)展和管理中不懈努力的目標(biāo)。醫(yī)學(xué)統(tǒng)計學(xué)正是在這一背景下研究的一種新型醫(yī)療資源管理方法。鑒于此,本文就運用醫(yī)學(xué)統(tǒng)計學(xué)方法管理醫(yī)療資源的策略和效果進行簡單的論述。

1資料與方法

1.1一般資料選取我院2009年12月——2012年12月間信息系統(tǒng)數(shù)據(jù)庫中的所有醫(yī)療資源相關(guān)記錄進行統(tǒng)計分析,主要包括人力資源配置、患者情況、床位數(shù)設(shè)置等等。

1.2數(shù)據(jù)處理將本次統(tǒng)計調(diào)查的實驗數(shù)據(jù)均錄入SPSS17.0軟件包進行統(tǒng)計學(xué)分析,計量資料以均數(shù)±標(biāo)準(zhǔn)差表示,以P

2結(jié)果

2.1人力資源配置通過統(tǒng)計我院2009年12月——2012年12月間的醫(yī)生、護士人員情況,并與床位計算比例,最后與國家衛(wèi)生部頒布的床位和醫(yī)生比例發(fā)現(xiàn)我院計算所得的數(shù)據(jù)偏低[2]。由于我院還擔(dān)任有臨床教學(xué)任務(wù),在人力資源職務(wù)分配上面,一些醫(yī)務(wù)人員不僅要負責(zé)臨床診治,還要進行教學(xué)工作,這就大大增加了醫(yī)務(wù)人員的工作量和工作壓力。因此人力資源欠缺是首要問題,需要擴大醫(yī)務(wù)人員隊伍;另外是在科室分配方面欠缺妥當(dāng),一些科室的患者多、疾病復(fù)發(fā),而一些科室的患者少、疾病簡單,在人力資源分配上面有點一概而論,使得一些資歷深、技術(shù)水平高的醫(yī)師無法充分的發(fā)揮其技術(shù),而在患者多、疾病復(fù)發(fā)的科室又欠缺資歷深、醫(yī)療技術(shù)水平高的醫(yī)師。經(jīng)過統(tǒng)計學(xué)方法分析發(fā)現(xiàn),在神經(jīng)內(nèi)科的醫(yī)師偏多,尤其是資歷深的醫(yī)師;而一些新成立的科室則欠缺資歷深的醫(yī)師。通過統(tǒng)計學(xué)方法計算出各科室合理安排醫(yī)師情況最終進行了適當(dāng)?shù)恼{(diào)整。

2.2床位管理我院在近幾年均進行了床位擴大,但是患者的數(shù)量在不斷增多,且增長的速率超過了床位增長率。因為床位依然不夠,時常出現(xiàn)床位緊張的情況,通過統(tǒng)計學(xué)方法計算出了按照標(biāo)準(zhǔn)情況欠缺的床位數(shù)量并進行了補充;另一方面是科室的床位分配不合理,一些科室的床位比較充足,一部分科室床位比較欠缺[3],通過統(tǒng)計學(xué)分析出了床位合理分配數(shù)量,最終對各科室的床位分配進行了調(diào)整。

2.3患者情況根據(jù)統(tǒng)計學(xué)的計算結(jié)果顯示我院在患者的來源方面存在不合理的地方,比如下鄉(xiāng)、義診等活動的時間安排、醫(yī)務(wù)人員數(shù)量、活動范圍等方面欠缺妥當(dāng)。根據(jù)統(tǒng)計結(jié)果我院對下鄉(xiāng)和義診活動進行了調(diào)整,增加了在住院患者分布少的地區(qū)開展義務(wù)扶貧、義診等活動,并結(jié)合著患者的情況和醫(yī)院的條件開設(shè)綠色通道,為患者提供優(yōu)質(zhì)服務(wù),減輕患者的醫(yī)療經(jīng)濟負擔(dān),指導(dǎo)患者了解健康知識,免費為患者發(fā)放部分藥品等等,以此解決了部分患者因為經(jīng)濟困難無法就醫(yī)的問題,同時也提升了患者對醫(yī)院的形象以及我院的知名度。

3討論

醫(yī)療資源的合理分配是提高醫(yī)院管理效率的重要手段。通過本次調(diào)查發(fā)現(xiàn),在醫(yī)院的日常管理中由于各種原因使得醫(yī)療資源配置存在諸多問題,最主要的床位數(shù)量不夠、醫(yī)護人員不足等等,在醫(yī)療資源的分配上存在很多不合理的地方,比如資源分配不均勻等等,通過運用醫(yī)學(xué)統(tǒng)計學(xué)方法管理后這些問題得到有效的解決。由此說明,醫(yī)學(xué)統(tǒng)計方法管理是一種有效的管理方法,它能夠有效的改善醫(yī)護人員人手不足、醫(yī)療資源分配不均勻等問題,提高醫(yī)療資源管理和分配的有效性,因此醫(yī)院在日常工作開展和管理中應(yīng)充分的運用這一管理技術(shù),以此來提高醫(yī)院的管理水平、從而提高醫(yī)院和社會的效果,促進醫(yī)院乃至我國整個醫(yī)療衛(wèi)生事業(yè)的發(fā)展與進步。

參考文獻

[1]鄧潔,張世慶,王永清.從醫(yī)學(xué)統(tǒng)計學(xué)角度評價醫(yī)療器械臨床試驗[J].透析與人工器官,2009,04:20-24.

第5篇

關(guān)鍵詞:統(tǒng)計學(xué);定量分析,應(yīng)用;

一、定量分析的理解

定量分析方法這一概念出自分析化學(xué),是指對化合物或混合物組分的相對比例進行測定。定量分析方法是自然科學(xué)的一種基本方法,從哲學(xué)的角度看,社會科學(xué)和自然科學(xué)在方法論上是相通的,科學(xué)的發(fā)現(xiàn)遵循相同的邏輯和過程,兩者有時可使用相同的手段,只要對人類社會的研究采用了科學(xué)的、可靠的、能夠重復(fù)和檢驗的方法,那么這種研究所獲得的知識也是科學(xué)。當(dāng)代自然科學(xué)普遍使用實證、推理的研究方法。首先提出假說,然后嘗試用經(jīng)驗性的證據(jù)來驗證。量化是自然科學(xué)研究的基本特征之一,而定量分析(qMantitative analysis)是分析一個被研究對象所包含成分的數(shù)量關(guān)系或所具備性質(zhì)問的數(shù)量關(guān)系;也可以對幾個對象的某些性質(zhì)、特征、相互聯(lián)系從數(shù)量上進行分析比較,研究的結(jié)果也用“數(shù)量”加以描述。

二、定量資料分析的方法的應(yīng)用

1、國防方面  在國防經(jīng)濟學(xué)研究中,將軍事學(xué)、經(jīng)濟學(xué)、系統(tǒng)科學(xué),現(xiàn)代數(shù)學(xué)、統(tǒng)計學(xué)和計算機技術(shù)結(jié)合起來,共同研究國防經(jīng)濟現(xiàn)象的數(shù)量表現(xiàn)。而運用統(tǒng)計學(xué)中定量分析方法,可使國防經(jīng)濟的研究得到更準(zhǔn)確和有效的定性結(jié)論,以化人們對國防經(jīng)濟問題的認識,優(yōu)化相關(guān)決策,促進國防經(jīng)濟學(xué)的科學(xué)化和規(guī)范化。經(jīng)濟學(xué)中阿羅不可能性定理是用數(shù)量化和形式化的分析方法得到定性結(jié)論的一個典型,它的理論意義和實際意義都很明顯。用系統(tǒng)聚類方法對國防經(jīng)濟、軍事格局的研究也具有這樣的特點。對國防經(jīng)濟問題進行認識、判斷和決策,依賴于對基本情況與基本規(guī)律的準(zhǔn)確了解和對未來變化的可靠預(yù)測,這需要有實用和精密的理論,要求采用定量研究方法幫助提高理論的準(zhǔn)確程度和實用程度。例如,國防經(jīng)濟學(xué)家認為,一國國防經(jīng)濟實力的強弱是決定一國地位的重要因素之一,這里的強弱應(yīng)該是一個相對量。國防經(jīng)濟實力的對比是更為重要的因素,而要對國家之間的國防經(jīng)濟實力進行對比,就需要進行定量分析和比較。否則,這種比較就成為主觀的和無根據(jù)的東西。運用定量分析的方法還可以使國防經(jīng)濟學(xué)科走向成熟,有利用開闊研究人員的視野和方法,拓寬國防經(jīng)濟的研究領(lǐng)域。

2、醫(yī)學(xué)方面  定量資料是醫(yī)學(xué)科研及論文中涉及較廣的一類資料 ,其定義為測定每觀察單位某項指標(biāo)的大小而獲得的資料 ,其變量值是定量的 ,正確合理地選用定量資料的分析方法關(guān)系到論文及科研成果的科學(xué)性與嚴(yán)謹性,可以使醫(yī)學(xué)更明確快速的發(fā)展,。

3、旅游方面    對旅游資源進行必要而準(zhǔn)確的定量分析,不是可有可無,更不能隨心所欲(或者憑長官意志)。在整個社會所處于的市場經(jīng)濟中,旅游文化市場是一個特殊的市場,它有著本身所固有的不以人的意志為轉(zhuǎn)移的活動規(guī)律。對現(xiàn)今社會,旅游資源的定位分析是從客觀方面所作出的價值判斷,而我們需要對他作出的定量分析,就是從主觀方面的一種價格定位,也就是可以進入旅游市場的文化產(chǎn)品作出明確的、可以浮動的價格審定。通過定量資料分析,得出具有主導(dǎo)性的清晰、明確的認知之后,才能根據(jù)結(jié)果發(fā)掘出更好更有潛力的旅游資源。

4、市場營銷方面  為順應(yīng)市場競爭形勢的改變,越來越多的企業(yè)認識到精確營銷的重要性,而實現(xiàn)精確營銷目標(biāo)的前提是對市場做出精準(zhǔn)的認識和判斷,因此市場研究也就越來越為現(xiàn)代企業(yè)所依賴。統(tǒng)計分析是認識事物的重要工具,一旦有效地運用于市場營銷就會為營銷決策者提供精準(zhǔn)指導(dǎo)。因此,有效的將定量資料分析運用到市場營銷中并分析得出準(zhǔn)確清晰的分析判斷,是順應(yīng)現(xiàn)代市場形勢變化的必要條件。

5、教學(xué)方面    隨著我國經(jīng)濟、政治、文化等各方面改革的深入展,高等教育在社會中的作用日益突出,高教研究逐步受到重視。但高等教育學(xué)是一門實踐性很強的學(xué)科,光有理論還不足以學(xué)有所用同時還要有教育實踐。高等教育研究采用多學(xué)科的研究方法就是把多種學(xué)科領(lǐng)域中的基本理論和方法作為工具來分析和表述在教育理論和實踐中的問題。將統(tǒng)計學(xué)的相關(guān)理論應(yīng)用在高等教育中的一個比較特殊的教學(xué)實踐中,用定性研究與定量研究相結(jié)合的方法來探討差異素質(zhì)學(xué)生的教育,為如何因材施教提供方便的方法。

6、市場服務(wù)方面    服務(wù)行業(yè)的質(zhì)量提升涉及方方面面,量化指標(biāo)是改進工作中的基礎(chǔ)組成部分,對服務(wù)時限的控制又是其中的重要一環(huán),因為在業(yè)內(nèi)人士中流傳著一句諺語:遲到的服務(wù)就像是雨過送傘。養(yǎng)成以客戶為導(dǎo)向、以數(shù)據(jù)分析為手段的理念對我們尋找影響服務(wù)過程質(zhì)量的關(guān)鍵因素來說意義深遠。市場經(jīng)濟下,市場競爭實際上是人才的競爭。通過定量分析數(shù)據(jù)得出加強專業(yè)人才的教育和培養(yǎng)的方式,為服務(wù)業(yè)的發(fā)展提供智力資源,建立完善的人才培養(yǎng)和引進機制,大力培養(yǎng)復(fù)合型人才,努力提高其綜合素質(zhì),提高服務(wù)業(yè)的經(jīng)營管理水平。

7、投資與能源消耗方面  改革開放至今,我國經(jīng)濟取得了巨大成就,但粗放型的增長方式造成了高投入、高消耗、低能源利用率、低產(chǎn)出的現(xiàn)象。國家提倡節(jié)能減排,必然會要求對能源的需求量下降,從而會放緩經(jīng)濟的增長速度。通過利用定量資料的分析,可以對我國GDP與能源消耗、投資長期均衡和短期調(diào)整狀況進行實證分析,為我國能源政策的制定提供指導(dǎo),實現(xiàn)節(jié)能降耗與經(jīng)濟增長的雙贏。

參考文獻:

[1]鄭學(xué)詳李劍華.軍事經(jīng)濟研究方法[M].解放軍出版社,2007.

[2]庫桂生. 沈志華.國防經(jīng)濟學(xué)[M].北京:國防大學(xué)出版社.

[3]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計學(xué)[M].北京:人民衛(wèi)生出版社,2002.3.

[4]潘懋元.中國高等教育研究的歷史與未來(M).中國地質(zhì)大學(xué)學(xué)報(社會科學(xué)版),2006(9).

[5]潘懋元.多學(xué)科觀點的高等教育研究.上海:上海教育出版社,2001.

第6篇

【關(guān)鍵詞】膳食模式;統(tǒng)計分析;心血管疾病

0 前言

膳食因素與心血管疾病發(fā)病風(fēng)險存在密切相關(guān)性。迄今為止,針對一種或幾種營養(yǎng)素,或某種食物的攝入量與心血管疾病主要危險因素的相關(guān)性,已經(jīng)開展大量研究。然而,人們吃的不是獨立的營養(yǎng)素,而是含有多種營養(yǎng)素的多種食物,營養(yǎng)素之間存在復(fù)雜的相互作用。因此,針對單一營養(yǎng)素或食物的分析可能存在概念及方法上的局限[1]。

膳食模式分析是將所有食物、營養(yǎng)素作為一個整體進行研究,更接近真實的攝入情況,因此也更有利于對營養(yǎng)相關(guān)性疾病的發(fā)病風(fēng)險進行評價。

膳食模式統(tǒng)計學(xué)分析方法:

膳食模式不能直接測量,因此,研究人員必須使用相應(yīng)的統(tǒng)計學(xué)方法對收集到的飲食數(shù)據(jù)進行分析,進而對人群膳食模式予以劃分。膳食模式研究方法不斷發(fā)展,目前,常用方法有三類:先驗法、后驗法,以及二者的綜合運用。

1)先驗法

先驗法是以現(xiàn)有的膳食指南或其他科學(xué)飲食建議為基礎(chǔ),通過將個體的飲食與之比較進行評分,主要包括膳食指數(shù)法。常見有:美國農(nóng)業(yè)部門提出的與食物指南金字塔和膳食指南相配套的健康飲食指數(shù)(Healthy Eating Index, HEI)[2],Patterson R.E.等以膳食推薦量為基礎(chǔ)建立的膳食質(zhì)量指數(shù)(Diet Quality Index, DQI)[3],之后逐步修訂發(fā)展的修訂膳食質(zhì)量指數(shù)(Diet Quality Index Revised, DQI-R)[4]、國際膳食質(zhì)量指數(shù)(Diet Quality Index-International, DQI-I)、中國膳食質(zhì)量指數(shù)(INFH-UNC-CH DQI),何宇納等以中國居民膳食指南及平衡膳食寶塔中各類食物推薦量為依據(jù)建立的中國膳食平衡指數(shù)(Diet Baiance Index, DBI)[5],亞太地區(qū)食物與營養(yǎng)網(wǎng)絡(luò)專家委員會提出的理想膳食模式評分法(Desirable Dietary Pattern, DDP)[6]。

2)后驗法

后驗法是以膳食調(diào)查數(shù)據(jù)為基礎(chǔ),運用統(tǒng)計方法確定膳食模式種類,包括因子分析、聚類分析和潛類別分析等。

因子分析是一種多變量統(tǒng)計分析方法,該方法利用食物頻率問卷、膳食日記等調(diào)查資料提煉出潛在的維度,即因子/膳食模式。然后計算每一因子/膳食模式的得分,進而利用相關(guān)分析或回歸分析研究膳食模式與營養(yǎng)相關(guān)性疾病的關(guān)系。

聚類分析也是一種多變量統(tǒng)計分析方法。與因子分析不同,聚類分析從食物使用頻率、供能比、食物攝入量等角度將被調(diào)查者分為不同的亞組(類),之后再對不同亞組的特征進行分析。

潛在類別分析是以模型為基礎(chǔ)的聚類方法,其目的在于利用潛在類別解釋食物攝入變量之間的復(fù)雜關(guān)聯(lián)。

3)先驗法和后驗法的綜合運用

綜合運用先驗法和后驗法,主要包括降秩回歸法和偏最小二乘回歸法,既利用了先驗信息,又基于當(dāng)前的研究,綜合了先驗法和后驗法的優(yōu)點。

降秩回歸是分析膳食模式的一種新方法,類似于因子分析。這種方法是通過建立食物攝入變量的線性函數(shù)解釋反應(yīng)變量(如營養(yǎng)素、生物標(biāo)志物等)的變異,用降秩回歸分析法得到的膳食模式可以更好地闡述疾病病因中膳食的重要性[7]。

偏最小二乘回歸法是介于主成分分析和降秩回歸之間的一個折中方法,通過建立有預(yù)測能力的回歸模型解釋營養(yǎng)素或生物標(biāo)志物的變異。

1 膳食模式與心血管疾病危險因素相關(guān)性研究

早在20世紀(jì)80年代初,發(fā)達國家就已經(jīng)開始膳食模式分析。Jean M Kerver等人對美國全國健康與營養(yǎng)調(diào)查(NHANES)的數(shù)據(jù)進行分析,得到西方膳食、美國健康膳食、加州型等膳食模式,發(fā)現(xiàn)以紅肉及肉制品、高脂奶制品、雞蛋等為主的西方膳食模式與血清C反應(yīng)蛋白、血清胰島素、糖化血紅蛋白等心血管疾病生物標(biāo)志物濃度成正相關(guān),而與葉酸濃度成負相關(guān),說明西方膳食模式是心血管疾病的危險因素。

哈佛大學(xué)的Frank B.Hu等人[8]對44875名男性進行了為期8年的隊列研究“醫(yī)務(wù)人員隨訪研究”,得到兩種主要膳食模式:精明膳食模式(以大量的蔬菜水果、豆類、全谷類、魚類、家禽類為主)和西方膳食模式(以大量的紅肉及肉制品、精細谷物、糖果和糕點、油炸薯片、高脂奶類為主)。精明膳食模式得分與冠心病發(fā)病率的五分位相對危險度由高到低分別為1.0、0.87、0.79、0.75、0.70;而西方膳食模式得分與冠心病發(fā)病率的五分位相對危險度由低到高分別為:1.0、1.21、1.36、1.40、1.64。

美國國立肺血液研究所主持的大型多中心試驗DASH試驗是近年來領(lǐng)域內(nèi)非常著名的研究[9]。受試者分別使用典型美國飲食、典型美國飲食但增加水果和蔬菜份量、DASH飲食。在每日總熱量相同的情況下,典型美國飲食富含脂肪(特別是飽和脂肪)和膽固醇,缺少水果和蔬菜。DASH飲食組則強調(diào)增加水果、蔬菜和低脂奶制品的比例,而減少肉類、飽和脂肪和含糖飲料攝入。試驗發(fā)現(xiàn),與對照組相比,第二組和DASH飲食組都成功地降低了受試者的血壓,且DASH飲食在功效上更勝一籌。

中國人群膳食模式與心血管疾病危險因素相關(guān)性研究并不多?,F(xiàn)有的膳食模式研究中,研究者更多地對中國人群膳食結(jié)構(gòu)進行分析,評價總體膳食質(zhì)量,或?qū)Σ煌瑫r期、不同種族、不同社會經(jīng)濟狀況人群的膳食質(zhì)量進行比較。如何宇納等[10]應(yīng)用DBI綜合評價中國18~59歲成年人的膳食質(zhì)量。結(jié)果表明:中國居民的膳食狀況以攝入不足為主,同時也存在攝入過量的問題。城鄉(xiāng)間人群的膳食質(zhì)量存在一定的差異,農(nóng)村居民攝入不足和攝入過量的程度都大于城市。Stookey J.D.等[11]應(yīng)用中國DQI對1991年中國健康營養(yǎng)調(diào)查中的7450名成年人進行膳食質(zhì)量評價。結(jié)果表明,樣本人群膳食質(zhì)量存在的最大問題是鈉的攝入量高,鈣、蔬菜和水果攝入量低,食物多樣性差;且中國DQI總分與食物及營養(yǎng)素攝入、城鄉(xiāng)、收入及體重狀況均具有相關(guān)性。另外,有研究者應(yīng)用因子分析得出3種膳食模式,并與4種慢性病(腫瘤、糖尿病、高血壓、心血管疾?。┑幕疾★L(fēng)險進行相關(guān)性分析,結(jié)論是慢性病患者更有可能食用蔬菜類為主的膳食,而不是水果類或肉類為主的膳食[12]。也有研究者采用主成分分析法提煉出肥胖與高血壓患者的主要食物種類[13],但并沒有對膳食與肥胖或高血壓患病風(fēng)險的相關(guān)性作進一步的研究。

2 結(jié)語

膳食是一種復(fù)雜的暴露變量,需要從不同角度考察膳食與心血管疾病危險因素的關(guān)系。膳食評價方法從最初的營養(yǎng)素、食物組單一指標(biāo),到營養(yǎng)素和食物組的簡單組合,再到綜合考慮膳食攝入的充足、適量、多樣性以及平衡,已從不同角度反映了人群和個體的膳食質(zhì)量及存在的問題,進而與心血管疾病危險因素相聯(lián)系。

目前,中國在膳食模式方面的研究數(shù)量有限,心血管疾病危險因素與膳食模式相關(guān)性方面的探索也為數(shù)不多。因此,研究者應(yīng)廣泛借鑒國外經(jīng)驗,創(chuàng)建并發(fā)展適合中國人群的膳食模式研究方法,并在心血管疾病危險因素與膳食模式相關(guān)性方面深入探究。

【參考文獻】

[1]Hu FB. Dietary pattern analysis: a new direction in nutritional epidemiology [J]. Current Opinion in Lipidology,2002;13(1):3-9.

[2]Kennedy ET, Ohls J, Carlson S, Fleming K. The Healthy Eating Index - Design and Applications[J]. Journal of the American Dietetic Association,1995;95(10):1103-1108.

[3]Patterson RE, Haines PS, Popkin BM. Diet Quality Index-Capturing a Multidimensional Behavior[J]. Journal of the American Dietetic Association,1994;94(1):57-64.

[4]Haines PS, Siega-Riz AM, Popkin BM. The Diet Quality Index Revised: A Measurement Instrument for Populations[J].Journal of the American Dietetic Association,1999;99(6):697-704.

[5]何宇納, 翟鳳英, 葛可佑. 建立中國膳食平衡指數(shù)[J].衛(wèi)生研究,2005;34(2):208-211.

[6]李丹. 理想膳食模式(Ddp):介紹一種評價膳食[J].國外醫(yī)學(xué):衛(wèi)生學(xué)分冊,1992;19(5):282-285.

[7]Tucker KL, Dietary patterns, approaches, and multicultural perspective [J]. Applied Physiology, Nutrition, and Metabolism,2010,35(2):211-218.

[8]Hu FB, Rimm EB, Stampfer MJ, Ascherio A, Spiegelman D, Willett WC. Prospective study of major dietary patterns and risk of coronary heart disease in men [J]. American Journal of Clinical Nutrition,2000;72(4):912-921.

[9]Appel LJ, Moore TJ, Obarzanek E, et al. A Clinical Trial of the Effects of Dietary Patterns on Blood Pressure [J]. New England Journal of Medicine,1997;336(16):1117-1124.

[10]何宇納, 翟鳳英, 葛可佑.應(yīng)用中國膳食平衡指數(shù)評價中國18~59歲人群的膳食質(zhì)量[J].衛(wèi)生研究, 2005;34(4):442-444.

[11]Stookey JD, Wang Y, Ge K, Lin H, Popkin BM. Measuring diet quality in China: the INFH-UNC-CH Diet Quality Index[J]. European Journal of Clinical Nutrition,2000;54(11):811-821.

第7篇

關(guān)鍵詞:集成學(xué)習(xí);特征提取;Adaboost M1;醫(yī)學(xué)圖像分類

中圖分類號:TP311文獻標(biāo)識碼:A 文章編號:1009-3044(2009)33-9515-03

The Design of Medical Image Classification Based on Ensemble Leaning

LIN Xiao-jia

(Faculty of Logistic and Information Management, Fujian Ineternational Business and Economics College,Fujzhou 350006,China)

Abstract: The paper proposes a medical image classification based on ensemble leaning.The system we proposing consists of a pre-processing phase, a feature extraction phase and a building the classifier phase. On the basis research of single feature, one new method is proposed one kind of medicine image classification new method that synthesized the multi-characteristic merge and the data mining technology. This method is through the introduction of data mining in the concept of Ensemble Learning,utilizing the Ensemble learning method to classify to the single characteristic the weak sorter to carry on the iterative training.

Key words: ensemble learning;the characteristic extraction;adaboost M1;medical image classification

隨著計算機醫(yī)學(xué)成像技術(shù)的發(fā)展,醫(yī)學(xué)影像越來越多樣化,醫(yī)學(xué)影像的應(yīng)用也越來越廣泛,與此同時大量的醫(yī)學(xué)設(shè)備的應(yīng)用使得醫(yī)學(xué)影像的數(shù)量也越來越多,大量的影像資料使醫(yī)院迷失在信息的海洋。利用數(shù)據(jù)挖掘技術(shù)可以有效的對醫(yī)學(xué)圖像進行組織和管理,合理有效的對其進行分類,從而使其更好的輔助日常的醫(yī)學(xué)診斷和醫(yī)學(xué)研究。

該文提出的方法是使用SVM分類器將整個特征空間分成諸多子空間;采用集成學(xué)習(xí)方法Adaboost方法對樣本進行多次抽樣,將Adaboost算法中的分類精度作為特征選擇的依據(jù),選取出少量有利于分類的特征,同時將單特征訓(xùn)練得到的弱分類器通過集成學(xué)習(xí)增強為強分類器。

1 系統(tǒng)的構(gòu)成

整個系統(tǒng)的構(gòu)成如圖1所示。

該系統(tǒng)主要包括訓(xùn)練和分類兩個階段。在醫(yī)學(xué)圖像訓(xùn)練階段,通過數(shù)據(jù)庫建立訓(xùn)練集,對醫(yī)學(xué)圖像進行預(yù)處理,提取圖像顏色和紋理特征,創(chuàng)建訓(xùn)練的弱分類器。對圖像特征進行選擇。分類階段進行的是待分類圖像的選擇特征的提取,利用訓(xùn)練得到的強分類器進行分類,輸出分類結(jié)果。

2 圖像預(yù)處理

由于實際的醫(yī)學(xué)圖像數(shù)據(jù)因為操作的原因,存在不完整性、噪聲和不一致性性,不能直接在原始數(shù)據(jù)上進行數(shù)據(jù)提取,因此必須對醫(yī)學(xué)圖像進行預(yù)處理。數(shù)據(jù)清洗和數(shù)據(jù)的變換[1-2]都是經(jīng)常用于圖像數(shù)據(jù)預(yù)處理技術(shù)上的。

圖像預(yù)處理的第一步就是圖像去噪。大部分的醫(yī)學(xué)圖像一般包含了大量有噪聲的背景:有的醫(yī)學(xué)圖像太暗,有的醫(yī)學(xué)圖案太亮,還有來自影像設(shè)備中電子元器件的隨即擾動。通過去噪處理后,可以去掉圖像中的大多數(shù)的背景信息和噪聲,增強圖像的特征,提高圖像的信噪比。針對醫(yī)學(xué)圖像來說,圖像本身有邊緣模糊的特性,通過去噪對醫(yī)學(xué)圖像進行復(fù)原,使之與原圖像逼近是存在比較大的困難的。因此本系統(tǒng)主要采取的去噪方法為濾波技術(shù),該技術(shù)可以在最大限度保持信號不受損失的基礎(chǔ)上,盡可能過濾噪聲,提高圖像的可讀性,將醫(yī)學(xué)圖像中感興趣的特征(圖像的輪廓和邊緣等重要信息)有選擇的突出。

圖像預(yù)處理的第二步是圖像歸一化,基于圖像特征分類主要是對圖像特征進行匹配和區(qū)分的過程,但是通常情況下待檢圖像的圖庫中,圖像的大小尺寸并不完全相同,用戶所提供的分類例圖大小也不完全一樣的。在提取圖像特征(特別是空間分布特征)時,就有可能存在本身同類的圖像所計算出來的特征差別卻很大,而不屬于同一類的圖像由于尺度不同卻計算出了相似的特征,進而影響到分類的結(jié)果。為了防止這類情況的發(fā)生,本分類系統(tǒng)必須首先對圖像的尺度進行歸一化,即通過對圖像的縮放使得圖像具有同一尺度256×256,在同一尺度上提取圖像特征,從而消除尺度影響,又能夠保證圖像的整體灰度不變性。通過對大尺度的圖像進行尺度歸一化之后,按比例進行了縮小,降低了圖像特征提取時的計算量,提高了分類速度。

3 基于集成學(xué)習(xí)方法的特征選擇和分類

3.1 集成學(xué)習(xí)方法

集成學(xué)習(xí)(Ensemble Learning)是一種新的用來組合的學(xué)習(xí)器的方法。其主要思想[3]是:通過某種組合方法把一些學(xué)習(xí)器組合起來,使得集成后的學(xué)習(xí)器能夠表現(xiàn)出比單個學(xué)習(xí)器更好的性能。狹義的說,集成學(xué)習(xí)是指利用多個同質(zhì)的學(xué)習(xí)器對同一個問題進行學(xué)習(xí),這里的“同質(zhì)”是指所使用的學(xué)習(xí)器屬于同一種類型,例如所有的學(xué)習(xí)器都是決策樹、都是神經(jīng)網(wǎng)絡(luò)等等。廣義的來說,只要是使用多個學(xué)習(xí)器來解決問題,就是集成學(xué)習(xí)[4]。

集成學(xué)習(xí)從萌芽階段發(fā)展到現(xiàn)在,很多研究者提出了不同的算法。其中研究最深入,最具影響力,應(yīng)用最廣泛的就要算Boosting算法了。在眾多Boosting算法中,AdaBoost是Boosting家族中的基礎(chǔ)算法,也是Boosting家族最具代表性的算法,之后出現(xiàn)的Boosting家族中的擴展算法都是在AdaBoost算法的基礎(chǔ)上發(fā)展而來的,對AdaBoost的分析也適用于其它的Boosting方法。因此下面我們以AdaBoost M1算法為例,進行描述。

AdaBoost M1算法用于解決多類單標(biāo)簽問題。每個待分類樣本只能屬于多個類別中的單個類。AdaBoost M1的基本思想是:首先給定任意一個弱學(xué)習(xí)算法和訓(xùn)練集(x1,y1),(x2,y2),…,(xm,ym),yi在分類問題中是一個帶類別標(biāo)志的集合,yi∈Y={1,…,K}。初始化的時候,對每個訓(xùn)練例賦予的權(quán)重都相同為1/m。接著,調(diào)用弱學(xué)習(xí)算法對訓(xùn)練集進行T次的迭代訓(xùn)練,每次訓(xùn)練后,按照訓(xùn)練結(jié)果更新訓(xùn)練集上的分布,對于訓(xùn)練失敗的訓(xùn)練示例賦予教大的權(quán)重,也就是在下一次迭代訓(xùn)練的時候,更加關(guān)注集中對這些失敗的訓(xùn)練例進行訓(xùn)練。通過這樣的T次迭代訓(xùn)練,得到一個預(yù)測函數(shù)序列h1,h2,…,ht,其中ht也有一個權(quán)重,預(yù)測效果好的預(yù)測函數(shù)的權(quán)重較大,預(yù)測效果差的預(yù)測函數(shù)的權(quán)重較小。經(jīng)過T次迭帶后的最終預(yù)測函數(shù)H采用有權(quán)重的投票方式產(chǎn)生。

3.2 特征選擇和分類

本系統(tǒng)利用訓(xùn)練樣本的分類屬性,采用Adaboost M1算法同時,對算法進行改進,使算法同時具有進行特征分類性能的評價(特征選擇)和SVM分類器的增強的功能:對樣本進行多次抽樣,將分類精度作為特征對分類性能的判定依據(jù),進行有效特征選擇,選取出少量對分類作用較大的特征,同時將單特征訓(xùn)練得到的弱分類器增強為強分類器,使分類器具有較好的分類精度和泛化能力。具體算法思想如下:

1) 在Adaboost M1算法每次迭帶訓(xùn)練時候,賦予每個訓(xùn)練例的分配權(quán)重 Dt(i)(t表示迭代次數(shù),i表示訓(xùn)練例標(biāo)號),同時也表明它被分類器選入新訓(xùn)練子集的概率。如果某個樣本已經(jīng)被準(zhǔn)確的分類,那么在構(gòu)造下一個訓(xùn)練集中,它所占的比重概率就會被降低;反之,如果某個樣本沒有被正確分類,那么它所占的比重就會得到提高。通過這樣的方式,Adaboost M1算法就能更加重視那些較困難、更富信息的樣本上。

2) 針對Adaboost M1這個特點,我們在選入的訓(xùn)練集上,選擇SVM作為弱學(xué)習(xí)機,針對每個特征維向量進行訓(xùn)練,產(chǎn)生弱分類器,并且計算分類精度,用來衡量該弱分類器對分類的作用程度,精度大的弱分類器表明該特征維向量的分類性能較好,有利于作為有效的分類特征,被選入作為分類特征,經(jīng)過多次迭代可以得到大部分對分類作用較高的特征,最終增強得到一個強分類器。

改進的Adaboost M1進行特征選擇以及SVM分類器增強的算法步驟如下:

輸入:訓(xùn)練集 (x1,y1),(x2,y2), …,(xm,ym) ,其中標(biāo)簽yi ∈Y={1, …,k}

特征維向量集{S}

弱學(xué)習(xí)算法SVM

迭帶訓(xùn)練的次數(shù)T

初始化:對于i=1,2,…,D1(i)=1/m, Do For t=1,2,…,T //其中T為迭代訓(xùn)練的次數(shù),m為訓(xùn)練樣本數(shù)。

步驟1 弱分類器學(xué)習(xí)

根據(jù)選擇權(quán)重Dt(i)進行采樣,獲得第t次迭代樣本集,選取特征子集,學(xué)習(xí)重采樣后的樣本集得到弱分類器集合Hrt ,其中Srt是特征子集集合,表示第t次迭代的每個特征維度;Srt是弱分類器集合,是根據(jù)Hrt單特征訓(xùn)練出的弱分類規(guī)則,r表示特征維度標(biāo)簽號,t表示迭代次數(shù)。

步驟2 計算分類精度,選擇特征

計算弱分類器在樣本集上的誤差 在此作為特征子集Srt 有效性的判據(jù),誤差越小則此特征子集作用越大,選取誤差最小(εt=min{εrt})的對應(yīng)的分類器為Ht與有效特征向量Srt計算本次迭代得到的分類器貢獻權(quán)值βt=εt/(1-εt)。

步驟3 更新權(quán)重

其中,βt為每次迭代的分類器貢獻權(quán)值,值由βt=εt/(1-εt)來確定;Dt(i)為每個訓(xùn)練例的分配權(quán)重,Zt為標(biāo)準(zhǔn)化常量。

輸出:有效特征子集Sr

增強分類器

通過改進的Adaboost M1算法可以得到所選擇的特征子集Sr以及增強的分類器Hx。

分類時,只要將待分類醫(yī)學(xué)圖像根據(jù)有效特征子集Sr進行特征提取,輸入增強的分類器集 Hx中,就可得到分類的結(jié)果。

4 實驗結(jié)果及結(jié)論

本實驗所采用的是醫(yī)學(xué)圖像中的CT、MRI和DDR圖像,根據(jù)醫(yī)學(xué)圖像的功能和用途,我們將這些醫(yī)學(xué)圖像分為頭部(包括中樞神經(jīng)和頭頸五官)、胸部(包括呼吸系統(tǒng)、循環(huán)系統(tǒng))、腹部(包括消化系統(tǒng))、骨盆(包括泌尿系統(tǒng))和其他等五大類標(biāo)簽,每類標(biāo)簽60幅(由于CT應(yīng)用比較廣泛,所以選用CT圖像40幅,MRI和DDR各20幅),共計300幅圖像構(gòu)成圖像庫。在測試集和訓(xùn)練集的選擇上,采用10折交叉驗證的方法。通過訓(xùn)練集最終選取了36維特征向量中的分類性能較高的12維(詳細如表1所示)。

分類性能采用敏感度(sensitivity)、特異度(specificity)以及分類精度(precision)三個指標(biāo)率來衡量:敏感度也稱真正識別率,即正確識別該類元組的百分比;特異度是真負率,即正確拒絕不屬于該類元組的百分比;而精度就來標(biāo)記實際屬于該類的元組在已分配到該類的元組總數(shù)的百分比,表2是本實驗的分類結(jié)果。

從表2中可以看出,本實驗醫(yī)學(xué)圖像分類器算法的敏感度、特異性和分類精度都較高,分類識別率和精度平均在83%左右。

分類系統(tǒng)的速度主要取決于特征的提取以及進行分類的運算量。如果將所有特征都運用于分類的話,由于有些特征向量維度對分類貢獻不高,對分類效率沒有明顯的提高,并且也大大增加了特征提取階段的時間負擔(dān)。在本系統(tǒng)中僅僅選擇了不到1/3的特征,去除了部分對分類效率貢獻不高的特征,因此在特征提取階段速度大大提高了,而且在分類階段也因為只在有效特征中進行提取分類,速度也有較大提高,表3列出了在 Inter Core Duo processor T2450 2.0GHz、1G DDR內(nèi)存、VC++6.0環(huán)境下本分類系統(tǒng)與其他分類平均分類精度的比較。

本方法比最常見的綜合特征分類法在特征提取分類階段速度上有所提高,但是比起單個特征提取,速度還是比較慢的。但是從表3正確率相比,準(zhǔn)確率還是蠻高的,相對的犧牲時間還是值得的。

參考文獻:

[1] Maria-Luiza Antonie,Osmar R.Z aiane and Alexandru Coman,Application of Data Mining Techniques for Medical Image[C],Proceedings of the second international workshop on Multimedia Data Mining(MDM/KDD’2001),in conjunction with ACM SIGKDD conference.

[2] Osmar R.Z aiane,Maria-Luiza Antonie and Alexandru Coman,Mammography Classification by Association Rule-based Clasifier[C], MDM/KDD2002:International Workshop on Multimedia Data Mining(with ACM SIGKDD 2002).

[3] Zhou Z-H,Wu J-X,Tang W,Chen bining regression estimators:GA-based selective neural network ensemble.International Joural of Computational Intelligence and Applications,2001,1(4):341-356.

[4] Zhou Z-H,Wu J-X,Tang W.Ensembling neural networks:many could be better than all.Artificial Intelligence,2002,137(1-2):239-263

[5] 夏順仁,莫偉榮,王小英,嚴(yán)勇. 基于特征融合和相關(guān)反饋的醫(yī)學(xué)圖像檢索技術(shù)[J].航天醫(yī)學(xué)與醫(yī)學(xué)工程,2004,17(231):429-433.