論文撰寫中常見的統(tǒng)計(jì)學(xué)問題及其處理
絕大多數(shù)的論文撰寫,均需通過一定數(shù)量臨床病例(或資料)的觀察,研究事物間的相互關(guān)系,以探討客觀存在的新規(guī)律。如確定新診斷、新治療等措施是否優(yōu)于原沿用的方法,就需進(jìn)行兩種方法比較,這就涉及統(tǒng)計(jì)處理;統(tǒng)計(jì)設(shè)計(jì)又是整個(gè)課題研究設(shè)計(jì)中一個(gè)重要的組成部分。顯然,經(jīng)正確統(tǒng)計(jì)處理的結(jié)果可信度高,論文的質(zhì)量也高。
據(jù)不完全統(tǒng)計(jì),在難以發(fā)表的、已凝聚著作者心血并花費(fèi)較長時(shí)間與較大財(cái)力撰寫的研究論文中,約半數(shù)以上是由于統(tǒng)計(jì)錯(cuò)誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn),96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評(píng)分率均為2.1%(各2例),明顯低于應(yīng)用原藥引產(chǎn)的19例,其產(chǎn)后出血與新生兒低Apgar評(píng)分發(fā)生率均為15.8%(各3例,χ2=7.164,P<0.001)。故認(rèn)為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談,該資料比較應(yīng)采用精確法分析,結(jié)果是與原結(jié)果恰恰相反(P>0.05),這樣上述的主要結(jié)論就欠可靠而難以發(fā)表,否則論文可起誤導(dǎo)作用。類似問題文稿中還常有出現(xiàn)?,F(xiàn)就文稿中常見的統(tǒng)計(jì)問題及其相應(yīng)的處理方法簡述如下。
一、 常用的統(tǒng)計(jì)術(shù)語
統(tǒng)計(jì)學(xué)中常用的概念有總體與樣本、隨機(jī)化與概率、計(jì)量與計(jì)數(shù)、等級(jí)資料及正態(tài)與偏態(tài)分布資料、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤等。如某研究采用經(jīng)會(huì)陰途徑測(cè)定宮頸長度,以探討不同宮頸長度與臨產(chǎn)時(shí)間的關(guān)系。結(jié)果顯示35例宮頸長度為25~34mm者與32例宮頸長為15~24mm者臨產(chǎn)時(shí)間的均值±標(biāo)準(zhǔn)差(x±s)各為57.6±58.1與47.3±49.1小時(shí)。該計(jì)量資料,經(jīng)t檢驗(yàn)顯示t=0.780,P>0.05,并未提示不同宮頸長度的臨產(chǎn)時(shí)間差異有顯著意義;從標(biāo)準(zhǔn)差大于均值,顯示各變量值離散程度大,呈偏態(tài)分布,故不能采用x±s這一算術(shù)均數(shù)法計(jì)算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是:35例與32例的臨產(chǎn)時(shí)間各為34.5±4.1與26.7±4.1小時(shí),(t=7.778,P<0.001),兩組差異有極顯著意義??烧J(rèn)為隨著宮頸長度的縮短、臨產(chǎn)時(shí)間也縮短。此外,當(dāng)兩組資料單位不同時(shí),其S單位也不同;即使兩組單位相同的變量值,若其均數(shù)差異較大,也都應(yīng)以變異系數(shù)替代s來比較兩組值的離散度的大小。
二、 正常值范圍及異常閾值的確定
如何選擇研究對(duì)象,至少需多少例,正確統(tǒng)計(jì)處理和參考一定數(shù)量的病例數(shù)據(jù),是確定正常值范圍及異常閾值的四個(gè)重要因素。
1.研究對(duì)象:應(yīng)為“完全健康者”,可包括患有不影響待測(cè)指標(biāo)疾病的患者。如“正常妊娠”的條件:孕前月經(jīng)周期規(guī)則、單胎、妊娠過程順利、無產(chǎn)科并發(fā)癥及其它有關(guān)合并癥,分娩孕周為37~41周+6,新生兒出生體重為2500~4000g和Apgar評(píng)分≥7分。
2.觀察數(shù)量:觀察數(shù)量應(yīng)盡可能多于100例;需分組者,各組人數(shù)也是如此(標(biāo)本來源困難時(shí)酌情減少)。有些指標(biāo)值如雌三醇(E3)、甲胎蛋白(AFP)、胎盤泌乳素(HPL)等隨孕周進(jìn)展而變化,應(yīng)按孕周分組;鄰近孕周均數(shù)相近者,可合并幾周計(jì)算。若為偏態(tài)分布,應(yīng)以百分位數(shù)計(jì)算,則例數(shù)應(yīng)≥120例。取各孕周對(duì)象時(shí),應(yīng)考慮到所取各孕周中的例數(shù)分布大致均衡。顯然,文稿中往往以少量例數(shù)求得正常值是欠可靠的。
3.統(tǒng)計(jì)處理:應(yīng)根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計(jì)處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù),可采用x±s法計(jì)算;這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對(duì)無法轉(zhuǎn)換的偏態(tài)資料,應(yīng)采用百分位數(shù)計(jì)算法。具體計(jì)算(包括上下限初步制定)見文獻(xiàn)。
4.對(duì)照數(shù)量:相應(yīng)觀察的病例數(shù)(包括分組)應(yīng)不少于30例,這對(duì)制定某指標(biāo)有臨床意義的異常閾值尤其重要,這一點(diǎn)往往易被忽視。如在參考較多病例數(shù)據(jù)后,唾液游離E3的下限異常閾值應(yīng)為第2.5百分位數(shù),而非通常采用的5百分位數(shù)。否則,將會(huì)導(dǎo)致該指標(biāo)產(chǎn)前監(jiān)護(hù)的假陽性率增加。
三、 t檢驗(yàn)與校正t檢驗(yàn)(t′檢驗(yàn))
這是文稿中極易混淆的一類計(jì)量資料統(tǒng)計(jì)問題。
(一)檢驗(yàn)的注意事項(xiàng)
1.t檢驗(yàn)的意義:t檢驗(yàn)與所有統(tǒng)計(jì)分析相同,其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致,且提示犯第一類錯(cuò)誤的可能性大小,即t0.05與t0.01犯第一類錯(cuò)誤的可能性各為5%與1%。
2.統(tǒng)計(jì)意義與臨床意義的關(guān)系:統(tǒng)計(jì)學(xué)有顯著意義,而在臨床上可能是無意義的,提示該研究應(yīng)繼續(xù)深入,以明確該差異是否真有顯著意義;相反,統(tǒng)計(jì)無顯著意義,而臨床上卻是有意義的,不能貿(mào)然輕易地下結(jié)論。應(yīng)復(fù)查實(shí)驗(yàn)設(shè)計(jì)、方法、試劑及儀器性能、質(zhì)控措施和實(shí)驗(yàn)數(shù)據(jù)等是否有問題,或尚需再進(jìn)一步增加樣本量進(jìn)行復(fù)測(cè)等?!?
3.t檢驗(yàn)適用范圍:t檢驗(yàn)僅適用于正態(tài)或近似正態(tài)分布(包括偏態(tài)轉(zhuǎn)換)和其方差是齊性資料的檢驗(yàn);t檢驗(yàn)適用于可比性資料,即除了欲比較的因素外,其它所有可影響的因素應(yīng)相似。
4.t檢驗(yàn)的結(jié)果判斷:判斷結(jié)果不應(yīng)絕對(duì)化,P<或>0.05,分別表示可拒絕或接受原定的假設(shè),但兩者都有5%的可能性犯第一類錯(cuò)誤;而P值越小,只能是更有理由拒絕原定的假設(shè)。
5.單側(cè)與雙側(cè)檢驗(yàn):應(yīng)預(yù)先制定本研究的結(jié)果是需行雙側(cè)還是單側(cè)檢驗(yàn)。對(duì)有把握確知某治療措施或某指標(biāo)是不會(huì)劣于現(xiàn)有的,才作單側(cè)檢驗(yàn);若不知何者為優(yōu),應(yīng)行雙側(cè)檢驗(yàn)。因?yàn)樵谕籺值的界限上,單側(cè)檢驗(yàn)的概率(P)僅為后者的一半,也就是說單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論,不可隨意制定。一般講,絕大多數(shù)研究以采用雙側(cè)檢驗(yàn)為妥。
(二)t′檢驗(yàn)與t檢驗(yàn)的區(qū)別
當(dāng)兩樣本均數(shù)的方差非齊性時(shí),應(yīng)以t′替代t檢驗(yàn)。例如:甲組32例血清某指標(biāo)值為53.9±49.6(μmol/L);乙組6例的結(jié)果為26.6±7.2(μmol/L),若不考慮兩樣本方差大小,t檢驗(yàn)示t=1.331,P>0.05,提示兩組血清該指標(biāo)的平均含量差異無顯著意義。但先作方差齊性檢驗(yàn),F=47.4,P<0.01,示這兩樣本方差差異有極顯著意義。據(jù)此應(yīng)采用t′檢驗(yàn),t′=2.952>t′0.012.875,P<0.01。顯然,與上述結(jié)論恰恰相反。 χ2與直接概率法(或精確法)檢驗(yàn)
這三種檢驗(yàn)方法為一類用途較廣、但也易混淆的、適用于計(jì)數(shù)資料檢驗(yàn)的方法。應(yīng)注意,鑒于總數(shù)與理論值的不同,應(yīng)采用相適合的檢驗(yàn)方法。
例1.192例出生體重≥4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為151例與22例;3475例出生體重≥3500~4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為185與265例;2451例出生體重≥2500~3500g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為122與169例。3組的構(gòu)成比:難產(chǎn)與新生兒窒息率分別為:78.6%、5.3%、5.0%與11.4%、7.6%、6.9%。據(jù)此貿(mào)然認(rèn)為出生體重≥2500~3500g為最佳新生兒分娩體重的結(jié)論是不可靠的。經(jīng)χ2分析,后兩組的難產(chǎn)與窒息率間和前兩組窒息率間差異均無顯著意義(P均>0.05)。故可認(rèn)為,單據(jù)本研究結(jié)果是難以得出上述臨床上認(rèn)可的結(jié)論的。這涉及到上述“統(tǒng)計(jì)無顯著意義,而臨床卻是有意義”的問題,應(yīng)進(jìn)一步復(fù)查或增加樣本測(cè)試。杜絕單純根據(jù)百分率的大小貿(mào)然下結(jié)論。
例2.某藥治療感染衣原體(CT)的中、晚期孕婦各11例和36例,她們的新生兒感染CT數(shù)各為3例和23例。χ2檢驗(yàn)得χ2=4.570,P<0.05。據(jù)此誤認(rèn)為,某藥治療中孕期感染CT孕婦的新生兒感染CT數(shù)少于晚孕期才開始治療的新生兒感染數(shù)。根據(jù)統(tǒng)計(jì)原則,其中一個(gè)數(shù)的理論值為4.9(<5)時(shí),應(yīng)采用校正χ2計(jì)算,得χ2=3.209,P>0.05。顯然,正確結(jié)論恰與上述相異。
例3.以精確法替代χ2檢驗(yàn)。某新技術(shù)測(cè)試8例卵巢內(nèi)胚竇瘤患者,5例呈陽性反應(yīng);測(cè)試25例卵巢顆粒細(xì)胞瘤患者中6例陽性。χ2檢驗(yàn)得χ2=4.042,P<0.05。誤認(rèn)為該新技術(shù)測(cè)前組的陽性率高于后組。但鑒于總例數(shù)33例(<40),且其中一個(gè)數(shù)的理論值為2.7(<5),故應(yīng)改用精確法檢驗(yàn),結(jié)果首次計(jì)算P值,已達(dá)0.102,>雙側(cè)檢驗(yàn)的有顯著性意義的界限0.025,故P>0.05。結(jié)論也恰相反。
五、 相關(guān)與回歸分析
相關(guān)分析只是以相關(guān)系數(shù)(r)來表示兩個(gè)變量間直線關(guān)系的密切程度和相關(guān)方面的統(tǒng)計(jì)指標(biāo)。無論是正相關(guān)(r為正值)或負(fù)相關(guān)(r為負(fù)值),只是經(jīng)相關(guān)系數(shù)的統(tǒng)計(jì)意義檢驗(yàn)(如t檢驗(yàn))后,當(dāng)P<0.05時(shí),即示差異有顯著意義時(shí),才能依據(jù)|r|值的大小來說明兩變量間相關(guān)的密切程度。因此,表示相關(guān)性,除寫出r值外,應(yīng)注明P值;切不可將相關(guān)的顯著性誤解為相關(guān)程度;也應(yīng)注意:相關(guān)分析是不能單純用于闡明兩事物或現(xiàn)象間存在著本質(zhì)的聯(lián)系,即使兩變量間存在高度相關(guān)關(guān)系(即有一定的統(tǒng)計(jì)聯(lián)系),也不能證明它們間存在著因果關(guān)系。如欲證明兩事物間的內(nèi)在聯(lián)系,必需憑借專業(yè)知識(shí)從理論上加以闡明。
“相關(guān)”是表示兩個(gè)變量間相互關(guān)系的密切程度,而回歸分析是提示兩個(gè)變量間的從屬關(guān)系。在回歸分析中,應(yīng)注意由X變量值推算Y,與以Y變量值推算X的回歸線是不一樣的;直線回歸方程的適用范圍,一般僅適合于自變量X原測(cè)數(shù)據(jù)的范圍,故繪制回歸線時(shí),X值切不能超越實(shí)測(cè)值的范圍而任意延長。
可見,這兩種分析,說明的問題是不同的,但相互又有聯(lián)系。在作回歸分析時(shí),一般先作相關(guān)分析,只有在相關(guān)分析有統(tǒng)計(jì)意義(即回歸有統(tǒng)計(jì)意義)的前提下,求回歸方程和回歸線才有實(shí)際意義。決不能把毫無實(shí)際意義的兩個(gè)事物或兩種現(xiàn)象進(jìn)行相關(guān)與回歸分析。
六、 數(shù)據(jù)的正確書寫
1.文稿內(nèi)各數(shù)據(jù)的書寫必須前后一致;總數(shù)應(yīng)等于各分組的數(shù)據(jù)之和。
2.對(duì)不同指標(biāo),有其不同數(shù)據(jù)精度的要求,這應(yīng)結(jié)合專業(yè)知識(shí)加以判斷。如新生兒出生體重是以公斤為單位, 記錄測(cè)定數(shù)據(jù)精確到小數(shù)點(diǎn)后的第二位數(shù)字即可。
3.測(cè)定數(shù)據(jù)的書寫,不能超越其測(cè)量儀器測(cè)試的精確度范圍。
4.同一指標(biāo)的前后數(shù)據(jù)應(yīng)保持同一精確度。
5.經(jīng)計(jì)算,出現(xiàn)比預(yù)定小數(shù)點(diǎn)后兩位數(shù)多的數(shù)字,應(yīng)采取“≤4舍、≥6入”與“5‘奇’進(jìn)‘偶’出”方法,以決定小數(shù)點(diǎn)后第三位數(shù)字是“舍”還是“入”,即5前為單數(shù)則入,雙數(shù)則舍。
6.未經(jīng)統(tǒng)計(jì)檢驗(yàn),文稿內(nèi)不宜出現(xiàn)推斷性的比較結(jié)果的結(jié)論。如“××結(jié)果的百分率高或低于××結(jié)果的百分率”、“
據(jù)不完全統(tǒng)計(jì),在難以發(fā)表的、已凝聚著作者心血并花費(fèi)較長時(shí)間與較大財(cái)力撰寫的研究論文中,約半數(shù)以上是由于統(tǒng)計(jì)錯(cuò)誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn),96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評(píng)分率均為2.1%(各2例),明顯低于應(yīng)用原藥引產(chǎn)的19例,其產(chǎn)后出血與新生兒低Apgar評(píng)分發(fā)生率均為15.8%(各3例,χ2=7.164,P<0.001)。故認(rèn)為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談,該資料比較應(yīng)采用精確法分析,結(jié)果是與原結(jié)果恰恰相反(P>0.05),這樣上述的主要結(jié)論就欠可靠而難以發(fā)表,否則論文可起誤導(dǎo)作用。類似問題文稿中還常有出現(xiàn)?,F(xiàn)就文稿中常見的統(tǒng)計(jì)問題及其相應(yīng)的處理方法簡述如下。
一、 常用的統(tǒng)計(jì)術(shù)語
統(tǒng)計(jì)學(xué)中常用的概念有總體與樣本、隨機(jī)化與概率、計(jì)量與計(jì)數(shù)、等級(jí)資料及正態(tài)與偏態(tài)分布資料、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤等。如某研究采用經(jīng)會(huì)陰途徑測(cè)定宮頸長度,以探討不同宮頸長度與臨產(chǎn)時(shí)間的關(guān)系。結(jié)果顯示35例宮頸長度為25~34mm者與32例宮頸長為15~24mm者臨產(chǎn)時(shí)間的均值±標(biāo)準(zhǔn)差(x±s)各為57.6±58.1與47.3±49.1小時(shí)。該計(jì)量資料,經(jīng)t檢驗(yàn)顯示t=0.780,P>0.05,并未提示不同宮頸長度的臨產(chǎn)時(shí)間差異有顯著意義;從標(biāo)準(zhǔn)差大于均值,顯示各變量值離散程度大,呈偏態(tài)分布,故不能采用x±s這一算術(shù)均數(shù)法計(jì)算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是:35例與32例的臨產(chǎn)時(shí)間各為34.5±4.1與26.7±4.1小時(shí),(t=7.778,P<0.001),兩組差異有極顯著意義??烧J(rèn)為隨著宮頸長度的縮短、臨產(chǎn)時(shí)間也縮短。此外,當(dāng)兩組資料單位不同時(shí),其S單位也不同;即使兩組單位相同的變量值,若其均數(shù)差異較大,也都應(yīng)以變異系數(shù)替代s來比較兩組值的離散度的大小。
二、 正常值范圍及異常閾值的確定
如何選擇研究對(duì)象,至少需多少例,正確統(tǒng)計(jì)處理和參考一定數(shù)量的病例數(shù)據(jù),是確定正常值范圍及異常閾值的四個(gè)重要因素。
1.研究對(duì)象:應(yīng)為“完全健康者”,可包括患有不影響待測(cè)指標(biāo)疾病的患者。如“正常妊娠”的條件:孕前月經(jīng)周期規(guī)則、單胎、妊娠過程順利、無產(chǎn)科并發(fā)癥及其它有關(guān)合并癥,分娩孕周為37~41周+6,新生兒出生體重為2500~4000g和Apgar評(píng)分≥7分。
2.觀察數(shù)量:觀察數(shù)量應(yīng)盡可能多于100例;需分組者,各組人數(shù)也是如此(標(biāo)本來源困難時(shí)酌情減少)。有些指標(biāo)值如雌三醇(E3)、甲胎蛋白(AFP)、胎盤泌乳素(HPL)等隨孕周進(jìn)展而變化,應(yīng)按孕周分組;鄰近孕周均數(shù)相近者,可合并幾周計(jì)算。若為偏態(tài)分布,應(yīng)以百分位數(shù)計(jì)算,則例數(shù)應(yīng)≥120例。取各孕周對(duì)象時(shí),應(yīng)考慮到所取各孕周中的例數(shù)分布大致均衡。顯然,文稿中往往以少量例數(shù)求得正常值是欠可靠的。
3.統(tǒng)計(jì)處理:應(yīng)根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計(jì)處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù),可采用x±s法計(jì)算;這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對(duì)無法轉(zhuǎn)換的偏態(tài)資料,應(yīng)采用百分位數(shù)計(jì)算法。具體計(jì)算(包括上下限初步制定)見文獻(xiàn)。
4.對(duì)照數(shù)量:相應(yīng)觀察的病例數(shù)(包括分組)應(yīng)不少于30例,這對(duì)制定某指標(biāo)有臨床意義的異常閾值尤其重要,這一點(diǎn)往往易被忽視。如在參考較多病例數(shù)據(jù)后,唾液游離E3的下限異常閾值應(yīng)為第2.5百分位數(shù),而非通常采用的5百分位數(shù)。否則,將會(huì)導(dǎo)致該指標(biāo)產(chǎn)前監(jiān)護(hù)的假陽性率增加。
三、 t檢驗(yàn)與校正t檢驗(yàn)(t′檢驗(yàn))
這是文稿中極易混淆的一類計(jì)量資料統(tǒng)計(jì)問題。
(一)檢驗(yàn)的注意事項(xiàng)
1.t檢驗(yàn)的意義:t檢驗(yàn)與所有統(tǒng)計(jì)分析相同,其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致,且提示犯第一類錯(cuò)誤的可能性大小,即t0.05與t0.01犯第一類錯(cuò)誤的可能性各為5%與1%。
2.統(tǒng)計(jì)意義與臨床意義的關(guān)系:統(tǒng)計(jì)學(xué)有顯著意義,而在臨床上可能是無意義的,提示該研究應(yīng)繼續(xù)深入,以明確該差異是否真有顯著意義;相反,統(tǒng)計(jì)無顯著意義,而臨床上卻是有意義的,不能貿(mào)然輕易地下結(jié)論。應(yīng)復(fù)查實(shí)驗(yàn)設(shè)計(jì)、方法、試劑及儀器性能、質(zhì)控措施和實(shí)驗(yàn)數(shù)據(jù)等是否有問題,或尚需再進(jìn)一步增加樣本量進(jìn)行復(fù)測(cè)等?!?
3.t檢驗(yàn)適用范圍:t檢驗(yàn)僅適用于正態(tài)或近似正態(tài)分布(包括偏態(tài)轉(zhuǎn)換)和其方差是齊性資料的檢驗(yàn);t檢驗(yàn)適用于可比性資料,即除了欲比較的因素外,其它所有可影響的因素應(yīng)相似。
4.t檢驗(yàn)的結(jié)果判斷:判斷結(jié)果不應(yīng)絕對(duì)化,P<或>0.05,分別表示可拒絕或接受原定的假設(shè),但兩者都有5%的可能性犯第一類錯(cuò)誤;而P值越小,只能是更有理由拒絕原定的假設(shè)。
5.單側(cè)與雙側(cè)檢驗(yàn):應(yīng)預(yù)先制定本研究的結(jié)果是需行雙側(cè)還是單側(cè)檢驗(yàn)。對(duì)有把握確知某治療措施或某指標(biāo)是不會(huì)劣于現(xiàn)有的,才作單側(cè)檢驗(yàn);若不知何者為優(yōu),應(yīng)行雙側(cè)檢驗(yàn)。因?yàn)樵谕籺值的界限上,單側(cè)檢驗(yàn)的概率(P)僅為后者的一半,也就是說單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論,不可隨意制定。一般講,絕大多數(shù)研究以采用雙側(cè)檢驗(yàn)為妥。
(二)t′檢驗(yàn)與t檢驗(yàn)的區(qū)別
當(dāng)兩樣本均數(shù)的方差非齊性時(shí),應(yīng)以t′替代t檢驗(yàn)。例如:甲組32例血清某指標(biāo)值為53.9±49.6(μmol/L);乙組6例的結(jié)果為26.6±7.2(μmol/L),若不考慮兩樣本方差大小,t檢驗(yàn)示t=1.331,P>0.05,提示兩組血清該指標(biāo)的平均含量差異無顯著意義。但先作方差齊性檢驗(yàn),F=47.4,P<0.01,示這兩樣本方差差異有極顯著意義。據(jù)此應(yīng)采用t′檢驗(yàn),t′=2.952>t′0.012.875,P<0.01。顯然,與上述結(jié)論恰恰相反。 χ2與直接概率法(或精確法)檢驗(yàn)
這三種檢驗(yàn)方法為一類用途較廣、但也易混淆的、適用于計(jì)數(shù)資料檢驗(yàn)的方法。應(yīng)注意,鑒于總數(shù)與理論值的不同,應(yīng)采用相適合的檢驗(yàn)方法。
例1.192例出生體重≥4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為151例與22例;3475例出生體重≥3500~4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為185與265例;2451例出生體重≥2500~3500g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為122與169例。3組的構(gòu)成比:難產(chǎn)與新生兒窒息率分別為:78.6%、5.3%、5.0%與11.4%、7.6%、6.9%。據(jù)此貿(mào)然認(rèn)為出生體重≥2500~3500g為最佳新生兒分娩體重的結(jié)論是不可靠的。經(jīng)χ2分析,后兩組的難產(chǎn)與窒息率間和前兩組窒息率間差異均無顯著意義(P均>0.05)。故可認(rèn)為,單據(jù)本研究結(jié)果是難以得出上述臨床上認(rèn)可的結(jié)論的。這涉及到上述“統(tǒng)計(jì)無顯著意義,而臨床卻是有意義”的問題,應(yīng)進(jìn)一步復(fù)查或增加樣本測(cè)試。杜絕單純根據(jù)百分率的大小貿(mào)然下結(jié)論。
例2.某藥治療感染衣原體(CT)的中、晚期孕婦各11例和36例,她們的新生兒感染CT數(shù)各為3例和23例。χ2檢驗(yàn)得χ2=4.570,P<0.05。據(jù)此誤認(rèn)為,某藥治療中孕期感染CT孕婦的新生兒感染CT數(shù)少于晚孕期才開始治療的新生兒感染數(shù)。根據(jù)統(tǒng)計(jì)原則,其中一個(gè)數(shù)的理論值為4.9(<5)時(shí),應(yīng)采用校正χ2計(jì)算,得χ2=3.209,P>0.05。顯然,正確結(jié)論恰與上述相異。
例3.以精確法替代χ2檢驗(yàn)。某新技術(shù)測(cè)試8例卵巢內(nèi)胚竇瘤患者,5例呈陽性反應(yīng);測(cè)試25例卵巢顆粒細(xì)胞瘤患者中6例陽性。χ2檢驗(yàn)得χ2=4.042,P<0.05。誤認(rèn)為該新技術(shù)測(cè)前組的陽性率高于后組。但鑒于總例數(shù)33例(<40),且其中一個(gè)數(shù)的理論值為2.7(<5),故應(yīng)改用精確法檢驗(yàn),結(jié)果首次計(jì)算P值,已達(dá)0.102,>雙側(cè)檢驗(yàn)的有顯著性意義的界限0.025,故P>0.05。結(jié)論也恰相反。
五、 相關(guān)與回歸分析
相關(guān)分析只是以相關(guān)系數(shù)(r)來表示兩個(gè)變量間直線關(guān)系的密切程度和相關(guān)方面的統(tǒng)計(jì)指標(biāo)。無論是正相關(guān)(r為正值)或負(fù)相關(guān)(r為負(fù)值),只是經(jīng)相關(guān)系數(shù)的統(tǒng)計(jì)意義檢驗(yàn)(如t檢驗(yàn))后,當(dāng)P<0.05時(shí),即示差異有顯著意義時(shí),才能依據(jù)|r|值的大小來說明兩變量間相關(guān)的密切程度。因此,表示相關(guān)性,除寫出r值外,應(yīng)注明P值;切不可將相關(guān)的顯著性誤解為相關(guān)程度;也應(yīng)注意:相關(guān)分析是不能單純用于闡明兩事物或現(xiàn)象間存在著本質(zhì)的聯(lián)系,即使兩變量間存在高度相關(guān)關(guān)系(即有一定的統(tǒng)計(jì)聯(lián)系),也不能證明它們間存在著因果關(guān)系。如欲證明兩事物間的內(nèi)在聯(lián)系,必需憑借專業(yè)知識(shí)從理論上加以闡明。
“相關(guān)”是表示兩個(gè)變量間相互關(guān)系的密切程度,而回歸分析是提示兩個(gè)變量間的從屬關(guān)系。在回歸分析中,應(yīng)注意由X變量值推算Y,與以Y變量值推算X的回歸線是不一樣的;直線回歸方程的適用范圍,一般僅適合于自變量X原測(cè)數(shù)據(jù)的范圍,故繪制回歸線時(shí),X值切不能超越實(shí)測(cè)值的范圍而任意延長。
可見,這兩種分析,說明的問題是不同的,但相互又有聯(lián)系。在作回歸分析時(shí),一般先作相關(guān)分析,只有在相關(guān)分析有統(tǒng)計(jì)意義(即回歸有統(tǒng)計(jì)意義)的前提下,求回歸方程和回歸線才有實(shí)際意義。決不能把毫無實(shí)際意義的兩個(gè)事物或兩種現(xiàn)象進(jìn)行相關(guān)與回歸分析。
六、 數(shù)據(jù)的正確書寫
1.文稿內(nèi)各數(shù)據(jù)的書寫必須前后一致;總數(shù)應(yīng)等于各分組的數(shù)據(jù)之和。
2.對(duì)不同指標(biāo),有其不同數(shù)據(jù)精度的要求,這應(yīng)結(jié)合專業(yè)知識(shí)加以判斷。如新生兒出生體重是以公斤為單位, 記錄測(cè)定數(shù)據(jù)精確到小數(shù)點(diǎn)后的第二位數(shù)字即可。
3.測(cè)定數(shù)據(jù)的書寫,不能超越其測(cè)量儀器測(cè)試的精確度范圍。
4.同一指標(biāo)的前后數(shù)據(jù)應(yīng)保持同一精確度。
5.經(jīng)計(jì)算,出現(xiàn)比預(yù)定小數(shù)點(diǎn)后兩位數(shù)多的數(shù)字,應(yīng)采取“≤4舍、≥6入”與“5‘奇’進(jìn)‘偶’出”方法,以決定小數(shù)點(diǎn)后第三位數(shù)字是“舍”還是“入”,即5前為單數(shù)則入,雙數(shù)則舍。
6.未經(jīng)統(tǒng)計(jì)檢驗(yàn),文稿內(nèi)不宜出現(xiàn)推斷性的比較結(jié)果的結(jié)論。如“××結(jié)果的百分率高或低于××結(jié)果的百分率”、“
結(jié)束
本文標(biāo)簽
特別聲明:1.凡本網(wǎng)注明稿件來源為“湖北自考網(wǎng)”的,轉(zhuǎn)載必須注明“稿件來源:湖北自考網(wǎng)(trillionsbussines.com)”,違者將依法追究責(zé)任;
2.部分稿件來源于網(wǎng)絡(luò),如有不實(shí)或侵權(quán),請(qǐng)聯(lián)系我們溝通解決。最新官方信息請(qǐng)以湖北省教育考試院及各教育官網(wǎng)為準(zhǔn)!
2.部分稿件來源于網(wǎng)絡(luò),如有不實(shí)或侵權(quán),請(qǐng)聯(lián)系我們溝通解決。最新官方信息請(qǐng)以湖北省教育考試院及各教育官網(wǎng)為準(zhǔn)!
"論文撰寫中常見的統(tǒng)計(jì)學(xué)問題及其處理" 相關(guān)文章推薦
-
072023-04湖北自考中文漢語專業(yè)本科畢業(yè)論文范文湖北自考中文漢語專業(yè)本科畢業(yè)論文范文
-
072023-04湖北自考漢語文學(xué)本科畢業(yè)論文范文湖北自考漢語文學(xué)本科畢業(yè)論文范文
-
072023-04湖北自考英語專業(yè)本科畢業(yè)論文范文湖北自考英語專業(yè)本科畢業(yè)論文范文
-
072023-04湖北自考漢語語言專業(yè)本科畢業(yè)論文范文湖北自考漢語語言專業(yè)本科畢業(yè)論文范文
-
022023-04湖北自考畢業(yè)論文參考:中文漢語專業(yè)范文湖北自考畢業(yè)論文參考:中文漢語專業(yè)范文
-
022023-04湖北自考畢業(yè)論文參考:漢語文學(xué)專業(yè)范文湖北自考畢業(yè)論文參考:漢語文學(xué)專業(yè)范文
限時(shí),免費(fèi)獲取學(xué)歷提升方案
已幫助10w萬+意向?qū)W歷提升用戶成功上岸
武漢自考工具箱
推薦信息
-
毛澤東思想概論
培訓(xùn)優(yōu)勢(shì):課時(shí)考點(diǎn)精講+刷題+沖刺,熟練應(yīng)對(duì)考試題型。全程督促學(xué)習(xí),安排好學(xué)習(xí)計(jì)劃。 毛澤東思想概論...自考培訓(xùn) -
英語二
本課程既是一門語言實(shí)踐課程,也是拓寬知識(shí)、了解世界文化的重要素質(zhì)課程,它以培養(yǎng)學(xué)習(xí)者的綜合語言應(yīng)用能力為目標(biāo),使他們?cè)趯W(xué)習(xí)、工作和社會(huì)交往中能夠使用英語進(jìn)行有效的交流。 英語二...自考培訓(xùn) -
馬克思主義基本原理概論
本書包括兩個(gè)部分:自學(xué)考試大綱和基本原理。主要內(nèi)容有,馬克思主義是關(guān)于工人階級(jí)和人類解放的科學(xué),物質(zhì)世界及其發(fā)展規(guī)律,認(rèn)識(shí)的本質(zhì)及其規(guī)律,人類社會(huì)及其發(fā)展規(guī)律,資本主義的形成及其發(fā)展,資本主義發(fā)展的歷史進(jìn)程,社會(huì)主義社會(huì)及其進(jìn)程,共產(chǎn)主義社會(huì)及其進(jìn)程等。 馬克思主義基本原理概論...自考培訓(xùn) -
思想道德修養(yǎng)與法律基礎(chǔ)
《思想道德修養(yǎng)與法律基礎(chǔ)》課具有鮮明的政治性、思想性、理論性、針對(duì)性、科學(xué)性、知識(shí)性以及實(shí)踐性和修養(yǎng)性。它包羅政治、思想、道德、心理本質(zhì)、學(xué)習(xí)成才和法律本質(zhì)等內(nèi)容,指導(dǎo)和回答大學(xué)生在人生、抱負(fù)、信念等方面遍及關(guān)心和迫切需要解決的問題。 思想道德修養(yǎng)與法律基礎(chǔ)...自考培訓(xùn) -
中國近代史綱要
“中國近現(xiàn)代史綱要”全國高等教育自學(xué)考試指定教材,依據(jù)中央審定的普通高等學(xué)?!爸袊F(xiàn)代史綱要”編寫大綱以及馬克思主義理論研究和建設(shè)工程重點(diǎn)教材《中國近現(xiàn)代史綱要》,結(jié)合自學(xué)考試的特點(diǎn)設(shè)計(jì)了十章,集中講述1840年鴉片戰(zhàn)爭爆發(fā)一直到2007年中國共產(chǎn)黨第十七次全國代表大會(huì)召開的160多年的中國近現(xiàn)代歷史。 中國近代史綱要...自考培訓(xùn)
湖北自考動(dòng)態(tài)
自考熱門標(biāo)簽
- 2025年上半年武漢大學(xué)自考實(shí)踐考核報(bào)名通知
- 2024年12月湖北大學(xué)自考畢業(yè)辦證通知
- 自考本科什么時(shí)候可以考?棄考會(huì)怎樣?
- 自考本科報(bào)名費(fèi)用可以退嗎?多交了一次怎么辦?
- 自考本科相當(dāng)于幾本?和成考本科比怎么樣?
- 自考本科都考什么?會(huì)不會(huì)很難?
- 投資學(xué)專業(yè)自考需要哪些資料?步驟是什么?
- 自考專業(yè)查詢流程是什么?要花錢嗎?
- 自考文憑有用嗎?40歲以上還能報(bào)考嗎?
- 湖北自考網(wǎng)上報(bào)名步驟是什么?每個(gè)報(bào)考層次都是一樣的嗎? 查看更多
微信公眾號(hào)
考試交流群
掃一掃關(guān)注微信公眾號(hào)
隨時(shí)獲取湖北省自考政策、通知、公告以及各類學(xué)習(xí)資料、學(xué)習(xí)方法、課程。