You are on page 1of 41

無母數分析

1
一、無母數分析之適用時機
 在前面的單元中,我們介紹數種檢定兩樣本平均有沒
有差異之方法。這些檢定都假設常態分佈,變異數同
質性,及直線性關係。  
 這些方法統稱為有母數分析方法( parametric
method ),相對的另一種方法,無母數分析方法
( nonparametric method )專為無法符合有母數分
析之前題假設而設計。無母數分析又稱為不受數據分
佈限制的分析方法,因為不須假設資料為常態分佈。
無母數分析適用於名目、有序的資料或資料分佈未知。
因為無母數分析有很多優點,所以近年來使用得非常
多,但是它也有許多缺點。
2
二、無母數分析的優缺點
 無母數分析方法有三個優點:

1. 不需要假設資料屬常態分佈。事實上,很多
資料都不是常態或樣本數不夠大, 又很多資
料分佈也不是對稱。這是無母數分析方法最大
優點。
2. 計算容易及快速。
3. 適用於一些難以量化的實驗及調查資料結果。
雖然有母數分析方法比較容易得到顯著之結果
,但卻沒有無母數分析方法的可靠,又有母數
分析方法對有序資料的誤差比較不靈敏。 3
 無母數分析也有三個缺點:

1. 相對於有母數分析方法,比較沒有效率 ( 即需要
較大的樣本數才能推翻錯誤虛無假說 ) 。
2. 與有母數分析方法相比,無母數分析所檢定之假
說較不特異。
3. 沒有應用到資料分佈的特性,所以無母數分析方
法也沒有使用到所有資訊
 無母數分析方法之使用,應當作一互補的統計方
法,而不應用來作為一種取代方法。當知道無母
數分析之優缺點及有一些經驗後,很容易就知道
應使用哪種統計方法較合適。
4
 很多無母數分析都是先將資料排序,再作計算。即
將資料依其數值從小排到大,所以都是對一些正整數
(如 1 , 2 , 3 ,… n )作計算,而其總和則是
n(n+l)/2 。例如, 1 到 10 整數之總和是
10(10+l)/2=55 。
 雖然有許多無母數分析方法,但本單元只會計
算與有母數分析獨立樣本,非獨立樣本及相關係數 t
檢定相對之無母數分析方法,分別為魏克森排序和檢
定,魏克森符號排序檢定,史丕曼排序相關檢定, K-
W 科華單維變異數分析及符號檢定。還有介紹費氏精
確檢定,一種當卡方檢定不適用的檢定方法。

5
三、魏克森排序和檢定
 魏克森排序和檢定( Wilcoxon rank-sum test )適用
於檢定兩個母體分佈沒有差異之虛無假說。魏克森排
序和檢定是以排序來計算,與雙樣本獨立 t 檢定相似
,只是不需要常態分佈及變異數相同之統計前題假設。
以表 1 來說明魏克森排序和檢定之計算過程:

6
表 1 兩獨立樣本之魏克森排序和檢定:
嬰兒出生體重過輕或正常的母親與需要家訪次

1. 將兩個樣本資料混在一起,依數據值從小排到大。
2. 給予排序分數。
3. 將兩個樣本之排序分數分別列出。
4. 分開加總兩個樣本之排序分數。
 在虛無假說成立下,兩組排序平均分數應該是相同
,即檢定統計量 W1 (第一個樣本的排序和)與
W2 (期望排序和)不會有明顯的差異。
因此,第一個樣本期望排序和為
n1 ( n1 + n2 + 1)
We = (公式1)
2
而 W1 之標準差 σw 為
n1n2 ( n1 + n2 + 1)
σw = (公式2)
12
7
 又不管母體分佈形態是怎樣,排序和的抽樣分佈
近似常態。因此,便可對兩個分佈相似與否進行
顯著性檢定。
W1 − We W1 − We
Z= = (公式3)
σw n1n2 ( n1 + n2 + 1) /12

 代入表 1 之資料,便可計算 Z 統計量。比較


W1 (第一個樣本之觀察排序和)及 We (當虛無
假說為真時,第一個樣本排序和之期望值)有沒
有差異。
 假如第一個樣本之數值小於第二個樣本,第一個
樣本之 W1 ,也應該比較小,即第一個樣本的排
序值會落在兩個樣本混在一起分佈的低分那一邊
,便與兩個分佈沒有差異之虛無假說相抵觸。
8
 在表
1 資料中,有 3 組同分,家訪次數為 0,3,4 。
對於同分之處理,一般都是給予同分者平均排序
數值。例如,有兩位之同分為零,兩位的排序分
數便是 1.5 分。
而公式 1 之 Z 統計量之期望排序和:

n1 ( n1 + n2 +1) 7( 7 8+ )1+
We = = =
56(公式 4)
2 2
 要決定表
1 之觀察排序和 28.5 與期望排序和 56
有沒有差異,可將數據代入公式 3 :

W1 − We 28.5− 56 −27.5 −
27.5
Z= = = 3.2 = =
n1 n2 ( n1+ n2 +1) / 12 7( )8( 15 ) 1 /+12 74.67 8.6
9
 嬰兒出生體重低的母親之排序和 28.5 小於期望排
序和 56 。而且觀察值小到 3.5 標準差。因此,新
生兒體重過輕的母親之家訪次數顯著低於新生兒
體重正常的母親。上述結果並不會感到訝異,因
為兩個之排序平均數 R1=4.1 對 R2=11.4 ,差異非
常大。
 上述之介紹適用於大樣本。所謂大樣本是每組人
數必需是 6 或以上。那麼小樣本時,有沒有精確
檢定方法可以用?有的。詳情請參閱 Brown 及
Hollander ( 1977 )。
 魏克森排序和檢定與雙獨立樣本 t 之使用情況相
似。但前者之檢力比較差,約為後者檢力效率之
92% 。
10
四、魏克森符號排序檢定
 在前面,我們介紹過配對 t 檢定,其對應之無母數檢
定就是魏克森符號排序檢定( Wilcoxon signed-rank
test )。假設有一系列成對數據,要檢定第一個樣本之
中位數與第二個樣本之中位數相等之假說,即在某介
入前及後測量結果沒有差異。
 進行步驟為計算成對數據的差異 (d) ,扣除差異為零
之觀察值,樣本數會因而下降。對此差異之絕對值從
小到大作排序及排名次,即差異最小者 1 分,最大者 n
分,同分之處理與前述相同,然後將原來差異之符號
放回到排序後分數,加總符號屬正之排序,得檢定統
計量 W ,如果虛無假說為真時,正符號之排序和與負
符號之排序應該相等。
11
 以表 2 之資料作說明,因為同一母親,有懷孕前及懷孕後
抽菸的資料,所以為非獨立樣本,進行魏克森排序和檢定。
在 d 之欄位為懷孕前後抽菸量之差異; rd 之欄位為絕對差
異之排序分數, 1 分者為絕對差異最低者, n (在這裡是
10 分)分為絕對差異最高者。放回原來差異之符號,並依
正負號分別作加總,得 W1 及 W2 。記得全部排序分數之總
和為 n ( n + l ) /2 。在虛無假說下,正號之差異排序和等
於負號之差異排序和,即等於全部排序分數總和的一半。

 因此,其期望排序和為:
 1  n ( n + 1)
We =   (公式5)
2
即表 2 之 10(11)/4=27 . 5 。而檢定統計量 2 W1=7 。

12
表 2 魏克森符號排序檢定:懷孕前後每天抽菸量
13
 因為 W1 近似常態分佈,平均數為 We ,標準差
為 σW ,便可進行 Z 檢定:
W1 −
W
Z = e

σw
W1 − We
= (公式6)
( 2n + 1) We / 6
7 − 27.5 − 20.5
= = =− 2.09
2 ( 10 ) +1 27.5/ 6 96.25

 結果顯示排序和之觀察值與期望值有顯著差異
,所以推翻 Ho ,即懷孕會使抽菸習慣改變。

14
 與配對 t 檢定比較,魏克森符號排序檢定之統計檢
定之統計檢力效率為 92% ,即靈敏度比有母數檢
定為差。
 至顧符號排序和符合常態分佈之假設在 n≧8 便能
滿足。對於小樣本,需作精確檢定,請參考 Brown
及 Hollander ( 1977 )之教科書,該書亦包括魏克
森檢定信賴區間之計算。
 按著,很自然會問「有沒有比較兩組以上之無母數
檢定方法?」即與有母數方法之變異數分析對應之
無母數檢定方法。答案是有的,可用 K-W 檢定
( Kruskal-Wallis test )。

15
五、 K-W 單維排序變異數分

 K-W 檢定為與單維變異數分析對應之無母數
檢定方法。當要比較的組別為 3 組或以上,
各組又是獨立,但母體資料不是常態分佈,
或各組之變異數不相等時,便可應用 K-W 檢
定。如果要比較資料為有序,而不是等距或
等比,也可使用 K-W 檢定。例如,橫列為三
種或以上之止痛劑,直欄為有順序對止痛之
反應,包括沒有、輕度、中度、強度、完全
止痛( Mehta,1994 )。本節之範例為等比的
資料,但單維變異數分析之前題假設無法滿
16
足。
 要執行 K-W 檢定,首先將各組之資料合併,從小排到大
,並給予排序分數,然後放回到原內組內,即將等比資
料轉化為排序資料。如果要分析資料已經是有序資料,
則此步驟就不需要。

12 k R 2j
H= ∑n − 3 ( N + 1) (公式7)
其中 N ( N + 1) j =1 j

k= 比較組別之數目
nj= 在 j 組中之人數
N= 所有組加起來全部人數
Rj=j 組中之排序和

17
 下面為 3 種不同老師之教學表現分數:
老師種類
A B C
96 80 115
128 124 149
83 132 166
61 135 147
101 109 -

排序後為
老師種類
A B C
4 2 7
9 8 13
3 10 14
1 11 12
5 6 -
R1 =22 R2=37 R3=46 18
12 k R 2j 12  222 372 462 
H=
14 ( 14 + 1)
∑n
j =1
−3 ( N 1+) = 
14( 15)  5
+
5
+  3( −14 )1 + 6.4
4
=
j

 查閱附錄 F ,當 nj 為為
5,5,4,p=.046 , H=5.67 計算之 6.4 > 5.67 ,
即 p 小於 α=.05 ,所以推翻 Ho ,即三種教育
者之教學表現分數有顯著統計差異。

19
 同分之案例

當有 2 或以上分數為同分,則給予這些同分者應得排
序分數之平均數。又因為 H 會受到同分之影響,所以
可作校正,即有同分時, H 之計算為前面公式:

,其中 T 為同分者之分數。

ΣT
1−
 同分之校正效果使得 H 值增大,比沒有校正較容易得
N 3
−N
到顯著結果。通常有沒有校正同分得到結果差異不大。
即使有 25% 資料是同分,有沒有校正同分所得 H 之機
率之差異不到 10% 。

20
六、 Friedman 雙因子等級變異數
分析
 Friedman雙因子等級變異數分析 (Friedman
two-way analysis of variance by ranks) 是適用
於重覆樣本次序變項資料的無母數統計法。

 凡同一群受試者重複接受 k 個實驗條件 ( 重
覆量數 ) ,或 k 個在某些特質方面相配對的
人各接受其中一種實驗條件 ( 配對法 ) 時,所
得的資料化成等級分數後,便可使用此一方
法來進行變異數分析。
21
與 K-W 單因子等級變異數分析相比較起來,
Friedman 二因子等級變異數分析的計算方法
相對簡單。大體上來說,我們要以每一配對為
單位,根據 k 個原始分數之大小,將原始分數
化為等級分數。
 在所有各配對組內的這些等級排定之後,再把
各實驗條件所得等級分數加起來,便可得到各
實驗條件的等級總和 (Rj) 。如果虛無假設 Ho
正確,亦即這 k 個樣本是來自同一個母群體,
則理論上各實驗條件組所得的等級總和應大約
相同。否則,須無假設可能會被拒絕。
22
 小樣本:當 k=3 而 N ≦9 ,或 k=4 而 N ≦4 時

例 某學習心理學家想要研究「固定比例增強法」
(FR) 、 「固定時間增強法」 (FI) 、 「不定比例增強
法」 (VR) 以及「不定時間增強法」 (VI) 等四種方法對
學習快慢的影響。為怕智力變項會影響實驗結果,乃
利用三組智力相等的配對組,每組四名兒童,來進行
實驗。下面是實驗結果三個配對組在上述四種增強法
下,學習達到 100% 正確度時,所費的學習時間 ( 分鐘
數 ) 。在四種增強法下,兒童學習的速度是否有顯著差
異?

23
(1) 原始分數 (2) 等級分數
配 固定 固定 不定 不定 配 固定比 固定時 不定 不定時
對 比例 時間 比例 時間 對 例 間 比例 間
A 63 112 45 75 A 2 4 1 3
B 34 96 76 65 B 1 4 3 2
C 87 72 50 123 C 3 2 1 4
N=3 , K=4 R1=6 R2=10 R3=5 R4=9

 公式 8:
k
12
X =
2
r ∑
Nk (k + 1) j =1
( Rj ) 2
− 3N (k + 1)

12
= [(6) 2 + (10)2 + (5)2 + (9)2 ] − 2(3)(4 + 1) = 3.4
(3)(4)(4 + 1)
24
 大樣本:當 N 和 ( 或 )k 的數目大於查表所列最大
的 N 和最大的 k 時,分配便漸漸接近於 df=k-1 的
分配。
 例 某研究者想知道雨具的內容對皮膚電流反映
(GSR) 的影響。他以二十名大學生為受試者進行
此研究。每位受試者均閱讀下列三個句子: 「
A 、我這一學期不太用功」「 B 、不用功讀書考
試會不及格」和「 C 、考試不及格該多丟臉呀」
。以下是實驗結果,每位受試者看到 A 、 B 、 C
三個句子時, GSR 振福改變量的等級。不同語句
所引起的 GSR 變化量是否有顯著差異存在?

25
受試者 A B C D E F G H I J K
A句 2 1 2 1 2 1 1 1 2 1 1
B句 1 2 3 2 1 2 3 3 1 2.5 3
C句 3 3 1 3 3 3 2 2 3 2.5 2

L M N O P Q R S T Rj
1 2 2 3 1 1.5 1 3 1 R1=30.5
2 1 1 2 2 1.5 3 1 2 R2=39.0
3 3 3 1 3 3 2 2 3 R3=50.5

N=20 , =3

以上列出每個受試者看到 A 、 B 、 C 三個語
句時之 GSR 振幅改變量的等級,並沒有列出
原始分數。由公式求 X r2 的值。 26
七、符號檢定
 符號檢定是最簡單統計檢定方法之一,是以
中央趨勢之中位數作運算,唯一前題假設就
是資料來自一連續分佈。

 由於將資料轉換為正、負號,然後作計算,
所以稱為符號檢定( sign test )。將以一單
樣本及一成對樣本說明符號檢定之計算及用
途。當資料之常態分佈假設無法滿足而不能
使用 t 檢定時,符號檢定就特別有用。
27
 用在單樣本情形

今欲檢定一樣本的中位數是否等於母體中位數 m
之 Ho 。將數值高於母體中位數者給予 (+) 號,低於
母體中位數者給予 ( - ) 號,而母體申位數者給予零
分,不列入計算。如果 Ho 為真,則樣本之中位數與
母體中位數相同,則應該有 50%(+) 及 50%( - ) 。

 然後用二項分佈來決定(+) 號數目與期望數目有沒有
顯著差異。除了用二項式,也可用附錄 D 得到答案。
附錄 D 表列出當期望機率為 50% 時,觀察到 (+) 號
數目之機率。

28
 範例 1
在大部份外科手術,自麻醉到恢復時間中位數為 7 小時。而一種新麻醉劑宣稱
可讓麻醉者更快恢復,在 12 位使用新麻醉劑之手術病患之,恢復時間為:

Ho :新麻醉劑恢復時間為 7 小時
 因為新麻醉劑所需恢復時間應該比較短,所以應屬單尾檢定。而上表有 8 次之
恢復時間小於母體恢復時間,有
恢復 4 4 5 5 52 次之恢復時間大於母體恢復時間,刪除
6 6 6 7 7 8 92 次
之恢復時間等於母體恢復時間。所以在
時間 Ho 下, 10 之中,期望有 5 次 (+) ,實
際只有 2 次 (+) 。
符號 - - - - - - - - 0 0 + +

29
 要決定出現 2 次之機率,可用二項分佈公式或附錄 D 之符號
檢定臨界值。在附錄 D 中, n=10 , α=.05 單尾檢定時, q=1
或 9 。即要達到統計顯著意義, 10 次中需要 9 次 ( - ) 或 1
次 (+) ,但只觀察到 8 次 ( - ) ,所以不能推翻 Ho ,即樣本恢
復時間與母體 恢復時間中位數沒有顯著統計差異。  

 用在成對樣本情形
符號檢定也可對成對資料,如前後測、治療及對照組作檢定。
唯一的前題假設為每對資料是獨立,然後只記錄每對資料之
正負號即可。例如治療是無效,則正號與負號之數目應該相
同( Ho )。

30
 範例 2
10 個血液檢體分別送到兩個實驗室作膽固醇之測量
,得到下面結果二個實驗室得到膽固醇之測量:
二個實驗室得到膽固醇之測量
病人 1 2 3 4 5 6 7 8 9 10
A lab 296 268 244 272 240 244 282 254 244 262
B lab 318 287 260 279 245 249 294 271 262 285
差異之 - - - - - - - - - -
正負號

Ho :兩個實驗室測得膽固醇中位數相同
 實際 10 次中 10 之均為 ( - ) ,在 Ho 下,出現機率為
多少?從附錄 D 中, n=10 , α=.05 ,雙尾檢定,臨
界 q 值為 1 或 9 。因此,可推論兩個實驗室在膽固醇
之測量是不同。
31
八、 Spearman 排序相關係數
 Spearman 排序相關係數( Spearman
rank-order correlation
coefficient )用來計算兩個排序變項之相關。當 x 與 y 排序後
排名相同時,則得到完全相關 (±1) 。而沒有關係時,可用排
序後之差異( di = xi - yi )來計算。史丕曼排序相關係數 rs
( S 代表 Spearman )也可用皮爾森相關係數 r 求得:

6Σd 2
 其中 di 為每對數字排序後之差異, n 則為成對數目。與皮爾
r = 1− i
(公式9)
s
(
森相關係數相似,史丕曼相關係數之範圍為
n n 2 −1 )-1 到 +1 。愈接近
刊表示有高度相關,愈接近零表示沒有相關。正負號則代表
相關之方向。

32
 舉個例子來介紹 Spearman 相關係數的計算及
應用。今有 2 位教授分別對 12 位學生之表現
排名次(從 1 排到 12 )(表 3 )。同分者之
計算方式與前述相同,給予平均名次。注意
C 教授給 3 位第一名。而表 3 之 x 及 y 欄為 2
位教授給予之名次, di 欄則是 x 及 y 之差異
,最後一直欄則是 di2 代入公式 9
6Σd i2 6 (55.50 )
rs =−
1 =− 1 = .81
(
n n −1
2
) ( 4 1− )
12 14

33
表 3 兩位教授對學生表現之排名

34
 要檢定所得之相關係數是否與零有差異,需
要假設 x 及 y 是隨機及每對資料為獨立,然
後用與皮爾森相關係數相同檢定方法來檢定
即可。只要樣本數在 10 以上即可。其檢定統
計量之公式為:
rs n − 2
t= (公 式)
10
1 − rs2

 自由度為 n - 2 。代入表 3 之資料,得到:


.81 10 ( .81) ( 3.16)
t= = =4.41
1 − .66 .58

35
 因為大於自由度為 10 ,臨界值 t.95=2.23 ,所
以推翻 Ho ,即求得相關係數與雲有顯著差異

 因為 Spearman 相關係數 rs 之檢力比皮爾森相


關係數 r 為低,因此,如果資料能符合皮爾
森相關係數之前題假設,建議儘可能用皮爾
森相關係數。( 1977 )之教科書,書中也提
供 rs 臨界值之表。

36
九、費氏精確檢定
 卡方檢定有一些限制,就是不適合使用於小樣本,所
以期望次數不能小於 1 及 20% 的期望次數不能小於
5 。對於小樣本,可使用費氏精確檢定( Fisher’s
exact test ),直接計算在 2×2 列聯表出現某次數之
機率,公式如下:

( a + b ) !( c + d ) !( a + c ) !( b + d ) !
p= (公式11)
N !a !b !c !d !
其中 a,b,c 及 d 為 2×2 列聯表之觀察次數, N 則是樣
本數。
37
 範例 3
有 9 位新生兒病患需作心臟移植,而只有 5
位有合適的捐贈心臟,一年後比較有及沒有
作心臟移植的病患的存活情況。結果:
活過 12 個月?
是 否 合計
心臟移植 沒有 a=4 b=1 5
有 c=1 d=3 4
合計 5 4 9

上述觀察到的次數之機率為:
5!4!4!5! 5‧4‧3‧2‧4 10
p= = = = 0.159
9! ! !!! 6 ‧7 ‧8 ‧9
4113 63
38
 要計算 p 值,需將表中之合計次數固定,然後計算觀察到
此和更極端之機率。更極端之情況就是沒有作心臟移植之
新生兒,全數能活過 12 個月。即表中之 d 增加 1 ,各合計
次數維持不變,求其他 a,b,c ,得到下面新 2×2 表:

5
上述表發生機率為: 0 5
0 4 4
5 4 9

5!4!4!5! 5!4! 4‧ 3‧ 2‧ 1 1
p= = = = = .008
9!5!0!0!4! 9! 6‧ 7‧ 8‧ 9 126
39
 因此,觀察到此樣本和更極端之機率
為 .159+.008=.167 。此 p 值為單尾檢定。雙尾檢定時
,只要乘上 2=2×.l67=.334 。基於上述 p 值,不能推翻
有及沒有做心臟移植之新生兒存活沒有差異之 Ho 。
雖然我們可能不喜歡此推論,對於小樣本時,這也是
我們在統計上能做到最好的。因為在 2×2 列聯表之合
計是固定,然後做費氏精確檢定,衛生科學界仍有一
些爭議。但是很多統計學者依然會使用費氏精確檢定
,因為費氏精確檢定的結果比較保守,即真正 p 值小
於計算得之 p 值。

40
總結
與
t 檢定、配對 t 檢定、相關係數都有對應之
無母數檢定方法。而無母數分析之最大優點
是不需要常態及變異數同質性之前題假設,
而最大缺點則是檢力較差。

 本單元介紹的數種在衛生科學最常用的無母
數分析方法,分別為魏克森排序和檢定、魏
克森符號排序檢定、 K-W 檢定、符號檢定、
史爾曼排序相關係數及費氏精確檢定等。
41

You might also like