Professional Documents
Culture Documents
tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序
SPSS 是社會科學有名的統計軟體,迄今亦在生物醫學大流行。特別是最近
幾年,各大學研究生人數逐年大增,基於學位學術撰寫的需要,多變量統計更是
不可或缺。
一般研究者從事研究時,常有的難題包括:
(1) 應該採用哪一種統計方法來檢定研究假定 (assumptions) 及假設 (hypoth-
esis)?
(2) 如何使用電腦統計程序,以正確且快速的分析研究資料?
(3) 統計程式所輸出的數據所代表的意義為何?又該如何解釋?
筆者在從事研究與教學之際,乃針對此問題,將各種類型的統計方法,以學
習者與使用者的觀點歸納整理,並以範例呈現,期使讀者在了解統計方法之後能
快速學會使用 SPSS,做最有效率的統計分析。
高等統計分析主要應用在:社會科學、生物學 (Biology)、經濟學 (Econom-
ics)、工程學 (Engineering)、遺傳學 (Genetics)、市場行銷 (Marketing)、醫學 (Medi-
cine)、精神病學 (Psychiatry)、教育學、心理學、人管、生產管理;系所包含:經
濟系、風險管理系、航運管理、財務金融、會計、公共衛生、工業工程、土木
等。
有鑑於國內統計使用者眾多,可是目前較缺「理論、統計及方法論」系統性
的書,加上 SPSS v25 市面上鮮少有教科書來介紹新統計功能,於是開始著手撰
寫 SPSS 統計分析,一系列的書。並附上範例之資料檔供讀者實作:
一、《高等統計:應用 SPSS 分析》一書,該書內容包括:描述性統計、樣
本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量……。
二、《多變量統計之線性代數基礎:應用 SPSS 分析》,該書內容包括:平
均數之假設檢定、MANOVA)、典型相關分析 (canonical correlation analysis)、判
別分析 (discriminant analysis)、主成分分析、因素分析 (factor analysis)、集群分
析、多向度量尺/多維標度法。
三、《邏輯斯迴歸分析及離散選擇模型:應用 SPSS》一書,該書內容包括:
邏輯斯迴歸、Probit 迴歸、多項式邏輯斯迴歸、Ordinal 迴歸、Poisson 迴歸、負
I
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
二項迴歸……。
四、《多層次模型 (HLM) 及重複測量:使用 SPSS 分析》一書,該書內容包
括:線性多層次模型、panel-data 迴歸……。
五、《存活分析及 ROC:應用 SPSS》一書,該書內容包括:類別資料分析
( 無母數統計 )、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研
究資料、勝出比(Odds Ratio)的計算、篩檢工具與 ROC 曲線……Cox 比例危險
模型、Kaplan-Meier 存活模型、參數存活分析有六種模型……。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統
計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。本書內
文盡量結合「理論、方法、統計」,期望研究者能在其領域中得到良好的研究成
果。
張紹勳 林秀娟 敬上
II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序
Chapter
01 統計學回顧 1
Chapter
02 假定 (assumption) 的偵測及補救法 59
I
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2-3-1 用線形圖檢視連續變數是否符合常態性的假定 (assumption) ......91
2-3-2 曲線關係就違反直線性假定:改用加權 (weighted)OLS 迴歸 .....99
2-3-3 變數變換 ( 迴歸分析 ):違反誤差常態性的假定就做 log(x) 變換
...........................................................................................................113
2-3-4 ANOVA:盒形圖發現變異數異質性:改用 Welch 法.................120
Chapter
03 勝算比 (odds ratio)、卡方檢定、Logistic
迴歸 131
Chapter
04 兩組平均數之比較:t 檢定值≒ Meta 的
效果量 181
II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
05 獨立樣本 ANOVA、重複測量 ANOVA 225
III
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
5-4 單層次:重複測量的混合效果模型 (mixed effect model for repeated
measure) .........................................................................................................288
5-4-1 重複量測 (repeated measurement)ANOVA 的重點整理 ................289
5-4-2 重複測量 ANOVA 之 F 檢定公式 ..................................................295
5-4-3 重複測量 ANOVA 之主要效果 / 交互效果檢定 ( 雙層 MIXED
vs. 單層 GLM 指令 ) ........................................................................298
5-5 雙層次 (MIXED 指令 ):重複測量的混合效果模型.................................301
5-5-1 雙層次 vs. 二因子混合設計 ANOVA:wide 格式 ( 雙層 MIXED
vs. 單層 GLM 指令 ) ........................................................................302
5-5-2 雙層次 vs. 二因子混合設計 ANOVA:long 格式 (MIXED 指令 )
...........................................................................................................323
Chapter
06 共變數分析 (ANCOVA) 339
IV
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
07 線性迴歸的診斷 401
Chapter
08 線性迴歸 457
V
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
8-4 如何挑選預測變數的最佳組合:用 Mallow’s Cp 值及 Adjusted R2 來比較
模型 ...............................................................................................................479
Chapter
09 內生的共變:工具變數及兩階段最小
平方法 (2SLS) 501
參考文獻 585
VI
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
t e r
p
01
Cha
統計學回顧
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2
資料型態是連結分布或
離散分布
離散變數 連續變數
可估計結果的機率嗎 資料分布是對稱或非對稱
對稱分布 非對稱分布
可 不可
高等統計:應用SPSS分析
是
對稱分布 非對稱分布
或來電(02)2705-5066
binomial discrete geometric binomial hyoergeometric unifrom trigular normal logistic exponential lognormal Min Extreme
uniform
圖 1-1 z 分配
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
統計學回顧
Chapter
01 3
均勻分布 伯努利分布
負二項式分布
卜瓦松分布 指數分布
韋伯分布
常態分布 卡方分布
高斯分布
t分布
Gamma分布
Beta分布
圖 1-2 分布的類型
1. 均勻分布:一個均勻分布在區間 (a 到 b 之間 ) 上的連續型隨機變數。一隨機
的連續變數 X ,其值介於最小值 a 到最大值 b 之間。假設每一點出現的機率
都是均等,那麼就稱這個變數 X 的機率分布是連續均勻分布。例如:生物學
上如族群密度中所提及。竹林或針葉樹林的分布因陽光、空間關係,故維持
一定的均勻分布情形亦稱之;人造林與水稻田的分布亦屬之。
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
4 高等統計:應用SPSS分析
f(x)
1
b-a
0 a b X
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 5
隨機變數
機率密度函數
定義域
平均數
眾數
變異數
偏態
峰度
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
6 高等統計:應用SPSS分析
因此民意調查及品質管制的研究裡常出現此分布。生物學例子如:標記再捕捉
法。計算河川中魚的數量時,可將依定數量的魚做標記動作,而後假設捉出
十隻中有六隻標記即可回推河川中總共的魚數,即為該分布情形。
超幾何分布之
超幾何分布之
機率質量函數
平均數
眾數
變異數
偏態
機率質量函數
平均數
中位數
變異數
偏態
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
8 高等統計:應用SPSS分析
機率質量函數
如果隨機變數 X 服從參數為 n 和 p 的二項分布,我們記 X~b(n, p) 或 X~B(n, p)。
n 次試驗中正好得到 k 次成功的機率由機率質量函數給出:
對於 k = 0, 1, 2, …, n ,其中
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 9
參數 成功機率 ( 實 ) 成功機率 ( 實 )
支撐集
機率質
量函數
累積分
布函數
期望值
中位數 ( 如果 ( 如果
是整數, 是整數,則
則中位數不唯一 ) 中位數不唯一 )
6. 負二項分布:是統計學上一種離散概率分布。常見離散隨變數的分布如下表五
種:
X~B(n, p)
二項分配 E(X) = np V(X) = npq
X~NB(k, p)
負二項分配
X~G(p)
幾何分配
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
10 高等統計:應用SPSS分析
X~HG(n, K, N)
p = K/N
超幾何分配
E(X) = np
X~Poi(λ), λ = np V(X) = λ
卜瓦松分配 E(X) = λ (1) n > 20 & p <= 0.05
(2) n > 50 & p < 0.1
「負二項分布」與「二項分布」的區別在於:「二項分布」是固定試驗總次數 N
的獨立試驗中,成功次數 k 的分布;而「負二項分布」是所有到成功 r 次時即
終止的獨立試驗中,失敗次數 k 的分布。舉例說:若我們擲骰子,擲到一即視
為成功。則每次擲骰的成功率是 1/6 。要擲出三次一,所需的擲骰次數屬於集
合 {3, 4, 5, 6 ……} 。擲到三次一的擲骰次數是負二項分布的隨機變數,要在
第三次擲骰時,擲到第三次一,則之前兩次都要擲到一。
注意擲骰是伯努利試驗,之前的結果不影響隨後的結果。
.二項分布:丟出現正面機率為 p 的銅板 n 次,出現 k 次正面的機率為
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 11
概率質量函數
虛線 代表平均值,在每個圖中等於 10;綠線表示標準偏差。
符號
參數 直到實驗停止 ( 失敗次數整數,但
定義可以還可以擴展到實數 )
在每個實驗中的成功概率
( 真實 )
支持 一些成功
涉及
二項式
係數
在正則完全 beta 函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
12 高等統計:應用SPSS分析
又如:某一服務設施在一定時間內受到的服務請求次數、電話交換機接到呼
叫的次數、汽車站台的候客人數、機器出現的故障數、自然災害發生的次數、
DNA 序列的變異數、放射性原子核的衰變數、雷射的光子數分布等。
Poisson 的機率質量函數為:
機率質量函數
平均數
眾數
變異數
偏態
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 13
隨機變數 x
參數
機率密度函數
平均數
中位數
眾數
變異數
偏態
9. 韋伯分布(Weibull distribution)是可靠性分析和壽命檢驗的理論基礎,其中 x
是隨機變數,λ > 0 是比例參數(Scale parameter),k > 0 是形狀參數(Shape
parameter)。顯然,它的累積分布函數是擴展的指數分布函數,而且 Weibull
distribution 與很多分布都有關係。如:當 k = 1,它是指數分布;k = 2 時,是
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
14 高等統計:應用SPSS分析
Rayleigh distribution(瑞利分布)。
韋伯 pdf(gamma=0.5) 韋伯 pdf(gamma=1)
隨機變數 X 隨機變數 X
機率密度函數
平均數
眾數
變異數
偏態
機率密度函數
平均數
眾數
變異數
偏態
機率密度函數
平均數
中位數
變異數
偏態
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 17
機率密度函數
平均數
中位數
變異數
偏態
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
18 高等統計:應用SPSS分析
候的時間就是伽瑪分布。
指數分布和伽瑪分布可用來計算等候時間、產品可靠度、排隊問題等。
Gamma 之存活函數
機率密度函數
平均數
中位數
變異數
偏態
圖 1-15 gamma 分配之機率密度函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 19
機率密度函數
平均數
圖 1-16 gamma 分配之機率密度函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
20 高等統計:應用SPSS分析
15. 對數常態分布是指一個隨機變數的對數服從常態分布,則該隨機變數服從對
數常態分布。對數常態分布從短期來看,與常態分布非常接近。但長期來看,
對數常態分布向上分布的數值更多一些。此分布結果如生物學上的演化上因
環境極端異同,而使得物種分布呈現對數常態分布。
對數常態之存活函數
機率密度函數
平均數
中位數
變異數
偏態
圖 1-17 gamma 分配之機率密度函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 21
1-1 統計學回顧
1. 單變量分布 (Univariate):若我們只關心母體的某項特性,如產品之抗拉強
度、個人滿意度……,則此母體分布稱為單變量分布。
2. 雙變量分布 (Bivariate):若我們關心母體的兩項特性,如產品的抗拉強度與
重量的關係、個人滿意度與離職意願的因果關係……,則此母體分布稱為雙
變量分布。
3. 多變量分布 (Multivariate):若我們關心母體兩項以上的特性,如:「產品的
抗拉強度、重量與抗壓強度」、
「個人滿意度、組識承諾與離職意願的因果關
係」,則此母體分布稱為多變量分布。
一、醫學統計經常混淆的名詞
在應用統計分析作學術研究的各個領域中,醫學領域可說是其中的非常大
宗,據統計目前全世界約有 3 萬種的醫學期刊,約占了科技期刊的四分之一之多。
而在這塊這麼大的市場中,我觀察到在醫學領域所使用的統計名詞,經常與統計
教科書有相當多的出入,本篇文章擬將這些常見的混淆之處作個釐清。
1. 單變量或多變數迴歸分析
假使我們現在要進行依變數 (dependent variable) 的預測,如果我們的自變
數 (independent variable) 只有一個,那麼這種迴歸模式稱之為簡單迴歸 (Simple
regression) ,不過在醫學期刊常見以單變量迴歸 (Univariate regression) 來表達;
倘若我們的自變數是 2 個以上,那麼我們稱之為多元迴歸 (Multiple regression) ,
但在醫學期刊則部分稱之為多變數迴歸 (Multivariable regression) 或多變量迴歸
(Multivariate regression) 。
特別值得說明的是,「多變量」(Multivariate) 在一般統計教科書是專門指同
時有 2 個以上的依變數的統計方法,例如主成分分析、因素分析、集群分析、結
構方程模式、典型相關等;但在醫學領域中,不管依變數有多少個,只要自變數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
22 高等統計:應用SPSS分析
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 23
1-1-2 統計分析法
表 1-1 資料分析方法之參考表
表 1-2 常見之統計模型
一、推論統計主要工作
推論統計指用概率形式來決斷數據之間是否存在某種關係,及用樣本統計
值來推測總體特徵的一種重要的統計方法。推論統計包括總體參數估計和假設檢
定,最常用的方法有 Z 檢定、t 檢定、卡方檢定等。推論統計主要工作如下:
1. 估計 (estimation):利用一組由母體所取之隨機樣本資料的資訊,來推估母體
之未知參數。常見有 (1)「點估計量」:由樣本資料計算的統計量,使用來估計
母體參數。(2)「區間估計」
:某區間會涵蓋母體參數的可能性。(3)「信賴區間」
(confidence interval):在特定機率下,估計母體參數可能落在的數值範圍。此
特定的機率值可以稱為信賴水準。
2. 假設檢定 (testing of hypothesis):研究者對現象 ( 參數 ) 提出主觀的研究假設,
再利用樣本特徵的資訊 ( 抽樣數據 ) 來對研究假設進行檢定,以做管理的正確
決策。
通盤來說,假設檢定都可分解成下列五個步驟:
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
高等統計:應用SPSS分析/張紹勳,林秀
娟.--初版.--臺北市:五南, 2018.09
面; 公分
1.統計套裝軟體 2.統計分析
512.4 107013718
1H1G
高等統計:應用SPSS分析
作 者 ─ 張紹勳 林秀娟
發 行 人 ─ 楊榮川
總 經 理 ─ 楊士清
主 編 ─ 侯家嵐
責任編輯 ─ 黃梓雯
文字校對 ─ 黃志誠 劉祐融
封面設計 ─ 盧盈良
出 版 者 ─ 五南圖書出版股份有限公司
地 址:106台 北 市 大 安 區 和 平 東 路 二 段 3 3 9 號 4 樓
電 話:(02)2705-5066 傳 真:(02)2706-6100
網 址:http://www.wunan.com.tw
電子郵件:wunan@wunan.com.tw
劃撥帳號:0 1 0 6 8 9 5 3
戶 名:五南圖書出版股份有限公司
法律顧問 林勝安律師事務所 林勝安律師
出版日期 2 0 1 8 年 9 月 初 版 一 刷
定 價 新 臺 幣 6 8 0 元
※版權所有.欲利用本書內容,必須徵求本公司同意※
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066