You are on page 1of 26

本試閱檔為五南所有。如欲購買此書,請至五南網站

www.wunan.com.tw或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
自 序
本書主要介紹分析二分類依變數時,最常使用的統計分析模型中的 logistic
迴歸模型,及其擴充模型包括:「邏輯斯迴歸搭配 ROC 曲線、多項邏輯斯迴歸、
Alternative-specific multinomial probit regression、Alternative-specific multinomial
邏輯斯迴歸、邏輯斯迴歸搭配 ROC 曲線做工具之分類準確性、Exact 邏輯斯迴
歸、異質機率模型、Ordered logit 迴歸分析、多層次 ordered logistic 迴歸、Rank-
ordered logistic 迴歸、特定方案 Rank-ordered logistic 迴歸、零膨脹 ordered probit
regression 迴歸、配對資料的條件邏輯斯迴歸、特定方案 conditional logit model、
離散選擇模型、分式多項式 (Fractional polynomial) 迴歸、多層次邏輯斯迴歸、巢
狀邏輯斯迴歸、panel-data 邏輯斯迴歸…… 」。透過例題分析,結合計算機統計
軟體的使用,詳細闡述該模型原理及其應用;同時,還介紹如何將 logistic 迴歸
模型擴展到次序 logistic 迴歸模型和多項 logit 模型,以分析次序變數和多分類名
義變數為因變數的數據。
本書第一章介紹如何將 SAS、R 和 SPSS 檔案格式轉成 STaTa 可分析檔案,
坊間常見的 41 種軟體及大型資料庫之檔案格式,都可轉至 STaTa 來分析。
在統計學中,邏輯斯迴歸分析或 logit 模型是一個迴歸模型,其中依變數
(DV) 是分類的。本文涵蓋二進制因變數的情況,即輸出只能取兩個值 “ 0 ” 和
“1”,這些值代表:通過/失敗、贏/輸、活/死或健康/生病。依變數具有兩
個以上結果類別的情況可以在多項 logistic 迴歸中進行分析。在經濟學術語中,
邏輯迴歸是定性反應/離散選擇模型的一個例子。
本書適用科系包括:財務金融、會計、公共衛生、生物醫學、工業工程、土
木、醫學管理、航運管理、公共行政、人管、生產管理、行銷管理、教學/心理
系、風險管理系、社會系、法學院、經濟系……等。
在 google scholar 學術搜尋中,查詢「logistic regression analysis」會出現
1,930,000 篇以上論文。可見邏輯斯迴歸分析係非常熱門的統計法。
在我們週圍,Logit 迴歸的資料常出現在不同領域中,包括:
(1) 公共衛生領域:某傳染病的死亡因素。
(2) 生物醫學領域:癌患者放射線治療所產生副作用、腎虛症與骨質疏鬆症
本試閱檔為五南所有。如欲購買此書,請至五南網站
I
www.wunan.com.tw或來電(02)2705-5066
關聯性、憂鬱症狀之影響因子等 logistic 分析……等。
(3) 工程類中的建物地震損害程度評估模型、絕緣礙子火花偵測系統。
(4) 商業領域:客戶關係管理、公司企業的存活。市場研究之消費者對特定
商品購買時間,客戶忠誠度。或者商業上客戶資料管理、行銷、企業倒閉、員工
離職。
(5) 財務金融領域:個人消費性貸款、法人金融預警分析等。
(6) 保險統計學及人口統計學中的投保與否。
(7) 社會學中的事件歷史分析,研究女性婚姻抉擇因素、高齡人口選擇未來
養老居住方式……等。
(8) 法學研究:犯罪的因素等。
(9) 工業領域:可靠度分析、工業製成、產品 cycle。
(10) 經濟研究:失業的因素,從就業時間到失業時間,到再就業時間等。
(11) 教育領域:老師離職、學生休退學/吸毒的因素等。
(12) 財管領域:財務危機與轉投資活動關係、貸款授信違約風險評估、銀行
放款信用評等、應收帳款呆帳預測等。
(13) 行銷/企管類:旅客參與觀光旅遊線之消費型態、汽車保險續保、. 投
資型保險商品購買預測等。
社會科學、生物醫學、財金等領域,其統計係採用統計學、運籌學、經濟、
數學等領域之定量方法。社會科學及自然科學二大領域中各個學科,它們有許多共
通之研究設計及統計分析法,都與作者在五南出版 STaTa 一序列書名有關,包括:

一、《STaTa 與高等統計分析》一書,該書內容包括:描述性統計、樣本數
的評估、變異數分析、相關、迴歸建模及診斷、重複測量……等。

二、《STaTa 在結構方程模型及試題反應理論的應用》一書,該書內容包括:
路徑分析、結構方程模型、測量工具的信效度分析、因素分析……等。

三、《生物醫學統計:使用 STaTa 分析》一書,該書內容包括:類別資料分


析 ( 無母數統計 )、存活分析、流行病學、配對與非配對病例對照研究資料、盛
行率、發生率、相對危險率比、勝出比 (Odds Ratio) 的計算、篩檢工具與 ROC 曲
線、工具變數 (2SLS)……等。
本試閱檔為五南所有。如欲購買此書,請至五南網站
II
www.wunan.com.tw或來電(02)2705-5066
四、《Meta 分析實作:使用 Excel 與 CMA 程式》一書,該書內容包括:統
合分析 (meta-analysis)、勝出比 (Odds Ratio)、風險比、4 種有名效果量 (ES) 公式
之單位變換等。

五、《Panel-data 迴歸模型:STaTa 在廣義時間序列的應用》一書,該書內


容包括:多層次模型、GEE、工具變數 (2SLS)、動態模型……等。

六、《總體經濟與財務金融:STaTa 時間序列分析》一書,該書內容包括:
誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合……等。

七、《多層次模型 (HLM) 及重複測量:使用 STaTa》一書,該書內容包括:


線性多層次模型、vs. 離散型多層次模型、計數型多層次模型、存活分析之多層
次模型、非線性多層次模型……等。

八、《模糊多準評估法及統計》一書,該書內容包括:AHP、ANP、TOP-
SIS、Fuzzy 理論、Fuzzy AHP……等理論與實作。

九、《邏輯斯迴 歸及離散選擇模型:應用 STaTa 統計》一書,該書內容包


括:邏輯斯迴歸、vs. 多元邏輯斯迴歸、配對資料的條件 Logistic 迴歸分析、Mul-
tinomial Logistic Regression、特定方案 Rank-ordered logistic 迴歸、零膨脹 ordered
probit regression 迴歸、配對資料的條件邏輯斯迴歸、特定方案 conditional logit
model、離散選擇模型、多層次邏輯斯迴歸……等。

十、《有限混合模型 (FMM):STaTa 分析 ( 以 EM algorithm 做潛在分類再迴


歸分析 )》一書,該書內容包括:FMM:線性迴歸、FMM:次序迴歸、FMM:
Logit 迴歸、FMM:多項 Logit 迴歸、FMM:零膨脹迴歸、FMM:參數型存活迴
歸……等理論與實作。

十一、《多變量統計:應用 STaTa 分析》一書,該書內容包括:MANO-


VA、因素分析、典型相關、區別分析、MDS……等。

此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法,和統
計概念等,都是實證研究中很重要的內涵,也是本書撰寫的目的之一。為了讓研
究者能正確且精準使用 STaTa 統計分析,內文結合「理論、方法、統計」,期望
本試閱檔為五南所有。如欲購買此書,請至五南網站
III
www.wunan.com.tw或來電(02)2705-5066
對產學界有拋磚引玉的效果。
最後,特別感謝全傑科技公司 (http://www.softhome.com.tw),提供 STaTa 軟
體,晚學才有機會撰寫 STaTa 一系列的書籍,以嘉惠學習者。

張紹勳 敬上

本試閱檔為五南所有。如欲購買此書,請至五南網站
IV
www.wunan.com.tw或來電(02)2705-5066
自 序

Chapter
01 二元 (Binary) 依變數:邏輯斯迴歸
( 舊版 logit、新版 logistic 指令 ) 1

1-1 STaTa 如何讀入各種資料格式之資料 .....................................................7


1-1-1  資料輸入的方法:問卷、Excel 檔的讀入 .................................8
1-1-2 SPSS 資料檔 (*.sav) 轉成 STaTa 格式 ..................................... 20
1-1-3 SAS 格式轉成 STaTa ................................................................. 23
1-1-4 R 軟體之格式轉成 STaTa.......................................................... 28
1-1-5 Logistic 迴歸的應用領域 .......................................................... 30
1-1-6 STaTa 之 binary regression 選擇表之對應指令........................ 32
1-1-7  有限混合模型 (finite mixtures models, FMM) 之對應指令 .... 37
1-2 簡單邏輯斯迴歸的入門 ......................................................................... 41
1-2-1  簡單邏輯斯迴歸 (logistic regression model) 的介紹 ............... 46
1-2-2a  簡單 logistic 迴歸分析:年齡與罹患冠心病 (CHD) 關係 ... 57
1-2-2b Logistic 迴歸之練習題:年齡與罹患冠心病 (CHD) 關係 ... 67
1-3 邏輯斯迴歸分析 ..................................................................................... 75
1-3-1  二元依變數之 logistic 迴歸分析:大學申請入學之關鍵條件?
.................................................................................................... 75
1-3-2  如何挑選最佳解釋變數們:早產兒之危險因子 (tabulate,
gen、logistic/logit 指令 ) ......................................................... 102
本試閱檔為五南所有。如欲購買此書,請至五南網站 I
www.wunan.com.tw或來電(02)2705-5066
1-4 邏輯斯迴歸分析 (logit、glm 指令 ) .................................................... 108
1-4-1  邏輯斯迴歸分析— ( 母蟹 crab):(logit、prvalue、glm 指令 )
.................................................................................................. 108
1-4-2  質性自變數之 logit 迴歸 (AZT 處理對 AIDS 效果 )(logit 指令 )
.................................................................................................. 132
1-5 邏輯斯迴歸之建模法 (logit、lrtest、tab1、lowess、fp/fracpoly 指令 )
............................................................................................................... 139
1-5-1  評比敵對模型,適配指標有七種 .......................................... 139
1-5-2a  邏輯斯迴歸之共變數係數調整法 (fractional polynomial
regression)(fp 或 fracpoly 指令 )............................................ 142
1-5-2b  分式多項式迴歸 (fractional polynomial regression):練習題 (fp
或 fracpoly 指令 ) ................................................................... 173
1-6 邏輯斯迴歸搭配 ROC 曲線來做篩檢工具之分類準確性 ................. 176
1-6-1 Type I 誤差 α 及 Type II 誤差 β:ROC 圖切斷點的由來 ..... 177
1-6-2 ROC 曲線、敏感度/特異性:不同篩檢工具之分類準確性
比較 .......................................................................................... 181
1-7 Logit+ROC 曲線來評比敵對 logit 模型,哪個好?.......................... 189
1-7-1 ROC 曲線、cut-off 點 ............................................................. 190
1-7-2 Logit 模型搭配 ROC 曲線來找最佳 cut-off 點 (logit、estat
classification、lsens、lroc、graph 指令 )............................... 196
1-8 小數據:exact logistic regression( 是否染愛滋病毒之二種血清檢測值 )
(exlogistic 指令 ) ................................................................................... 213
1-9 偏態 (skewed) 邏輯斯迴歸:進口車 vs. 美國本土車的差異 (scobit 指令 )
............................................................................................................... 218

II 本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
Contents

Chapter
02 邏輯斯 (Logistic) 迴歸的診斷 (diagnostics)
227

2-1 邏輯斯迴歸的假定 (assumption) ......................................................... 229


2-1-1  邏輯斯迴歸的 IIA 假定 (assumption) .................................... 229
2-1-2  橫斷面 Hausman 檢定:OLS vs. 2SLS 誰優?(hausman 指令 )
.................................................................................................. 231
2-2  界定誤差 (specification error) ............................................................... 246
2-2-1  多元 ( 複 ) 線性迴歸診斷 (diagnostics) 之重點整理............. 246
2-2-2  線性迴歸的診斷 ...................................................................... 250
2-2-3  邏輯斯迴歸的界定適當嗎?優質辦校之因素 (logit、boxtid、
linktest 指令 ) ........................................................................... 255
2-3 Logit 迴歸的診斷:適配度 (logit、lfit、fitstat 指令 )....................... 270
2-3-1 Logit 迴歸診斷之 STaTa 指令................................................. 270
2-3-2 Logit 模型適配度有三方法?優質辦校之因素 (logit、lfit、
fitstat 指令 ) .............................................................................. 274
2-4 共線性 (collinearity) 診斷:優質辦校之因素 (logit、lfit、estat gof、
collin 指令 )........................................................................................... 283
2-5 偵測 influence 的觀察值:優質辦校之因素 (scatter、clist 指令 ) ... 296

本試閱檔為五南所有。如欲購買此書,請至五南網站 III
www.wunan.com.tw或來電(02)2705-5066
Chapter
03 離散選擇模型 (asmprobit、mlogit、
fmlogit、bayes: mlogit、mprobit、clogit、
asclogit、ologit、logit、xtologit、zip
等指令 ) 309

3-1 離散選擇模型 (discrete choice models, DCM) .................................... 310


3-1-1  離散選擇模型 (DCM) 概念 .................................................... 312
3-1-2  離散選擇模型 (DCM) 之數學式:以住宅選擇為例 ............ 318
3-2 多項機率迴歸分析 (multinomial probit regression):三種保險的選擇
(mprobit 指令 ) ...................................................................................... 333
3-3 多項概率模型來進行離散選擇建模 (discrete choice modeling using
multinomial probit model)(asmprobit 指令 ) ........................................ 338
3-3-1 Alternative-specific multinomial probit regression:三種保險計
畫的選擇 (asmprobit 指令 ) ..................................................... 338
3-3-2  使用多項概率模型進行離散選擇建模:四種旅行方式的選擇
(asmprobit 指令 ) ...................................................................... 344

Chapter
04 Logit 迴歸、Linear Probability、Probit、
Cox 迴歸之比較 349

4-1 Probit 迴歸模型之解說 ........................................................................ 352


4-2 Binary 依變數:linear probability, probit 及 logit 迴歸分析之比較 .. 359
4-3 Logit 模型、Cox 迴歸、probit 模型的概念比較 ............................... 373

IV 本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
Contents

4-4 異質機率模型:模擬資料 (Heteroskedastic probit model)(hetprobit


指令 ) ..................................................................................................... 380
4-5 Bivariate probit 迴歸 vs. 二個似乎無相關依變數「private, vote」模型,
誰優?(biprobit 指令 ) .......................................................................... 387

Chapter
05 多分類 (Multinomial) 依變數:多項邏輯斯
迴歸分析 (mlogit、asmprobit、mprobit、
bayes: mlogit 指令 ) 397

5-1 多項邏輯斯模型 (multinominal logit model, MNL)............................ 399


5-2 多項 (multinomial) logit 迴歸之多項選擇 .......................................... 404
5-3 Multinomial logit 迴歸之解說 (mlogit 指令 )...................................... 405
5-4 Multinomial logit 迴歸分析:職業選擇種類 (mlogit 指令 ).............. 410
5-5 多項邏輯斯迴歸分析:乳房攝影 (mammograph) 經驗的影響因素
(mlogit 指令 ) ........................................................................................ 419
5-6 邏輯斯迴歸之共變數係數調整法 (fractional multinomial logit model):
六種行政預算編列比例之因素 (fmlogit 外掛指令 ).......................... 431
5-7 多項邏輯斯迴歸分析:12 地區宗教信仰 3 選擇之因素 (mlogit 指令 )
............................................................................................................... 436

本試閱檔為五南所有。如欲購買此書,請至五南網站 V
www.wunan.com.tw或來電(02)2705-5066
Chapter
06 單層 vs. 多層次:Ordered logit 及其擴充
模型 (ologit、oprobit、rologit meoprobit、
asmprobit、asroprobit、heckoprobit 指令 )
443

6-1 Ordered logit 及 ordered probit 模型之概念 ........................................ 450


6-2 Ordered logit 及 ordered probit 迴歸分析:影響親子親密關係的因素
(reg、listcoef、prgen、ologit、logit) .................................................. 453
6-3 Ordered logit 迴歸分析:Copenhagen 的住房條件 (ologit、lrtest、
graph bar、oprobit 指令 ) ..................................................................... 473
6-4 Extended ordered probit regression 迴歸分析:內生共變數之二階段機
率迴歸 (eoprobit 指令 ) ........................................................................ 484
6-4-1  內生共變數:工具變數 (IV) 之重點整理 ............................. 485
6-4-2 Extended ordered probit regression 迴歸分析:健康狀況程度之
因素 (eoprobit 指令 ) ............................................................... 491
6-5 Multilevel mixed-effects ordered logistic regression:社會抵抗課程的
介入對健康概念程度的效果 (meologit 指令 ) ................................... 500
6-6 Multilevel mixed-effects ordered probit regression:社會抵抗課程的介
入對健康概念程度的效果 (meoprobit 指令 ) ..................................... 510
6-7 Panel-data random-effects ordered logistic models:社會抵抗課程的介
入對健康概念程度的效果 (xtologit 指令 ) ......................................... 519
6-8 等級—次序迴歸:四種方案偏好排名 (rank-ordered logistic
regression,rologit 指令 )..................................................................... 524

VI 本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
Contents

6-9 特定方案之等級—次序機率迴歸 (alternative-specific rank-ordered


probit regression):四種工作特性偏好之影響因素 (asroprobit 指令 )
............................................................................................................... 532
6-10 Zero-inflated Poisson 迴歸 vs. zero-inflated ordered probit
regression(zip、zioprobit 指令 )........................................................... 542
6-10-1  零膨脹 (zero-inflated)Poisson 分布 ...................................... 542
6-10-2 Count 依變數:零膨脹 Poisson 迴歸 vs. 負二項迴歸 (zip、
nbreg、prgen 指令 ) ............................................................... 545
6-10-3 Zero-inflated ordered probit regression 練習:釣魚 (zip 指令 )
................................................................................................ 568
6-10-4  零膨脹 ordered probit 迴歸分析 : 抽菸嚴重度之因素 (zioprobit
指令 ) ...................................................................................... 570

Chapter
07 配對資料的條件邏輯斯迴歸 (clogit、
asclogit、bayes: clogit 指令 ) 579

7-1 配對資料的條件邏輯斯迴歸:案例—控制研究 (clogit 指令 ) .... 585


7-2 配對的條件邏輯斯迴歸分析:McFadden’s choice 模型 (clogit 指令 )
............................................................................................................... 592
7-3 Alternative-specific conditional logit (McFadden’s choice):汽車銷售調
查法 (asclogit 指令 ) ............................................................................. 607
7-4 Alternative-specific conditional logit model:選擇四種釣魚模式 (asclogit
指令 ) ..................................................................................................... 611
7-5 Alternative-specific conditional logit (McFadden’s choice)model 練習題:

本試閱檔為五南所有。如欲購買此書,請至五南網站 VII
www.wunan.com.tw或來電(02)2705-5066
避孕三種選擇 (asclogit 指令 ) ............................................................. 629

Chapter
08 多層次邏輯斯迴歸 (xtmelogit、
asmixlogit、bayes: meologit 指令 ) 643

8-1 分層隨機抽樣 ....................................................................................... 645


8-2 多層次邏輯斯迴歸 (multilevel logistic regres-sion) (xtmelogit 指令 )
............................................................................................................... 649
8-2-1  雙層次混合 logistic 迴歸 (xtmelogit 指令 ) ........................... 649
8-2-2  三層次 logistic 迴歸 (xtmelogit 指令 ) ................................... 655
8-2-3  混合效果 logistic 迴歸 (xtmelogit 指令 ) ............................... 664
8-2-4 Alternative-specific mixed logit regression(asmixlogit 指令 ) 664
8-3 Multilevel mixed-effects ordered logistic regression:社會抵抗課程的
介入對健康概念程度的效果 (meologit 指令 ) ................................... 664
8-4 雙層巢狀模型:巢狀結構的餐廳選擇 (nested model,nestreg 指令 )
............................................................................................................... 675

Chapter
09 Panel-data 邏輯斯迴歸
(xtgee、xtlogit 指令 ) 691

9-1 Panel-data 迴歸 (xtgee、xtlogit 指令 ) ................................................ 693


9-2 追蹤資料 (panel-data) 分析之 STaTa 相關指令.................................. 698

VIII 本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
Contents

9-3 追蹤資料 (panel-data) 之基本模型 ...................................................... 706


9-3-1 panel 資料型態及其模型分類 ................................................. 706
9-3-2  追蹤資料 (panel-data) 四模型:線性 vs. 非線性模型 .......... 713
9-3-3  追蹤資料 (panel-data) 模型認定 (identify) 與假設 ............... 717
9-4 Panel-data logit 迴歸分析 (xtgee、xtlogit 指令 ) ................................ 730
9-5 Panel-data random-effects ordered logistic models (xtologit 指令 )
............................................................................................................... 740
9-6 Random-effects ordered probit models:社會抵抗課程的介入對健康概
念程度的效果 (xtoprobit 指令 ) ........................................................... 745
9-7 互補 log-log 迴歸 (Random-effects and population-averaged cloglog
models):加入工會嗎 (xtcloglog 指令 ) ............................................. 751
9-7-1  對數邏輯分布 (log-logistic):偏態分布 ................................ 751
9-7-2 Random-effects complementary log-log model:加入工會嗎
(xtcloglog 指令 )....................................................................... 758

參考文獻 769

本試閱檔為五南所有。如欲購買此書,請至五南網站 IX
www.wunan.com.tw或來電(02)2705-5066
t e r
p

01
a
Ch

二元 (Binary) 依變數:
邏輯斯迴歸 ( 舊版 logit、新
版 logistic 指令 )

本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型:應用 STaTa 統計

在 google scholar 學術搜尋中,查詢「logistic regression analysis」會出現


1,930,000 篇以上論文。可見邏輯斯迴歸分析係非常熱門的統計法。
迴歸分析之目的是要建立一統計模型,透過此模型由所控制的自變數來預
測依變數之期望值或可能值。本書主要介紹分析二分類依變數時,最常使用的
統計分析模型中的 logistic 迴歸模型,及其 擴充模型 的離散選擇模型,包括:
「邏輯斯迴歸搭配 ROC 曲線、多項邏輯斯迴歸、Alternative-specific multinomial
probit regression、Alternative-specific multinomial 邏輯斯迴歸、邏輯斯迴歸搭
配 ROC 曲線做工具之分類準確性、Exact 邏輯斯迴歸、異質機率模型、Ordered
logit 迴歸分析、多層次 ordered logistic 迴歸、Rank-ordered logistic 迴歸、特定
方案 Rank-ordered logistic 迴歸、零膨脹 ordered probit regression 迴歸、配對資
料的條件邏輯斯迴歸、特定方案 conditional logit model、離散選擇模型、分式
多項式 (Fractional polynomial) 迴歸、多層次邏輯斯迴歸、巢狀邏輯斯迴歸、
panel-data 邏輯斯迴歸… 」。透過例題分析,結合計算機統計軟體的使用,詳細
闡述該模型原理及其應用;同時,還介紹了如何將 logistic 迴歸模型擴展到次序
logistic 迴歸模型和多項 logit 模型,以分析次序變數和多分類名義變數為依變數
的數據。
本書第一章介紹如何將 SAS、R 和 SPSS 檔案格式轉成 STaTa 可分析檔案,
坊間常見的 41 種「統計軟體或大型資料庫」之檔案格式,都可轉至 STaTa 來分
析。
當你要使用本書 CD 所附資料檔的方法,你可以先將資料 copy 到硬碟之
任一資料夾中。在 STaTa 畫面再設定工作目錄,為剛才複製的資料夾路徑,
即「File > Chang working directory」。例如,作者自定「"D:\08 mixed logit
regression」為工作目錄。接著再選「File > Open」,開啟任一「*.dta」資料檔,
即可進行資料分析。

一、二元依變數、次序、multinomial 依變數的概念比較
傳統,最小平方法 (OLS) 估計法之線性迴歸,它不適合處理的變數,包括:
1. 是否染愛滋病毒?
2. 是否得癌症?
3. 家庭子女數?
4. 是否尋求民俗醫療?
5. 什麼人會有宗教信仰?

2
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
二元 (Binary) 依變數:邏輯斯迴歸
Chapter
01
6. 學校學生打架事件發生次數。
他們有的是二元依變數,回答 yes/no 兩種可能,有的則是從 0 到某個有
限整數的次數。有的則是有次序的質性變數,統稱為受限的依變數 (limited
dependent variable)。

在社會科學中,我們想解釋的現象也許是:
1. 二元/二分:勝/敗、( 投/不投 ) 票、票投 1 號/票投 2 號。
當我們的依變數是二分類,我們通常以 1 表示我們感興趣的結果 ( 成
功 ),以 0 表示另外一個結果 ( 失敗 )。此二元分布稱為二項分布 (binomial
distribution)。此種 logit 迴歸之數學式為:

2. 次序 多分 ( 等第 ):例如,滿意度,從非常不滿∼非常滿意。此四分類的滿
意度為:
P(Y ≤ 1) = P(Y = 1)
P(Y ≤ 2) = P(Y = 1) + P(Y = 2)
P(Y ≤ 3) = P(Y = 1) + P(Y = 2) + P(Y = 3)

非常不滿意 不太滿意 有點滿意 非常滿意


P (Y = 1) P (Y = 2) P (Y = 3) P (Y = 4)
      截距一    截距二      截距三
P (Y ≤ 1) P (Y > 1)
P (Y ≤ 2) P (Y > 2)
P (Y ≤ 3) P (Y > 3)

logit

logit

本試閱檔為五南所有。如欲購買此書,請至五南網站 3
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型:應用 STaTa 統計

logit

logit [P(Y ≤ j)] = α - βX, j = 1, 2, …, c - 1


當 c 有 4 組,自變數解釋:
Y ≤ 1、Y ≤ 2、Y ≤ 3 時,他們對 logit 的影響,會產生 c - 1 個截距,故此模
型又稱為比例勝算 (proportional odds) 模型。
3. 多元勝算對數 (multinomial odds logit) 模型:三個候選人、政黨認同。
基本模型:

例如,三類別宗教傾向 (level = 3 類當比較基準點 ):道教、佛教、無。

二、邏輯模型的概念
邏輯模型 (logit model) 是離散選擇法模型之一,屬於多項(multinomial)變
數分析之一(離散選擇模型之一),也是社會學、生物統計學、臨床、數量心
理學、計量經濟學、市場行銷等統計實證分析的常用方法。
在統計學中,邏輯斯迴歸或次序迴歸或 multinomial 模型都是一個迴歸模
型,其中依變數 (DV) 是分類的。它們涵蓋二元 (binary) 依變數的情況,即輸出
只能取兩個值 “0” 和 “1”,這些值代表:通過/失敗、贏/輸、活/死或健康/
生病。依變數具有兩個以上「結果/類別/方案」時,多項 logistic 迴歸即可分
析它,或者如果多個類別有排名 (ranking),則用次序邏輯斯迴歸來分析。在經
濟學術語中,邏輯斯迴歸是質性反應/離散選擇模型之一例子。
邏輯斯迴歸由統計學家 David Cox 於 1958 年開發。Binary 邏輯斯模型用於
一個或多個預測 ( 自 ) 變數 ( 特徵 ) 來估計二元反應的概率 ( 勝算比 )。它允許人
們說,風險因素的存在將使結果勝出概率提高了多少百分比。

4
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
二元 (Binary) 依變數:邏輯斯迴歸
Chapter
01

發生事件 ( 死亡、病發、
倒閉、犯罪被捕…)

未發生事件 ( 未死亡、病
發、倒閉、犯罪被捕…)

圖 1-1 multiple logistic 函數之示意圖

本試閱檔為五南所有。如欲購買此書,請至五南網站 5
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型:應用 STaTa 統計

三、邏輯斯迴歸分析的 STaTa 報表解說

6
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
二元 (Binary) 依變數:邏輯斯迴歸
Chapter
01
四、離散選擇模型
離散選擇模型 (discrete choice model, DCM),其主要理論模型 DCM 模
型很多,包括:二項 logit(binary logit)、多項 logit(multi-nominal logit)、巢狀
logit(nested logit)、有序 logit/probit(ordered logit /probit)、多層次混合 logit(mixed
logit)、配對資料的條件邏輯斯迴歸、panel-data 邏輯斯迴歸、…等。常見的適配
DCM 軟體亦很多,包括 STaTa、SAS、NLOGIT、Python、R、Matlab…等,本
書將以 STaTa 為主來介紹相應 DCM 的模型適配方法,希望透過這個分析過程,
把 DCM 相關的理論知識和軟體應用方法做一個系統性的整理。

1-1 STaTa 如何讀入各種資料格式之資料


各統計軟體:類別依變數之迴歸指令如圖 1-2 所示。

圖 1-2 各統計軟體:類別依變數之迴歸指令

本試閱檔為五南所有。如欲購買此書,請至五南網站 7
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型:應用 STaTa 統計

定義:離散型 ( 類別 ) 資料
係指在測量的過程中以名義尺度或次序尺度所蒐集到的資料,如性別、高
vs. 低血糖類型。或者以等距 ( 工作滿足、考試成績 )、比率尺度 ( 有絕對原
點,如工作所得、年齡、高 vs. 低血糖類型 ) 所測量到的連續變數資料,經化
簡為類別變數時 ( 如父母社會經濟地位 (SES) 分為高、中、低三組 ) 的資料。

1-1-1 資料輸入的方法:問卷、Excel 檔的讀入

接下來,根據資料類型或指令的不同,資料輸入的方法可分成以下 4 種:

一、輸入 EXCEL 資料:「Copy and paste」亦可


將 EXCEL 的資料輸入 STaTa 的方式還可細分成以下兩種:
1. 將 EXCEL 的資料輸入 STaTa 之前,必須先將資料存成 csv 檔,再利用指令
insheet 來讀資料。

8
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
Chapter
二元 (Binary) 依變數:邏輯斯迴歸 01
範例:

圖 1-3 「File → import」Excel、SAS、ODBC data-base、dBase

本試閱檔為五南所有。如欲購買此書,請至五南網站 9
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型:應用 STaTa 統計

(1) 當 csv 檔的第一列無變數名稱時:請見「sample1-1.csv」

* 人工方式,事先用「檔案總管」,在 D 磁碟機新建「sample」資料夾
. cd d:\sample
. dir
. memory
. set memory 10m
* 這是讀取 Excel *.csv 檔最快速的方法。
. insheet using sample1-1.csv

圖 1-4 sample1-1.csv 之 Excel 資料檔

10
本試閱檔為五南所有。如欲購買此書,請至五南網站
www.wunan.com.tw或來電(02)2705-5066
邏輯斯迴歸及離散選擇模型 : 應用STaTa統計
/張紹勳著. --初版.--臺北市:五南,
2018.04
 面; 公分
ISBN 978-957-11-9652-7(平裝附光碟片)

1.統計套裝軟體 2.統計分析

512.4 107004083

1H0Q

邏輯斯迴歸及離散選擇模型:
應用STaTa統計
作  者 ─ 張紹勳

發 行 人 ─ 楊榮川

總 經 理 ─ 楊士清

主  編 ─ 侯家嵐

責任編輯 ─ 黃梓雯

文字校對 ─ 鐘秀雲

封面設計 ─ 盧盈良

出 版 者 ─ 五南圖書出版股份有限公司

地  址:106台 北 市 大 安 區 和 平 東 路 二 段 3 3 9 號 4 樓

電  話:(02)2705-5066  傳  真:(02)2706-6100

網  址:http://www.wunan.com.tw

電子郵件:wunan@wunan.com.tw

劃撥帳號:0 1 0 6 8 9 5 3

戶  名:五南圖書出版股份有限公司

法律顧問 林勝安律師事務所 林勝安律師

出版日期 2 0 1 8 年 4 月 初 版 一 刷

定  價 新 臺 幣 9 0 0 元

本試閱檔為五南所有。如欲購買此書,請至五南網站
※版權所有.欲利用本書內容,必須徵求本公司同意※

www.wunan.com.tw或來電(02)2705-5066

You might also like