Professional Documents
Culture Documents
tw
或來電(02)2705-5066
生物統計入門
郭寶錚、陳玉敏 ◎著
印行
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
序
2000 年作者所著《生物統計學》由五南圖書出版公司正
式發行,多年來承蒙老師、學生以及先進們的支持,再刷多
次。但在教學過程中以及讀者的反應下,發現《生物統計學》
一書的內容份量應較適合 3 個學分或 3 個學分以上的課程使
用。
近年來在課程整合、學分縮減的現實環境下,生物統計學
的上課時數常濃縮到只剩下每週 2 個小時,因此深刻的體認到
應該提供一本適合每週上課時數僅 2 小時的生物統計入門教材
供學生使用。
感謝五南圖書出版公司的大力支持及王俐文副總編輯和
李驊梅資深責編的協助下,才有這本《生物統計入門》的誕
生。全書內容雖建立在《生物統計學》的架構上,但內容的
編排及文字的表達則更求簡潔;內容雖已經濃縮,仍希望能滿
足生物統計學的初學者,或想要在短時間內建立生物統計學基
本概念者的需求。書中仍提供 Excel 的練習,以達到實用的功
能。
初次嘗試這樣的努力,單純只是希望能提供一本更精簡的
入門書供老師教學及學生學習使用。雖然用心地想藉本書提供
這樣的平台,但相信本書仍有諸多不周延及謬誤之處,尚祈各
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2
方先進不吝賜教,期使本書更能發揮預期的效果。
郭寶錚 謹識
中華民國九十六年八月二十日
中興大學農藝學系生物統計研究室
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
目 錄
序
第一章 緒 論 ………………………………………… 01
壹、生物統計學的定義 03
貳、為什麼要學生物統計學 03
參、統計資料 04
肆、變數及觀測值 04
伍、量測尺度 05
陸、抽樣基本概念 06
柒、連加符號(Summation notation) 08
捌、Excel 的應用 10
習 題 14
壹、次數分布表 19
貳、常用的統計圖 23
參、集中趨勢的測度 26
肆、分散性的測度 27
伍、Excel 的應用 31
習 題 43
壹、事件 47
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2
貳、事件的運算 48
參、機率的定義 49
肆、機率的加法規則 50
伍、條件機率 51
陸、機率乘法規則 52
柒、獨立事件 52
習 題 53
壹、隨機變數 57
貳、分立機率分布 58
參、常見的分立機率分布 60
肆、連續機率分布 63
伍、Excel 的應用 71
習 題 76
第五章 估 計 ………………………………………… 79
壹、樣本平均數的抽樣分布 81
貳、中央極限定理 81
參、點估計 83
肆、單一母群體平均數的信賴區間 84
伍、單一母群體比例的信賴區間 88
陸、單一母群體變異數的信賴區間 89
柒、Excel 的應用 92
習 題 96
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
目錄 3
壹、假設檢定的步驟 101
貳、單一母群體平均數的假設檢定 105
參、單一母群體比例的假設檢定 108
肆、母群體變異數的假設檢定 110
伍、錯誤的種類 112
陸、檢力 113
柒、Excel 的應用 114
習 題 118
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
4
習題解答…………………………………………………… 209
附 表……………………………………………………… 221
參考書目…………………………………………………… 245
索 引……………………………………………………… 247
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 81
統計推論(statistical inference)就是從母群體中隨機抽出一個樣
本,並藉由樣本資料所計算而得的統計量對母群體中的參數進行推論
的過程,而統計推論包含估計(estimation)及假設檢定(tests of hypo-
theses)。單就一個所抽出的隨機樣本就能對母群體做出推論的理論基
礎,就在抽樣分布及其相關性質,以下將先介紹抽樣分布及其性質,
然後探討估計的相關內容。
壹、樣本平均數的抽樣分布
所謂抽樣分布(sampling distribution)指的是一個統計量的機率分
布,例如樣本平均數 的機率分布,就稱之為樣本平均數的抽樣分
布。我們習慣於把某統計量的抽樣分布的標準差,稱之為該統計量的
標準誤(standard error, SE),例如樣本平均數抽樣分布的標準差就稱
為該樣本平均數的標準誤(standard error of the sample mean)。
貳、中央極限定理
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
82
群體的標準差,除上 ,寫成 = 。
當 n 足夠大時,則樣本平均數的抽樣分布會趨近常態分布。
以上的結果,稱為中央極限定理(central limit theorem),整理
成:當 n 夠大時, 的抽樣分布會趨近常態分布,並且平均數為 ,標
準差為 ,所以我們可寫成:
Z= ~N(0, 1)
一般而言,不論母群體的分布型態為何,當 n 30 時,樣本平均
數的抽樣分布均會趨近常態。
【例 1】 若某社區民眾血液中肌酐酸值所構成的母群體,其血液中肌
酐酸值的分布近似常態,並且其平均數為 1.0 mg/dL,標準差
則為 0.5 mg/dL,若從此母群體中隨機抽出一個有 25 位民眾
的樣本,試求:
此樣本的平均肌酐酸值大於 1.2 mg/dL 的機率?
隨機抽出一個樣本,其肌酐酸平均值落在 1.3 mg/dL 到 1.35
mg/dL 間的機率?
假設有 5 %的肌酐酸平均值會小於或等於某值,試求此值?
【解答】 由於此母群體近似常態,利用中央極限定理可得, 的抽
樣分布會趨近常態,且其平均數為 1.0 mg/dL,標準誤則為
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 83
0.5/ 25 = 0.1,可寫成
Z=
假如 = 1.2,那麼
1.2 1.0
z= =2
0.1
查附表二可知,在 z = 2 左邊的機率是 0.9772,因此,大於
2 的機率為 0.0228 ( = 1 0.9772),也就是說此樣本平均數
會大於 1.2 mg/dL 的機率是 0.0228。
我們希望求得以下機率:
P(1.3 1.35)
=P
= P(3 Z 3.5)
= 0.9998 0.9987
= 0.0011
由前章得知,在 z = 1.645 左邊的機率為 0.05,因此
1.645 =
得 = 0.8355。也就是大約有 5 %的肌酐酸平均值會小於或
等於 0.8355 mg/dL。
參、點估計
估計(estimation)可分為點估計(point estimation)及區間估計
(interval estimation)兩種,如從母群體中隨機抽出一個樣本,可以此
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
84
肆、單一母群體平均數的信賴區間
2
一、母群體變異數 已知
2
根據中央極限定理得知,若母群體的平均數及變異數分別是 及
95%
2.5% 2.5%
1.96 0 1.96
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 85
進一步寫成
P ( 1.96 )
1.96 = 0.95
|
經整理後,最後可寫成 P ( 1.96 + 1.96 = 0.95
|
)
|
( 1
2
, + 1
2
這裡的 Z1 2
代表標準常態分布的第 100 1 ( 2 ) 百分位數,這裡
1 稱為信賴係數(confidence coefficient)或信心水準(confidence lev-
el)。
而所謂 100(1 ) %信賴區間,代表我們有 100(1 ) %的信心
(confidence)相信,所建立的區間會包含 。
【例 2】 某校所有學生健康檢查資料,有關血液中尿酸值所構成的母
群體,其尿酸值的分布近似常態,並且其標準差為 1 mg/dL,
如想以區間估計母群體尿酸值的平均數,今隨機抽出一個 16
位學生的樣本,尿酸值的平均數為 5.5 mg/dL,試建立 的
95 %信賴區間?
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
86
1
【解答】因為 = = = 0.25, = 5.5,根據此樣本, 的 95 %信賴
|
4
區間為(5.5 1.96 × 0.25, 5.5 + 1.96 × 0.25)或(5.01, 5.99),所以
我們有 95 %的信心相信,(5.01, 5.99)這區間會包含母群體血
液中尿酸值的平均數。
2
二、母群體變異數 未知
2
當建立母群體平均數 的信賴區間時,如 未知時,可以 S2 來估
2
計 ,這時, 將不再是標準常態分布的隨機變數,而是一個自
的樣本時,則隨機變數 t = 的機率分布是一個自由度為 n 1的
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 87
0.45
0.4
N(0, 1)
0.35
0.3 t5
0.25
t1
f(x) 0.2
0.15
0.1
0.05
0.0
5 3 1 1 3 5
x
t 分布也和標準常態分布一樣,分布曲線下的面積已製成表,當
要使用附表三中的 t 分布表時,我們必須要考慮自由度。
因此當母群體的分布為常態或近似常態,但變異數未知,並且無
法得到足夠大的 n 時,如要建立 的信賴區間,必須利用 t 分布,藉
著整理:
P ( )=1
可得到 的 100(1 ) %信賴區間為:
( )
|
, +
【例 3】 假設例 2 中母群體血液中尿酸值的標準差未知,仍想以區間
估計母群體血液中尿酸值的平均數,今隨機抽出一個 36 位學
生的樣本,尿酸值的平均數仍為 5.5 mg/dL,標準差為 1.2 mg/
dL,試建立 的 95 %信賴區間?
1.2 1.2
(5.5 2.030
36
, 5.5 + 2.030
)
36
,得(5.094, 5.906)。
伍、單一母群體比例的信賴區間
除了前面所建立的母群體平均數的信賴區間外,也可建立其他參
數的信賴區間,只要知道用來估計此參數的點估式為何?及其抽樣分
布性質。以下將介紹,如何建立單一母群體比例 p 的信賴區間?當 np
及 n(1 p)都大於或等於 5 時,樣本比例 的抽樣分布會趨近常態,其
標準誤 = ,但因 p 未知,我們必須以樣本比例 來估計 p,
( )
這裡的 Z 代表標準常態分布的第 100 ( ) 百分位數。
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 89
【例 4】 為了了解台灣地區國民小學學童過敏性鼻炎的比例,一項研
究共抽樣 2,500 人,檢查發現有 725 人有過敏性鼻炎,試求
台灣地區國民小學學童有過敏性鼻炎比例的 95 %信賴區間?
725
【解答】檢查 2,500 人,其中有 725 人有過敏性鼻炎,所以 =
2,500
= 0.29 為台灣地區國民小學學童過敏性鼻炎比例的點估值
(point estimate),而 n = 2,500(0.29) = 725 及 n(1 ) = 2,500
(0.71) = 1,775 均大於 5,所以可利用 的抽樣分布趨近常態,
來建立 p 的 95 %信賴區間如下:
0.29 1 0.29
0.29 1.96 = 0.272
2,500
0.29 1 0.29
0.29 + 1.96 = 0.308
2,500
也就是說,我們有 95 %的信心相信區間(0.272, 0.308)會包
含台灣地區國民小學學童有過敏性鼻炎的實際比例。
陸、單一母群體變異數的信賴區間
資料變異性的大小可藉變異數來加以描述,由於樣本變異數 S2 為
2 2
母群體變異數 的點估式,欲建立母群體變異數 的信賴區間須先知
道其點估式 S2 的抽樣分布性質。當母群體為常態分布且變異數為 2
時,對於任一樣本大小為 n 的隨機樣本,樣本變異數為 S2 = ,
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
90
2
作 。
卡方分布不同於常態或 t 分布等對稱分布,卡方分布是一個非對
稱性分布(asymmetric distribution),並且卡方分布的形狀隨著自由度
不同而改變,如圖 5.2 為自由度分別為 1,2,5,10 時的卡方分布。
附表四則為在不同自由度下卡方分布的百分位數。
由於 2 = 為自由度 n 1 的卡方分布,所以可寫成:
(
P )=1
整理後得 P
( 2
) =1
2
因此 的 100(1 ) %信賴區間為:
( ,
)
2 2
這裡的 及 分別是自由度 1的卡方分布中的第 100
( )
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 91
1
0.9
0.8
df = 1
0.7
0.6
f(x) 0.5
0.4 df = 2
0.3
df = 5
0.2 df = 10
0.1
0
0 5 10 15 20 25
圖 5.2 不同自由度下的卡方分布
【例 5】 假設某校全體同學身高的分布為常態分布,隨機抽出 25 位同
學,測得其身高的變異數為 125,試建立某校全體同學身高
2
變異數 及標準差 的 95 %信賴區間?
25 1 × 125
= = 241.92
12.401
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
92
下限及上限則為:
( 76.212, 241.92)或(8.73, 15.55)
柒、Excel 的應用
一、單一母群體平均數的信賴區間(當母群體變異數已知)
賴區間可寫成 ( )。利用以下函數:
函數 CONFIDENCE(alpha, standard_dev, size),其中 alpha 為顯著水
準,standard_dev 為已知的母群體標準差,size 為樣本大小,所傳回的
值為 。
在 A1 輸入「信賴下限」,在 B1 輸入「信賴上限」。
在 A2 輸入公式「 = 5.5 CONFIDENCE(0.05, 1, 16)」。
在 B2 輸入公式「 = 5.5 + CONFIDENCE(0.05, 1,16)」。
或 利 用【插 入】→【函 數】→【統 計】→【CONFIDENCE】,計 算
A B
1 信賴下限 信賴上限
2 5.010009 5.989991
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 93
二、單一母群體平均數的信賴區間(當母群體變異數未知)
以某大學大一學生體脂率為例,當母群體的變異數未知,以樣本變
2
異數 來估計母群體變異數時,說明如何利用 t 分布來建立母群體平均
數的 95 %信賴區間,其信賴區間可寫成 ( )。
選取 F1:F58 體脂率資料。
選取【工具】→【資料分析】→【敘述統計】→【確定】。
1 體脂率
2 25
3 24
4 12
5 10
54 13
55 24
56 24
57 11
58 31
選取適當選項後,按【確定】可得下列資料:
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
94
K L
1 體脂率
2
3 平均數 23.50877193
4 標準誤 0.914969769
5 中間值 24
6 眾數 24
7 標準差 6.907870271
8 變異數 47.71867168
9 峰度 0.489463939
10 偏態 0.022973352
11 範圍 29
12 最小值 10
13 最大值 39
14 總和 1340
15 個數 57
16 信賴度(95.0%) 1.832904685
在 M1 輸入「信賴下限」,在 N1 輸入「信賴上限」。
在 M2 輸入公式「 = L3 L16」;在 N2 輸入公式「 = L3 + L16」。
由於勾選【平均數信賴度】95 %(預設值),在 L16 所得到的數
值為 t56,0.975 乘上 ( = 0.91496769)。
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 95
M N
1 信賴下限 信賴上限
2 21.67586725 25.34167661
3 21.67586725 25.34167661
三、單一母群體變異數的信賴區間
以某大學大一學生體脂率為例,說明如何建立母群體變異數的
95%信賴區間,其信賴區間可寫成
( )
:
在 P1 輸入「信賴下限」;在 Q1 輸入「信賴上限」。
2
備 註: 56,0.975
= 78.56776499(可 由【插 入】→【函 數】→【統
計】→【CHIINV】求得)。
2
56,0.025
= 37.2115938(同上)。
Excel 中函數 CHIINV(probability, deg_freedom),其中 probability
( = p)是右單尾機率值,deg_freedom 是自由度,傳回的值為
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
96
2
。
2
CHIINV(0.975, 56) = 56,0.025
= 37.2115938。
2
CHIINV(0.025, 56) = 56,0.975
= 78.56776499。
得到:
P Q
1 信賴下限 信賴上限
2 34.01224436 71.81217845
習 題
測值所構成的樣本,試問樣本平均數 的抽樣分布為何?此抽樣
分布的平均數及標準差又為何?
若從平均數為 70,標準差為 18 的母群體中隨機抽出 36 個觀測值
|
所構成的樣本,試問樣本平均數 的抽樣分布為何?抽樣分布的
平均數及標準差又為何?
承上題,求以下機率:
樣本平均數大於 76
樣本平均數在 64 至 76 間
某縣所有 40~50 歲男性三酸甘油脂值分布近似常態,且標準差為
18 mg/dL,今隨機抽出 36 位 40~50 歲男性縣民所構成的樣本,
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
第五章 估 計 97
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
國家圖書館出版品預行編目資料
生物統計入門=Introduction to Biostatistics /
郭寶錚、陳玉敏著.--二版.--臺北市:五南, 2009.10
面; 公分.
參考書目:面
含索引
ISBN 978-957-11-5645-3(平裝)
1.生物統計學
360.13 98007853
5J26
生物統計入門
作 者 / 郭寶錚(241.2)、陳玉敏(255.5)
發 行 人 / 楊榮川
總 編 輯 / 龐君豪
主 編 / 王俐文
責任編輯 / 許杏釧
封面設計 / 黃健民
出 版 者 / 五南圖書出版股份有限公司
地 址 / 106 臺北市大安區和平東路二段 339 號 4 樓
電 話 / (02)2705-5066 傳 真 / (02)2706-6100
網 址 / http://www.wunan.com.tw
電子郵件 / wunan@wunan.com.tw
劃撥帳號 / 0 1 0 6 8 9 5 3
戶 名 / 五南圖書出版股份有限公司
臺中市駐區辦公室 / 臺中市中區中山路 6 號
電 話 / (04)2223-0891 傳 真 / (04)2223-3549
高雄市駐區辦公室 / 高雄市新興區中山一路 290 號
電 話 / (07)2358-702 傳 真 / (07)2350-236
定 價 / 新臺幣 320 元
※版權所有.欲利用本書內容,必須徵求本公司同意※
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066