You are on page 1of 81

第二章 误差和分析数据处理

 • 2.1 测量值的准 确度和精密 度

 • 2.2 有效数字及其运 算法则

 • 2.3 有限量测量 数据的统计 处理


2.1 测量值的准确度和精密度

 2.1. 1 准确度与精 密度
 2.1. 2 系统误差和 偶然误差
 2.1. 3 误差的传递
 2.1. 4 提高分析结 果准确度的 方法
2.1.1.1 准确度和误 差
accuracy and error

准确 度:表 示分 析结果 与真 值的接 近程 度。

测量 值越接 近真 实值, 准确 度越高 ,反 之


准确度 越低。

准确 度的高 低用 误差 ( error )来表示 。


表示方 法 :

绝对 误差( absolute error ) : 测量值与真值之差


( δ )。
公式:
δ = x −µ
-测 量值 , -真实 值

相对误 差( relative error ): 绝对 误差与 真值 的


比值。
δ
公式 : × 100%
µ

在分 析工 作中, 常用 相对误 差来 衡量分 析结


果。
真值:某一 量客观 存在 的真实 数值 。
• 约定真 值:由国际计量大会定义的单位(国际单
位)以及我国的法定计量单位是约定真值。

• 相对真 值:在分析工作中,常把标准参考物质的
证书上所给出的含量作为相对真值。
标准参 考物质 ( 或标准 样品 或标样 ) :由公 认的
权威机 构发售 的带 有证书 的物 质。

具备条 件:
1. 经公认的 权威 机构鉴 定, 并给 予证书 ;
2. 具有良 好的特 性, 如均匀 性和稳 定性 ;
3. 具有充 当测量 标准 的准确 度水平 ,它 的准确 度至
少要 高于 实际测 量的 3 倍;
4. 能制备 出一定 数量 在全国 范围内 满足 方法验 证、
仪器 校准 、质量 控制 等方面 的需 要。
2.1.1.2 精密度和偏 差
precision and deviation

精密度 ( precision ):平行 测量的 各测 量值


(实验 值) 之间相 互接 近的程 度。

• 各测量 值之间 越接 近,精 密度 就越高 ;反 之


,精密 度越低 。

• 精密度 有时又 称重 复性或 再现 性。

• 精密度 用偏差 来表 示。
偏差 ( deviation , d ):测量值 与平均 值
之差 。
公式 : d = xi −x
•平均偏 差:各单个 偏差 绝对值 的平 均值。
n

公式: ∑x −x i

d =i=
1
n

相对 平均 偏差 :平均 偏差在 测量 值的平 均值中 所占 的百


分数 。

公式: d
× 100%
x
说明:

使用平 均偏差和相 对平均偏


差表示 测定的精密 度比较简 单

不足之处: 不能反映大 偏差的影响

衡量 测量值 分散 程度用 得最 多的是 标准 偏差。


• 标准偏差 (standard deviation , S ):有
限次测量 (n <20) 的各测量值对平 均值的
偏离。  
n

公式 : S =
∑( xi
i=
1
−x ) 2

n−1
n
n
1 
∑x i
2
−∑

n
xi 2


S =
i=
1 i =
1 
n−1

其中 ( n-1 )为自 由度( f ),表 示一 组


数据独 立偏差 的数 目。
例如: 对某一试样做甲、乙两组平行测定,结果如下

平均偏
组别 测量数 据 平均值 标准偏 差 S

10.3 , 9.8 , 9.6 , 10.2 ,


甲 10.1 , 10.4 , 10.0 , 10.0 0.24 0.28
9.7 , 10.2 9.7

10.0 , 10.1 , 9.3 ,


乙 10.2 , 9.9 , 9.8 , 10.0 0.24 0.33
10.5 , 9.8 , 10.3 , 9.9
• 相对标 准偏差 ( relative standard deviation ,
RSD ) :标 准偏差 在平 均值中 占的 百分数

S
RSD = × 100%
• 公式 : x
2. 1.1.3 准确度和精密度 的关系
2.1.1.3 准确度 和精密度 的
关系

• 1. 精密 度是保证准 确度的先决 条件

• 2. 只有 在消除了系 统误差的情 况下,


才可 用精密度表 达准确度
2.1.2.1 系统误 差
systematic error
系统误 差: 由可定原因产生

1. 特点:
•单向
•重复
•可测
•影响分析的准确度
( 1 )按来源分
方法误 差 :由于分析方法选择不当造成的误差。
仪器或试剂误差 : 仪器不精确和试剂中含被

组分或不纯组分产生
操作误 差: 操作方法不当引起

在一个测 定过 程中, 这三 种误差 都可 能存


在。
2.1.1.2 偶然误 差
accidental error

偶然误 差:由某些不确定的、难以控制的原因造成的
误差

特点:
( 1 ) 双向 性(大小、正负不定)
( 2 ) 分布服从统计学规律(正态分布)
( 3 ) 不可消除(原因不定)但可减小(测
定次数↑)
二者 的关系 :
( 1 )系统 误差和偶然 误差的划分不是绝对的。
对于一次测定而言,系统误差和偶然误差可
能同时存在。

( 2 )系统 误差一般对分析结果的影响较大,影
响测定的准确度,应尽量给予消除;偶然 误差一
般对分析结果影响较小,影响测定的精密度。
2.1.3  误差 的传递
2.1.3.1
   系统误 差的传递
  propagation of error  

系统 误差的 传递 规律:

( 1 )和、差的 绝对 误差等于各测量值绝对误差
的和、差。

( 2 )积、商 的相对 误差 等于各测量值相对误差


的和、差。
 解释:
( 1 )若分析结果 R 是测量值 X 、 Y 、 Z 三个测
量值相加减的结果,例如 : R=X+Y -Z

δR = δX + δY − δZ
( 2 )若分析结果 R 是测量值 X 、 Y 、 Z 三个测
量值相乘除的结果,例如 : R=XY/ Z
则:
δR δX δY δZ
= + −
R X Y Z
• P11 例 3
偶然误差的 传递
1. 极值误 差法:
考虑在最不利的情况下,各步骤带来的误差的相
互累加,这种误差称为极值误 差。
最大偶然 误差。
运算 规律:
( 1 )和、差的极值误差等于各测量值极值误差的
绝对值之和。
( 2 )积、商的相对极值误差等于各测量值相对极
值误差绝对值之和。
例:滴定管的初读数为( 0.05±0.01 ) mL ,末
读数为( 22.10±0.01 ) mL ,问滴定剂的体积
可能在多大范围内波动?
解:(用极值误差法做出判断)。
滴定管读数的极值误差为:
ΔV=|±0.01 mL| + |±0.01 mL |=0.02 mL
故滴定剂体积为:
( 22.10-0.05 ) mL± 0.02 mL
= ( 22.05±0.02 ) mL
2. 标准 偏差法 :
( 1 )和 、差的 结果 的标准偏差的平方是各测
量值标准偏差的平方之和。

( 2 )积 、商的 结果 的相对标准偏差的平方是
各测量值相对标准偏差的平方之和。
练习

例:设天平称量时的标准偏差 s = 0.10mg ,求称量试



时的标准偏差 sm 。

解 m = m1 − m 2 , ⇒ s m = s12 + s 22 = 2s 2 = 0.14mg

2.1 .4 提高 分析准 确度 的方法
(如 何减免 分析 过程中 的误 差)

选择恰 当的分 析方 法

减小测 量误差

减小偶 然误差 的影 响

消除测 量中的 系统 误差
2.1 .4.1 选择恰当的分析 方法

• 根据分析对象、 试样情况和 对分析结果


的要求选择分析 方法
• 例:测 Fe 含量
K2Cr2O7 法 40.20% ±0.2%×40.20%

比色法 40.20%
±2.0%×40.20%
2.1.4 .2 减小测量误 差

1 )称量
例: 天平一次的称量误差为 0.0001g ,两次的
称量误差为 0.0002g , RE%≤ 0.1% ,计算最少称
样量?
0.0002
RE % = × 100% ≤ 0.1%
w

⇒ w ≥ 0.2000 g
2.1 .4.3 减小偶然误差的 影响

增加平 行测定 次数 ,取平 均值 。

对同一 试样一 般平 行测定 3 〜 4 次,其


精密度 符合要 求即 可。
2.1. 4.4 消除测量中的系 统误差

1. 做对 照实验
( 1 )标样 对照: 用已知含量的标准样品验证
方法。
( 2 )标 准方法 对照 :国家标准局颁布的标准
方法、如药典方法等。
2. 做回 收试验 :向已测定试样中加入被测组分的
纯品(定量分析用对照品),然后用同一种方法进
行测定,由测得的增加值与加入量之差,估算系统
误差。

加入纯品后的测得量-加入前 的测得量
回收率%= ×100
纯品加入量
3. 做空 白试验 :用与测定样品相同的方法、条件
和步骤对不加试样的空白样品进行定量分析,所
得结果作为空白值,从分析结果中扣除。
可以消除溶剂、蒸馏水、试剂不纯或实验器皿等
造成的系统误差。

4. 校准 仪器:消除由仪器不准确引起的误差。计
算结果时采用校正值。
2.2 有效数字及其运算法则

 2.2. 1 有效数字
 2.2. 2 数字的修约 规则
 2.2. 3 有效数字的 运算规则
2.2.1 有效数 字
• 有效数 字 (significant figure )

• 记录原 则:有效数 字位数 包括 所有准 确数 字和


一位欠 准数字
例:滴定读数 20.30mL ,最多可以读准三位
第四位欠准(估计读数)

• 可疑数 字不是 臆造 的。一 般理 解它可 能有 1


或 0.5 个单位 的误差 。
• 数据的 有效数 字, 由使用 的仪 器的准 确程 度确
定。
有效 数字计 位原 则:

1. 在 0~9 中, 只有 0 既是 有效数 字, 又是无 效数 字

( 1 )以 0 开头的小数,数字前面的“ 0” 不是有
效数字,是定位用的; 0.005 4g

( 2 )以“ 0” 结尾的整数,有效数字难以确定。
按科学计数法表达,才能判断他的位数。
• 例如: 250 0 写为 2.5 ×10 3 或 2.50 ×10 3
2. 首位 数是 8 或 9 的大数 ,有效 数字 多记一

例如: 8.96ml , 0.940mg
3. 很小 的数字 或很 大的数 字, 定位不 方便 ,
可用 10 的乘 方表示 。
4. 变换 单位 时,有 效数 字的位 数必 须保持 不
变。 例如: 23.4mg=0.0234g
5. pH 、 pM 、 pK 等值的有效数字仅取决于小数
部分数字的位数。因为整数代表原值的方次。
pH=5.68 表示 [H+]=2.1×10-6
2.2. 2 有效数字的 修约规则
( 1 ). 四舍六 入五 留双
例: 0.37456 , 0.3745 均修约至三位有效数
字 0.375 0.374

( 2 ). 只能对 数字 进行一 次性 修约
例: 6.549 , 2.451 一次修约至两位有效数
字 2.5
6.5
( 3 )在大量 数据 运算时 ,对 参加运 算的 数据
可先多 保留一 位有 效数字 。
为防止误差迅速累加,运算后再将结果修约成与
最大误差数据相当的位数。

( 4 )修约标 准偏 差时, 修约 结果应 使准 确度


降低。
例: s = 0.134 → 修约至 0.14 ,可信 度↑
标准偏差和相对标准偏差,一般取两位有效数字
2.2. 3 有效数 字的运算 法则

加减法 运算法 则 :
几个数据相加减时,以绝对误差最大(小
数点后位数最少)的数据为准,修约其它数据
,使各数据的绝对 误差 一致后再进行加减运
算。

eg. 0. 0121 + 1.05782 + 25.64 =26.71


• 乘除法 运算法 则 :

• 几个数据相乘除时,以参加运算的数据中相对
误差最 大(有效数字位数最少)的那个数据为
准进行修约后再运算。
• eg . 0.012 1×1.0 5782 × 25 .64= 0.328
2.3    有限量测量数据的统计处理

 2.3. 1 偶然 误差的 正态 分布
 2.3. 2 t 分布
 2.3. 3 平均 值的精 密度 和置信 区间
 2.3. 4 显著 性检验
 2.3. 5 可疑 数据的 取舍
 2.3. 6 相关 与回归
2.3. 1 偶然误差的 正态分布

在统计 学上, 对同 一试样 在


相同条 件下进 行 n 次测定 ,当 n 很大 时,
测量值 的波动 服从 正态分 布( 或高斯 分
布)。
•正态 分布的 概率 密度函 数表 达式:

1  1 x −µ 2
y = f ( x) = exp − ( ) 
σ 2π  2 σ 
y— 概率 密度 , x— 测定 值
— 总体平均值, σ— 总体 标准 偏差
正态分 布曲 线

正态分布的两个重要参数

( 1 ) μ 为无限次测量的
总体均值,表示无限个数
据的 集中趋势(无系统误
差时即为真值)

( 2 ) σ 是总体标准差,
表示数据的离散程度
图: 两组 数据的正 态分 布曲
y— 测量值 出现的 频率 线
标准 正态分 布( u 分
布) :
x−µ
u=
σ

以总体标准偏差 σ 为偏差
单位的正态分布曲线,称
为(标准)正态分布曲线

将正态分布曲线,标准化成为标准正态分布曲线。

正态分布曲线与横坐标所夹的总面积代表所有测量
值出现的概率总和,其值为 1 。
预测测 量值( 或偶 然误差 )出 现在某 区间 内的
概率

偶然误 差出现 测量 值出 现的 概率
的区间 区间
u=±1 x=µ ±1 σ 68.3%
u=±1.96 x=µ ±1.96 σ 95.0 %
u=±2 x=µ ±2 σ 95.5%
u=±2.58 x=µ ±2.58 σ 99.0%
u=±3 x=µ ±3 σ 99.7%
2.3. 2 t 分布

在实际 分析工 作中 ,进行 有限 次测量 ,无 法得


到 和 。

英国的化学家和 统计学家 Gosset 提出


,对有限次测量 ,其偶然误 差的分布服
从 t 分布。
t 分布曲线

纵坐标仍然是
概率密度 y ,
横坐标是统计
量t。
x−µ
t=
S

t 分布曲 线随自由度 f ( f = n - 1 )的改变而


改变。当 f 趋近于无限时, t 分布就趋近于正态分
布。
正态分 布和 t 分布的 区别:
1 .正 态分 布—— 描述 无限次 测量 数据
t 分布 — —描 述有限 次测 量数据
x−µ
2 .正 态分 布曲线 —— 横坐标 为 u u,=
σ
x−µ
t 分布曲线 —— 横坐标 为 t t =
s
3 .两者所 包含面 积均 是一定 范围 内测 量值出 现的 概率
P。
正态分 布: P 随 u 变化 ; u 一定, P 一定
t 分布 : P 随 t 和 f 变化; t 一定,概 率 P
与 f 有关,
• 置信度 (置信 水平 P) :表示 在某一 t 值时,
µ±
测定值 x 落在 (tS )范围 内的概 率

• 显著性 水平( ) :测 定值 x 落在上 述范
围之外 的概率 ( 1 - P )。

•表 2-2 t 检验 临界值 ( tα , f )表 (不同 f 值及


值所相应 的 t 的理论 值。
2.3.3.1 平均值 的精密度

• 平均值的精密度可用平均值的标准偏差 S x表示。
• 公式:
sx
sx =
n
• 平均值的标准偏差与测定次数的平方根成反比。

意义:增加测定次数,可使平均值的标准偏差减小。

注:通 常 3~4 次或 5~9 次测 定足够


2.3.3.2 平均值的置信区 间- 对 的区间估计

预测 测量值 (或 偶然误 差) 出现在 某区 间内的


概率 测量 值出 现的
偶然误 差出现 概率
的区间 区间
u=±1 x=µ ±1 σ 68.3%
u=±1.96 x=µ ±1.96 σ 95.0 %
u=±2 x=µ ±2 σ 95.5%
u=±2.58 x=µ ±2.58 σ 99.0%
u=±3 x=µ ±3 σ 99.7%
置信区 间:在一定的置信水平下,以测定值 x
为中心,包括总体平均值在内的可信范围,称为
置信区间(置信界限)。
公式 µ = x ± uσ

•其中( x ± uσ )为置信区间,uσ 为置信限。

置信水平越高,置信区间就越大,估计的精度越差

在分析中通常用 P 为 95 %或 90 %
平均 值的置 信区 间:
( 1 )用 多次 测量的 样本 平均值 ,估 计 值的 范围:

µ = x ± uσ x = x ± u σ n

( 2 )用少量 测定值 的平 均值, 估计 值的 范


围,必 须根据 t 分布 进行处 理。
根据所要求的置信水平和自由度,由表查出
tα , f 值,求出 S ,代入下列公式计算:
公式: µ = x ± tS x = x ± tS n
置信限: tS n
 置信区 间分为 双侧 和单侧 两种 。
• 双侧指同时存在大于和小于总体平均值的置信
范围。
x − tS n 〈 µ 〈 x + tS n
• 单侧指在一定置信水平时总体平均值大于或小
于总体平均值的范围。

µ 〉 x − tS n 或 µ 〈 x + tS n
•例5 用 8 -羟基喹啉 测定铝含量 , 9
次测定的标准偏 差为 0.042 %,平 均
值为 10.7 9 %。估计真 实值在 95 %和
99 %置信水平时应 是多大?
解:
P = 0.95;α = 1 − P = 0.05;f = 9 − 1 = 8;
查表得 t0.05,8 = 2.306
根据:µ= x ± t0.05,8 S n ,将数据代人得:
µ=10.79 ± 2.306 × 0.042 9 = 10.79 ± 0.032(%)

P = 0.99;α = 1 − P = 0.01;f = 9 − 1 = 8;
查表得 t0.01,8 = 3.355
将数据代人得:
µ=10.79 ± 3.355 × 0.042 9 = 10.79 ± 0.047(%)
2. 3.4 显著性 检验

在定量分析中,经常要判断两个分析结果
的差异是由偶然误差引起来的还是由系统
误差引起的。这类问题都属于统计检验的
内容,称为显著性检验、差别检验等。

t 检验

F 检验
2.3. 4.1 t 检验

主要 用于检 验两 个分析 结果 是否存 在显 著


的系统 误差,也叫 准确度 显著性 检验 。

1. 样本平均值与标准值间的比较;

2. 两组有限量测量数据的样本平均值间的比较
(不同测定人员或不同的试验条件);
1. 样本平 均值与 标准 值的 t 检验
• 即已知标准值的 t 检验——准确度显著性检验。
• 检验目的:用基准物质、标准试样或理论真值
(约定真值或相对真值)来评价分析方法或分析
结果。

原理:
x−µ
µ = x ± tS n t= n
S
 具体做 法:
• 先将数据代入公式求出 t 值,
• 从表 2 - 2 查出指定了置信水平和测定次数的
相应的 tα,f 临界值。
• 将计算值和查表值比较。
若计算的 t ≥ tα , f ,说明样本平均值和标
准值之间存在显著性差异;
若计算的 t ≤ tα , f ,说明样本平均值和标
准值之间不存在显著性差异。
2. 两个样 本均值 的 t 检验
 检验目 的

( 1 )一个样品不同分析人员或同一人员采用不同
的分析方法、不同仪器或不同时间,分析所得两
组数据平均值间的显著性检验。

( 2 )两个样品含有同一成分,用相同分析方法得
到两组数据均值间的显著性差异检验。
原理:
x1 − x 2 n1 × n 2
t=
SR n1 + n 2

• 其中, SR 为合并标准偏差或组合标准偏差,
n1 , n2 为两组数据的测定次数, n1 , n2 可以不
等,但相差不能悬殊。
• 若已知 S1 和 S 2,可以求出 S R

(n1 − 1) S + (n2 − 1) S
2 2
SR = 1 2

n1 + n2 − 2

n1 n2
• 或 ∑ (x 1 − x1 ) + ∑ ( x 2 − x 2 )
2 2

SR = i =1 i −2

(n1 − 1) + (n 2 − 1)
• 检验方法:
• 将数据代入上面公式,求出 t 。
• 指定了置信水平和自由度(注意这里 f=n1+n2–
2 ) , 查表 2-2 得到 tα , , f 临界值。
• 计算值和查表值比较:
t ≥ tα , f
若计算的 ,说明两组数据的平均值间
存在显著性差异 , 即两组平均值间存在着系统误
差;说明两个平均值不属于同一总体;
若计算的
t 〈t α, f ,说明两组数据的平均值间
不存在显著性差异,可以认为两个均值属于同一总
体,即 µ1 = µ 2 。
2.3.4. 2 F 检验

F 检验( 方差检 验) ——精 密度显 著性 检验


• 原理:通过比较两组数据的方差( S2 ),以确
定它们的精密 度是否存在显著性差异。
• 步骤:
• ( 1 )先计算出两个样本的方差,然后计算方差
比F。 2
S
• 定义: F = 1
2
S 2

• 注意:大的方差作分子,小的方差作分母 。
( 2 )与表中给出的方差比的单侧临界值(
F)进行比较
α , f1 , f 2

• 若 F 〈Fα, f , f
1 2
,则说明两组数据的精密度
不存在显著性差异;

• 若 F 〉 Fα , f1 , f 2 ,则说明两组数据的精密度存在
显著性差异。

• 注意: 在查表 时, f1 为大方差 的自 由度, f2


为小方 差的自 由度 ,顺序 不要 错。
使用 显著性 检验 的几点 注意 事项

( 1 ) 两组 测量 数据的 显著 性检验 顺序 是:先


进行 F 检验,然后进行 t 检验。
• 原因: t 检验的前提条件是两组数据的标准偏差
没有显著性差异。只有两组数据的精密度接近或
偶然误差接近,准确度和系统误差的检验才有意
义。
( 2 )单侧 与双 侧检验

检测两个(两组)分析结果是否存在显著性差
异时,用双侧检验;若检验某分析结果是否明显
高于(或低于)某值,则用单侧检验。

t 检验要根据要求选择,不是特别要求,多为
双侧检验。 F 检验多用单侧检验,检验结论一般
是 S1 是否明显高于 S2 。
( 3 )置信 度 ( 或显著 性水平 ) 的选 择
F 和 t 的临界 值随 P 的不同 而不同 ,因 此 P
的选择 必须适 当。

置信水 平过 高,则 放宽 对差别 要求 的限度 ,


容易犯 “以假 为真 ”的错 误;

置信水 平过 低,则 提高 对差别 要求 的限度 ,


容易犯 “以真 为假 ”的错 误;

在分析 化学 中,通 常以 =0.0 5 或 P=95 % 作


为判断 差别 是否显 著的 标准。
2. 3.5 可疑数 据的取舍
• 可疑值 (逸出 值) :在测量中出现的过高或过低
的测量值。
• 如何判 断某个 数据 是逸出 值?
• 首先检查该数据是否是记录错误,实验过程中是否
有异常现象发生。
• 用统计学的方法,确定该可疑值与其它数据是否来
源于同一总体,以决定取舍。
Q 检验法 (舍弃 商法 )
G 检验法 ( Gr ubbs 检验 法)
Q 检验法
检验步 骤:
x最大 − x最小
( 1 )算 出极差 :
x可疑 −x紧邻
( 2 )算 出可疑 值与 紧邻值 之差
x可疑 − x紧邻
Q=
( 3 )算 出舍弃 商 xQ最大 − x最小
公式 :

( 4 )查 表 2 - 5 得到指 定置信 度的 Q 临界值


( 5 )判 断:若 计算 值大于 查表 值,该 数据 就
G 检验( Grubbs 法)

检验过 程:
x1 , x 2 , x 3 ,  , x n −1 , x n ⇒ x和s

x异常 − x
G=
s

判断:
一定P下,若G > Gα,N ,则异常值舍弃;否则保留
小结
1. 比较:
t 检验— —检验 方法 的系统 误差
F 检验— —检验 方法 的偶然 误差
G 检验— —异常 值的 取舍
2. 检验顺序 :
G 检验 → F 检验 → t 检验

准确度 或系统
异常值 的 精密度 显著
误差显 著性检
取舍 性检 验

2.3.6 相关和回归
Correlation and regression

我们 进行 定量分 析的 依据是 利用 被检测 物质


的某种 性质(物理 性质、 化学 性质) 与量 的
关系进行定 量检测 的, 也就是 要研 究变量 之
间关系 的 。
统计 方法 中常用 回归 分析和 相关 分析研究两
个变量 之间的 关系
相关 分析
Correlation analysis

相关 系数 r :为了定量地描述两个变量的相
关性,引入相关系数。
• 设两个变量为 x 和 y , n 次测量值……
( xn , yn )
n
• 公式: ∑ (x i − x)( y i − y )
• r= i =1
n n

∑ i
( x
i =1
− x ) 2
• ∑ i
( y − y ) 2

i −1
 物理意 义:

• 相关系 数 r 是一个 介于 0 和 ±1 之间 的数值


, 即 0<| r |<1 。反 映两 个变量 之间 的
密切程 度。

• 当 r=± 1 时,表 示所有 的( xi , yi )值 都在


一条直 线上。

• 当 r=0 时,表示 所有的 ( xi , yi )值呈 杂乱


无章的 非线性 形式 。

• 当 r 在 0 和 1 之间 时,表 示 y i 和 x I 之间 存
在相关 性, r 越接 近 1 ,表 明线性 关系 越好

• 通常情 况下:

• 0.90<r< 0.95 表示一 条平滑 的直 线;

• 0.95<r< 0.99 表示一 条良好 的直 线;

• r>0.99 表明线性 关系 很好。

化学定 量分 析中, 只有 两个变 量呈 良好的 线性


关系, 才能 够用来 进行 定量分 析。
回归分析
regression analysis

在定量 分析时 ,我 们首先 要用 标准


品来做 工作曲 线。 由于测 量误差 的存 在,
测量值 不可能 正好 是一条 直线 ,总是 围绕
这一直 线有一 定程 度的波 动, 这就需 要用
数理统 计的方 法。 最好的 办法 就是对 数据
进行回 归分析 。
• 分析化 学中的 标准 曲线都 是直 线,可 以用 一
元线性 方程来 表示 。

• y = a + bx
• 用线性 回归— —最 小二乘 法, 找出对 各数 据
点误差 最小的 直线 。
• 通过测 量点确 立最 能反映 其真 实分布 状况 的
最佳直 线,解 出回 归系数 a (直线 的截距 )
和 b (直线 的斜率 ) 就可 以确 定回归 方程 式

• 根据相 关系数 ,判 断线性 的好 坏。


小结:
基本内容

1. 定量 分析 的误差 来源 、性质 以及 如何减 免



(与误差 有关 的基本 概念 、误差 的传 递和提 高
分析结 果准确 度的 方法)
2. 有效数字 及其 运算法 则。
3. 应用统计 学原 理处理 分析 数据的 一些 基本
方法。 (误差 的正 态分布 和 t 分布 ,显著 性检
验、可 疑数据 的取 舍、相 关与 回归等 )。
基本要求
1 .掌握
 基本 概念:
与误 差有关 的基 本概念 :准 确度和 精密 度,
误差、 偏差; 系统 误差和 偶然 误差

 准确度 和精密 度的 表示方 法及 二者之 间的 关


系;误 差的来 源、 产生原 因和 减免方 法;

有效数字 的表 示方法 及运 算法则 。


2.熟 悉
 置信区 间的含 义和 表示方 法。 显著性 检验
的目的 和方法 : F 检验 和 t 检验; 可疑 数据
的取舍 方法; 分析 数据统 计处 理的基 本步 骤

3 .了解
 误差传 递的规 律; 处理变 量之 间关系 的统
计方法 :相关 和回 归。
作业题: p28
10
( 2 、 4 、 5 、 6 ), 11 , 13 , 16

You might also like