基本概念
什么是参数估计
参数估计(parameter estimation),用样本统计量去估计总体的参数。
例如,用样本均值xˉ估计总体均值μ,用样本方差s2估计总体方差σ2,用样本比例p估计总体比例π,等等。
在参数估计中,总体参数笼统地用θ来表示,用来估计总体参数的统计量称为估计量(estimator),用符号θ^表示,参数估计也就是如何用θ^来估计θ。样本均值、样本方差、样本比例等都可以是一个估计量,根据一个具体的样本计算出来的估计量的数值称为估计值(estimated value)。
点估计与区间估计
参数估计的方法有两种:
- 点估计
- 区间估计
点估计
点估计(point estimate),用样本统计量θ^的某个取值直接作为总体参数θ的估计值。
点估计的局限性在于,无法给出,一个具体的点估计值的可靠性的度量。
点估计的方法包括矩估计法、顺序统计量法、最大似然法、最小二乘法等多种方法。这些都不是参数估计的主要方法,本文不讨论。
评价估计量的指标有三个:无偏性、有效性、一致性。我们也不会展开讨论,因为这三个评价的都是点估计的。
区间估计
区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间范围通常由样本统计量加减估计误差得到。
与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。
置信区间
置信区间(confidence interval),由样本统计量所构造的总体参数的估计区间,其中区间的最小值为置信下限,最大值为置信上限。
通俗的说,用区间估计的方法,所得到的区间,被称为置信区间。
置信度
一般地,如果将构造置信区间的步骤重复很多次,置信区间中包含总体参数真值的次数所占的比例,这就是置信度(confidence coefficient),也被称为置信水平(confidence level)或置信系数,表示为1−α
α是事先确定的一个概率值,也称风险值,是总体参数不在区间内的概率。
例如,置信水平值为99%、95%、90%,相应的α为0.01、0.05、0.10。
一种常见的错误,置信度是总体参数落在置信区间的概率。
我们借助套圈游戏来描述置信度。
先有总体参数,再有置信区间。就好比,先有已经摆放好的某个工艺品,再有套圈。置信度就好比套圈能套住某个工艺品的概率。假如以统计定义去描述置信度,进行N次套圈试验去套某个工艺品,M次套中,则置信度为M/N。
即,对于置信度:
- 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。
- 总体参数的真值是固定的、未知的,而样本构造的区间则是不固定的。若抽取不同的样本,用该方法可以得到不同的区间,从这个意义上说,置信区间是一个随机区间,它会因样本的不同而不同,而且不是所有的区间都包含总体参数的真值。
- 在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与样本相联系的一定置信水平下的置信区间。由于用该样本构造的区间是一个特定的区间,而不是随机区间,所以无法知道这个样本所产生的区间是否包含总体参数的真值。
一个总体参数的区间估计
研究一个总体时,所关心的参数主要有:
- 总体均值μ
- 总体比例π
- 总体方差σ2
总体均值的区间估计
在对总体均值进行区间估计时,需要考虑:
- 总体是否为正态分布
- 总体方差是否已知
- 用于构造估计量的样本是大样本(通常要求n≥30),还是小样本(n<30)
正态总体、方差已知,或非正态总体、大样本
方法
- 假定条件,当总体服从正态分布且σ2已知时,或者总体不是正态分布但为大样本时。
样本均值xˉ的抽样分布均为正态分布,其数学期望为总体均值μ,方差为nσ2。
- 而样本均值经过标准化以后的随机变量服从标准正态分布。
使用正态分布统计量z=nσxˉ−μ∼N(0,1)
- 根据正态分布的性质可以得出,总体均值μ在1−α置信水平下的置信区间为:
xˉ±z2αnσ
式中,xˉ−z2αnσ称为置信下限,xˉ+z2αnσ称为置信上限;α是事先确定的一个概率值,也称为风险值,它是总体值不被包括在置信区间内的概率;a−α称为置信水平;z2α是标准正态分布右侧面积为2α时的z值;z2αnσ是估计总体均值时的估计误差(estimate error)。
如果总体服从正态分布但σ2未知,或总体并不服从正态分布,只要是在大样本条件下,总体方差σ2就可以用样本方差s2代替,这时总体均值μ在1−α置信水平下的置信区间可以写为:
xˉ±z2αns
案例
一家食品生产企业以生产袋装食品为主,每天的产量大约为8000袋。按规定每袋的重量应为100克。为对产品重量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。
现从某天生产的一批食品中随机抽取25袋,测得每袋重量为:112.5、101.0、103.0、102.0、100.5、102.6、107.5、95.0、108.8、115.6、100.0、123.5、102.0、101.6、102.2、116.6、95.4、97.8、108.6、105.0、136.8、102.8、101.5、98.4、93.3。
已知产品重量服从正态分布,且总体标准差为10克。试估计该天产品平均重量的置信区间,置信水平为95%。
已知X∼N(μ,102),n=25,1−α=95%,Z2α=1.96。
由于是正态总体,且方差已知。总体均值在1−α置信水平下的置信区间为:
xˉ±z2αnσ=105.36±1.96×2510=(101.44,109.28)
即,该食品平均重量的置信区间为(101.44,109.28)。
正态总体、方差未知、小样本
方法
- 假定条件,总体方差σ2未知,而且是在小样本的情况下
需要用样本方差s2代替σ2,这时,样本均值经过标准化以后的随机变量服从自由度为n−1的t分布
- 即,使用t分布统计量
t=nsxˉ−μ∼t(n−1)
- 需要采用t分布来建立总体均值μ的置信区间。根据t分布建立的总体均值μ在1−α置信水平下的置信区间为:
xˉ±t2αns
式中,t2α是自由度为n−1时,t分布中右侧面积为2α时的t值。
案例
已知某种灯泡的寿命服从正态分布。
现从一批灯泡中随机抽取16个,测得其使用寿命(单位:小时)如下:1510、1450、1480、1460、1520、1480、1490、1460、1480、1510、1530、1470、1500、1520、1510、1470。
试建立该批灯泡平均使用寿命的95%的置信区间。
根据抽样结果有:
xˉs=n1i=1∑nxi=1623840=1490=n−11i=1∑n(xi−xˉ)2=16−19200=24.77
根据α=0.05,n=16,可知:
t2α(n−1)=t0.025(15)=2.131
平均使用寿命的置信区间为:
xˉ±t2αns=1490±2.131×1624.77=(1476.8,1503.2)
即1490±13 .2=(1476 .8,1503 .2),该种灯泡平均使用寿命的95%的置信区间为
总体比例的区间估计
方法
- 假定条件,总体服从二项分布,可以由正态分布来近似。
由样本比例p的抽样分布可知,当样本量足够大时,比例p的抽样分布可用正态分布近似。也就是说,我们讨论的,都是大样本情况下。
p的数学期望为E(p)=π;p的方差为σp2=nπ(1−π),样本比例经标准化后的随机变量服从标准正态分布。
- 即,使用正态分布统计量z
z=nπ(1−π)p−π∼N(0,1)
- 总体比例π在1−α置信水平下的置信区间为:
p±z2αnp(1−p)
式中,α是显著性水平;z2α是标准正态分布右侧面积为2α时的z值;z2αnp(1−p)是估计总体比例时的估计误差。
解释一下,为什么是p±z2αnp(1−p),而不是p±z2αnπ(1−π);总体比例π在1−α置信水平下的置信区间为:p±z2αnπ(1−π);但是,因为π值恰好是要估计的,所以,需要用样本比例p来代替π;所以,总体比例的置信区间表示为:p±z2αnp(1−p)。
案例
某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。
已知,n=100,z2α=1.96,根据抽样结果计算的样本比例为:
p=10065=65%
根据置信区间公式得,
p±z2αnp(1−p)=65%±1.96×10065%(1−65%)=(55.65%,74.35%)
任意大小的样本
对于任意大小的样本,将试验次数(样本量)n加上4,即用n=n+4代替n;将试验成功的次数x加上2,即用p=(x+2)/n代替p,可以改进置信区向。
由此得到的总体比例π在(1−α)置信水平下的置信区间为:
p±z2αnp(1−p)
总体方差的区间估计
方法
- 假定条件,总体服从正态分布。
- 根据在《3.抽样分布》所讨论的χ2分布的一个推论,我们知道
σ2(n−1)S2∼χ2(n−1)
- 总体方差σ2对在1−α置信水平下的置信区间为:
χ2α2(n−1)s2≤σ2≤χ1−2α2(n−1)s2
根据样本方差的抽样分布可知,样本方差服从自由度为n−1的χ2分布。因此,用χ2分布构造总体方差的置信区间。
案例
一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取25袋,测得每袋重量为:112.5、101.0、103.0、102.0、100.5、102.6、107.5、95.0、108.8、115.6、100.0、123.5、102.0、101.6、102.2、116.6、95.4、97.8、108.6、105.0、136.8、102.8、101.5、98.4、93.3。
已知产品重量服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。
已知n=25,1−α=95%,根据样本数据计算得s2=93.21。
χ2α2(n−1)χ1−2α2(n−1)=χ0.0252(24)=39.3641=χ0.9752(24)=12.4011
σ2的置信度为95%的置信区间为
χ2α2(n−1)s239.3641(25−1)×93.2156.83≤σ2≤χ1−2α2(n−1)s2≤σ2≤12.4011(25−1)×93.21≤σ2≤180.39
小结
两个总体参数的区间估计
对于两个总体,所关心的参数主要有:
- 两个总体的均值之差μ1−μ2
- 两个总体的比例之差π1−π2
- 两个总体的方差比于σ22σ12
两个总体均值之差
独立样本 大样本
方法
假定条件:
两个总体都服从正态分布 σ12、σ22已知 或者 两个总体不服从正态分布但是样本都为大样本;
并且,两个样本为独立随机的样本。
使用正态分布统计量z
z=n1σ12+n2σ22(xˉ1−xˉ2)−(μ1−μ2)∼N(0,1)
当两个总体的方差σ12和σ22都已知时,两个总体均值之差μ1−μ2在1−α置信水平下的置信区间为:
(xˉ1−xˉ2)±z2αn1σ12+n2σ22
当两个总体的方差σ12和σ22未知时,可用两个样本方差s12和s22来代替,这时,两个总体均值之差μ1−μ2在1−α置信水平下的置信区间为:
(xˉ1−xˉ2)±z2αn1s12+n2s22
案例
某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本。
中学一 |
中学二 |
n1=46 |
n2=33 |
x1ˉ=86 |
x2ˉ=78 |
s1=5.8 |
s2=7.2 |
试建立两所中学高考英语平均分数之差的95%的置信区间。
(xˉ1−xˉ2)±z2αn1s12+n2s22=(86−78)±1.96×465.82+337.22=(5.03,10.97)
独立样本 小样本 方差相等
方法
假设条件:
两个总体都服从正态分布,或者,两个总体方差未知但相等,即σ12=σ22;
并且,两个独立的小样本。
此时,需要用两个样本的方差s12和s22来估计。这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量sp2:
sp2=n1+n2−2(n1−s)s12+(n2−1)s22
两个样本均值之差经标准化后服从自由度为n1+n2−2的t分布,即
t=spn11+n21(xˉ1−xˉ2)−(μ1−μ2)∼t(n1+n2−2)
因此,两个总体均值之差μ1−μ2在1−α置信水平下的置信区间为:
(xˉ1−xˉ2)±t2α(n1+n2−2)sp2(n11+n21)
案例
为估计两种方法组装产品所需时间的差异,分别为两种不同的组装方法随机安排12个工人,每个工人组装一件产品所需的时间如下:
方法一:28.3、36.0、30.1、37.2、29.0、38.5、37.6、34.4、32.1、28.0、28.8、30.0
方法二:27.6、31.7、22.2、26.0、31.0、32.0、33.8、31.2、20.0、33.4、30.2、26.5
假定两种方法组装产品的时间服从正态分布,且方差相等,试以95%的置信水平建立两种方法组装产品所需平均时间之差的置信区间。
根据样本数据计算得
xˉ1s12xˉ2s22=32.5=15.996=28.8=19.358
合并估计量为:
sp2=12+12−2(12−1)×15.996+(12−1)×19.358=17.677
根据α=0.05,自由度12+12−2=22,可知t20.05(22)=2.0739。
两个总体均值之差在95%的置信水平下的置信区间为:
(xˉ1−xˉ2)±t2α(n1+n2−2)sp2(n11+n21)=(32.5−28.8)±2.0739×17.677×(121+121)=3.7±3.56
独立样本 小样本 方差不相等
方法
假设条件:
两个总体都服从正态分布,或者,两个总体方差未知但不相等,即σ12=σ22;
并且,两个独立的小样本。
使用t统计量
t=n1s12+n2s22(xˉ1−xˉ2)−(μ1−μ2)∼t(v)
此时,两个样本均值之差经标准化后近似服从自由度为v的t分布。
自由度v的计算公式为:
v=n1−1(n1s12)2+n2−1(n2s22)2(n1s12+n2s22)2
两个总体均值之差在1−α置信水平下的置信区间为:
(xˉ1−xˉ2)±t2α(v)n1s12+n2s22
案例
沿用上文的例子。假定第一种方法随机安排12名工人,第二种方法随机安排8名工人,即n1=12,n2=8。
方法一:28.3、36.0、30.1、37.2、29.0、38.5、37.6、34.4、32.1、28.0、28.8、30.0
方法二:27.6、31.7、22.2、26.5、31.0、33.8、20.0、30.2
假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。
根据样本数据计算得:
x1ˉs12x2ˉs22=32.5=15.996=27.875=23.014
代入公式,自由度v=13.188≈13。
根据自由度=13,可知t20.05(13)=2.1604。
两个总体均值之差在1−α置信水平下的置信区间为:
(xˉ1−xˉ2)±t2α(v)n1s12+n2s22=(32.5−27.875)±2.1604×1215.996+823.014=4.625±4.433
匹配样本
什么是匹配样本
上文使用的都是独立的样本,在使用独立样本来估计两个总体均值之差具有潜在的弊端。比如,在为每种方法随机指派12个工人时,偶尔可能会将技术比较差的12个工人指给方法一,而将技术较好的12个工人指给方法二,这种不公平的指派可能会掩盖两种方法组装产品所需时间的真正差异。
为解决这一问题,可以使用匹配样本(matched sample),即一个样本中的数据与另一个样本中的数据相对应。
比如,先指定12个工人用第一种方法组装产品,然后再让这12个工人用第二种方法组装产品,这样得到的两种方法组装产品的数据就是匹配数据。基于匹配样本,可以消除由于样本指定的不公平造成的两种方法组装耗时上的差异。
大样本的方法
假定条件:
两个匹配的大样本(n1≥30和n2≥30);
并且,两个总体各观察值的配对差服从正态分布
两个总体均值之差μd=μ1−μ2在1−α置信水平下的置信区间为:
dˉ±z2αnσd
式中,d表示两个匹配样本对应数据的差值;dˉ表示各差值的均值;σd表示各差值的标准差。当总体的σd未知时,可用样本差值的标准差sd来代替。
小样本的方法
假定条件:
两个匹配的大样本(n1<30和n2<30);
并且,两个总体各观察值的配对差服从正态分布。
两个总体均值之差μd=μ1−μ2在1−α置信水平下的置信区间为:
dˉ±t2α(n−1)nsd
案例
由10名学生组成一个随机样本,让他们分别采用A、B两套试卷进行测试,结果如表所示。
学生编号 |
试卷 A |
试卷 B |
差值 d |
1 |
78 |
71 |
7 |
2 |
63 |
44 |
19 |
3 |
72 |
61 |
11 |
4 |
89 |
84 |
5 |
5 |
91 |
74 |
17 |
6 |
49 |
51 |
-2 |
7 |
68 |
55 |
13 |
8 |
76 |
60 |
16 |
9 |
85 |
77 |
8 |
10 |
55 |
39 |
16 |
假定两套试卷分数之差服从正态分布,试建立两套试卷平均分数之差μd=μ1−μ2的95%的置信区间。
根据上表可以计算得到
dˉsdt20.05(9)=11=6.53=2.2622
因此,得到两套试卷平均分之差的95%置信区间为:
dˉ±t2α(n−1)nsd=11±2.2622106.53=11±4.67
两个总体比例之差的区间估计
方法
假定条件:
两个总体服从二项分布,可以用正态分布来近似;
并且,两个样本是独立的。
根据正态分布建立的两个总体比例之差在1−α置信水平下的置信区间为:
(p1−p2)±z2αn1p1(1−p1)+n2p2(1−p2)
案例
在某个电视节目的收视率调查中,从农村随机调查了400人,有32%的人收看了该节目;从城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率之差的置信区间。
城市收视率p1=45%
农村收视率p2=32%
当α=0.05时,z2α=1.96,因此,置信区间为:
(p1−p2)±z2αn1p1(1−p1)+n2p2(1−p2)=(45%−32%)±1.96×50045%(1−45%)+40032%(1−32%)=13%±6.32%
两个任意大小样本的估计方法
对于两个任意大小的样本,只要对n1和n2、p1和p2略加修正就可以改进估计区间。
具体做法是:
- 将试验次数(样本量)n1和n2加上2,即用n1=n1+2代替n1,用n2=n2+2代替n2。
- 将试验成功的次数x1和x2各加上1,即用p1=n1(x1+1)代替p1,用p2=n2(x2+1)代替p2。
由此得到的两个总体比例之差(π1−π2)在(1−α)置信水平下的置信区间为:
(p1−p2)±z2αn1p1(1−p1)+n2p2(1−p2)
两个总体方差比的区间估计
方法
该方法用于比较两个总体方差。
比如,比较用两种不同方法生产的产品性能的稳定性,比较不同测量工具的精度,等等。
比较两个总体的方差比,用两个样本的方差比来判断:
- 如果S22S12接近1,说明两个总体方差很接近。
- 如果S22S12远离1,说明两个总体方差之间存在差异。
两个总体方差比σ22σ12在1−α置信水平下的置信区间为:
F2α(s22s12)≤σ22σ12≤F1−2α(s22s12)
(7.26)
式中,F2α和F1−2α分别是分子自由度为n1−1和分母自由度为n2−1的F分布的右侧面积为2α和1−2α的分位数。由于F分布表中只给出面积较小的右分位数,此时可利用下面的关系求得F1−2α的分位数值:
F1−2α(n1,n2)=F2α(n2,n1)1
案例
为研究男女学生在生活费支出(单位:元)上的差异,在某大学随机抽取25名男学生和25名女学生,得到下面的结果:
男学生:x1ˉ=520s12=260
女学生:x2ˉ=480s22=280
试以90%的置信水平估计男女学生生活费支出方差比的置信区间。
n1n2F2α(n2,n1)F1−2α(24,24)=25−1=24=25−1=24=F0.05(24,24)=1.98=F0.05(24,24)1=1.981=0.505
由此得到:
1.98(280260)0.47≤σ22σ12≤0.505(280260)≤σ22σ12≤1.84
小结
样本量的确定
在进行参数估计之前,首先应该确定一个适当的样本量,也就是应该抽取一个多大的样本来估计总体参数。
在进行估计时,总是希望提高估计的可靠程度。但在一定的样本量下,要提高估计的可靠程度(置信水平),就应扩大置信区间,而过宽的置信区间在实际估计中往往是没有意义的。想要缩小置信区间,又不降低置信程度,就需要增加样本量。
但样本量的增加会受到许多限制,比如会增加调查的费用和工作量。通常,样本量的确定与可以容忍的置信区间的宽度以及对此区间设置的置信水平有一定关系。
因此,如何确定一个适当的样本量,是抽样估计中需要考虑的问题。
估计总体均值时样本量的确定
方法
在进行参数估计时,估计误差为z2αnσ,由此可知,z2α和样本容量n共同确定了估计误差的大小。对于给定的置信水平和总体标准差,就可以确定任一希望的估计误差所需要的样本量。
所希望达到的估计误差为:
E=z2αnσ
可以推出需要的样本量为:
n=E2(z2α)2σ2
从式中可以看出,样本量与置信水平成正比;与总体方差成正比;与估计误差的平方成反比;
与可靠性系数成正比。
当计算出的样本量不是整数时,通常进行向上取整,这个也被称为样本量的圆整法则。
案例
考虑总体均值的95.44%置信度的置信区间,已知总体服从正态分布且标准差为10,要使得到
的置信区间的半径不超过1,需要的最小样本容量为多少?
置信区间的半径不超过1,即估计误差小于1,由题意可以构造不等式如下
z2αnσ1.96×nσn≥400≤1≤1
估计总体比例时样本量的确定
方法
与估计总体均值时样本量的确定方法类似,在重复抽样或无限总体抽样条件下,估计总体比例置信区间的估计误差为z2αnπ(1−π),z2α的值、总体比例π和样本量n共同确定了估计误差的大小。一旦确定了置信水平1−α,z2α的值就确定了。由于总体比例的值是固定的,所以估计误差由样本量来确定,样本量越大,估计误差就越小,估计的精度也就越好。
所希望达到的估计误差为:
E=z2αnπ(1−π)
由此可以推导出重复抽样或无限总体抽样条件下确定样本量的公式:
n=E2(z2α)2π(1−π)
当π的值无法知道时,通常取使π(1−π)最大时的0.5。
案例
根据以往的生产统计,某种产品的合格率约为90%,现要求估计误差为5%,在95%的置信
区间下,应抽取多少个产品作为样本?
已知:
πEz2αn=90%=5%=1.96=E2(z2α)2π(1−π)=0.0521.962×0.9×(1−0.9)=138.3≈139
Python计算
均值
一个总体均值的估计
大样本的估计
一家研究机构随机抽取40辆相同排气量的家用轿车,经测试得到每百公里的耗油量数据。构建该排气量轿车平均耗油量的90%的置信区间。
虽然总体方差未知,但为大样本,因此可用样本方差来代替,用正态分布构建置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10
| import pandas as pd import numpy as np import scipy.stats as st
df = pd.read_csv('XXX.csv') x = df['耗油量']
int_arr = st.norm.interval(confidence=0.90, loc=np.mean(x), scale=st.sem(x)) print(int_arr)
|
运行结果:
1
| (7.835886999819788, 8.099113000180214)
|
scipy.stats
包中的norm.interval
,函数默认位置参数(均值)loc=0
,尺度参数(标准差)scale=1
,confidence
为置信水平。
小样本的估计
从一批袋装食品中随机抽取25袋,测得每袋重量。假定食品重量服从正态分布,构建该批食品平均重量的置信区间,置信水平为95%。
总体服从正态分布但未知,由于是小样本,样本均值经标准化后服从自由度为n−1的t分布,
示例代码:
1 2 3 4 5 6 7 8 9 10 11
| import pandas as pd import numpy as np import scipy.stats as st
df = pd.read_csv('XXX.csv')
x = df['食品重量']
int_arr = st.t.interval(confidence=0.95, df=len(x) - 1, loc=np.mean(x), scale=st.sem(x)) print(int_arr)
|
运行结果:
1
| (101.37482261947405, 109.34517738052598)
|
两个总体均值差的估计
独立大样本的估计
为研究男性和女性网上购物支出的差异,从某电商平台中随机抽取男女各50人,得到某个月的网购支出数据。构建男女平均支出差值的95%的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| import pandas as pd import numpy as np from scipy.stats import norm
df = pd.read_csv('XXX.csv')
x1 = df['女性支出'] x2 = df['男性支出']
xbar1 = x1.mean() s1 = x1.std() n1 = len(x1)
xbar2 = x2.mean() s2 = x2.std() n2 = len(x2)
interval = norm.interval(confidence=0.95, loc=(xbar1 - xbar2), scale=np.sqrt(s1 ** 2 / n1 + s2 ** 2 / n2))
print(interval)
|
运行结果:
1
| (381.184439490999, 957.7155605090002)
|
独立小样本的估计
为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,统计每名工人组装一件产品所需的时间。假定两种方法组装产品的时间服从正态分布,以95%的置信水平构建两种方法组装产品所需平均时间差值的置信区间。
- 假定σ12=σ22
- 假定σ12=σ22
假定σ12=σ22,示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| import pandas as pd from scipy.stats import t from statsmodels.stats.weightstats import ttest_ind
data = pd.read_csv('XXX.csv')
x1 = data['方法一'] x2 = data['方法二']
xbar1 = x1.mean() xbar2 = x2.mean()
t_value, p_value, df = ttest_ind(x1=x1, x2=x2, alternative='two-sided', usevar='pooled')
interval = t.interval(confidence=0.95, df=df, loc=(xbar1 - xbar2), scale=(xbar1 - xbar2) / t_value)
print(interval)
|
运行结果:
1
| (0.14029361395375695, 7.259706386046249)
|
假定σ12=σ22,修改ttest_ind
方法的usevar
参数的值为unequal
。示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| import pandas as pd from scipy.stats import t from statsmodels.stats.weightstats import ttest_ind
data = pd.read_csv('XXX.csv')
x1 = data['方法一'] x2 = data['方法二']
xbar1 = x1.mean() xbar2 = x2.mean()
t_value, p_value, df = ttest_ind(x1=x1, x2=x2, alternative='two-sided', usevar='unequal')
interval = t.interval(confidence=0.95, df=df, loc=(xbar1 - xbar2), scale=(xbar1 - xbar2) / t_value)
print(interval)
|
运行结果:
1
| (0.13842654466524218, 7.261573455334764)
|
配对样本的估计
由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,统计所得分数。假定两套试卷的分数之差服从正态分布,构建两套试卷平均分数之差的95%的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| import pandas as pd import numpy as np from scipy.stats import t
df = pd.read_csv('XXX.csv')
x1 = df['试卷A'] x2 = df['试卷B'] d = x1 - x2
d_bar = d.mean() sd = d.std()
interval = t.interval(confidence=0.95, df=len(d) - 1, loc=d_bar, scale=sd / np.sqrt(len(d)))
print(interval)
|
运行结果:
1
| (6.327308257173503, 15.672691742826498)
|
比例
一个总体比例的估计
大样本的估计方法
某企业想要进行一项工作时间的改革,为征求员工对该项改革措施的意见,随机调查500人,其中325人赞成改革措施。用95%的置信水平估计赞成该项改革的人数比例的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11
| import numpy as np from scipy.stats import norm
conf_level = 0.95 n = 500 x = 325 p = x / n
interval = norm.interval(confidence=conf_level, loc=p, scale=np.sqrt(p * (1 - p) / n))
print(interval)
|
运行结果:
1
| (0.6081925393809212, 0.6918074606190788)
|
任意大小样本的估计方法
沿用上例,用95%的置信水平估计该企业员工中赞成该项改革的人数比例的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11
| import numpy as np from scipy.stats import norm
conf_level = 0.95 n = 500 + 4 x = 325 + 2 p = x / n
interval = norm.interval(confidence=conf_level, loc=p, scale=np.sqrt(p * (1 - p) / n))
print(interval)
|
运行结果:
1
| (0.6071357532950432, 0.6904832943240045)
|
两个总体比例差的估计
两个大样本的估计方法
在某档电视节目的收视率调查中随机调查500名女性观众,有225人收看了该节目;随机调查400名男性观众,有128人收看了该节目。用95%的置信水平估计女性与男性收视率差值的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12
| import numpy as np from scipy.stats import norm
conf_level = 0.95 n1 = 500 n2 = 400 p1 = 225 / n1 p2 = 128 / n2
interval = norm.interval(confidence=conf_level, loc=(p1 - p2), scale=np.sqrt(p1 * (1 - p1) / n1 + p2 * (1 - p2) / n2))
print(interval)
|
运行结果:
1
| (0.06682345597691185, 0.19317654402308815)
|
两个任意大小样本的估计方法
沿用上例,用95%的置信水平估计女性与男性收视率差值的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12
| import numpy as np from scipy.stats import norm
conf_level = 0.95 n1 = 500 + 2 n2 = 400 + 2 p1 = (225 + 1) / n1 p2 = (128 + 1) / n2
interval = norm.interval(confidence=conf_level, loc=(p1 - p2), scale=np.sqrt(p1 * (1 - p1) / n1 + p2 * (1 - p2) / n2))
print(interval)
|
运行结果:
1
| (0.0662439605945023, 0.1923634010038803)
|
方差
一个总体方差的估计
以95%的置信水平构建某种食品重量的方差和标准差的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| import pandas as pd from scipy.stats import chi2
df = pd.read_csv('XXX.csv') x = df['食品重量']
conf_level = 0.95 sigma2 = x.var() n = len(x)
LCI = (n - 1) * sigma2 / chi2.ppf(q=(1 + conf_level) / 2, df=n - 1) UCI = (n - 1) * sigma2 / chi2.ppf(q=(1 - conf_level) / 2, df=n - 1)
print(LCI, UCI) print(pow(LCI, 1 / 2), pow(UCI, 1 / 2))
|
运行结果:
1 2
| 56.82897120865117 180.38810600433104 7.53849926766934 13.43086393365412
|
两个总体方差比的估计
以95%的置信水平构建两种方法组装产品所需时间方差比的置信区间。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| import pandas as pd from scipy.stats import f
df = pd.read_csv('XXX.csv')
x1 = df['方法一'] x2 = df['方法二']
conf_level = 0.95
var1 = x1.var() var2 = x2.var()
n1 = len(x1) n2 = len(x2)
LCI = (var1 / var2) / f.ppf(q=(1 + conf_level) / 2, dfn=n1 - 1, dfd=n2 - 1) UCI = (var1 / var2) / f.ppf(q=(1 - conf_level) / 2, dfn=n1 - 1, dfd=n2 - 1)
print(LCI, UCI)
|
运行结果:
1
| 0.23788360619409207 2.8704427774446266
|