编辑: f19970615123fa | 2018-11-03 |
而在无放回情况下,样本同分布但不独立,而且在实际抽样时,绝大多数是使用无放回抽样,这除了无放回抽样的成本低之外, 还有理论上的重要原因.下面的定理显示了样本均值在这两种抽样方式下的不同表现.我们有 定理1 设总体中个体总数(也称总体大小)为N ,样本容量为n( <
N )且总体有有限均值μ,方差σ2 ,则(i) ;
(ii) 当抽样是有放回时;
当抽样是无放回时. 其中即为的标准差. 定理1 的说明: 首先,由(i)和(ii)可见,样本均值的标准差至少比总体标准差缩小倍,因此从平均观点来说,增大样本容量可以降低抽样误差,达到控制随机误差的作用. 其次,比较 (ii)可知: 当n >
1 时,无放回抽样的样本均值的标准差较小,从而有较小的抽样误差,这就为使用无放回抽样的合理性找到理论根据. 最后,当 ,即n 比N 小得多时,(ii)式很接近,此时,可近似地将无放回抽样当作有放回的.
二、三个重要分布 为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计中的三个重要分布,即χ2 分布, t 分布, F 分布. 1. χ2 分布 设为独立标准正态变量,称随机变量 的分布为自由度n 的χ2分布,记为U ~χ2 ( n);
且变量U 有期望、方差: .χ2 ( n)分布的密度函数的图像如图所示. 2. t 分布 又若X 与Y 独立, X~ N (0,1), Y ~χ2 ( n),则称 的分布为自由度n 的t 分布,记为T~ t( n);
t( n)分布的密度函数图像如图所示. 3. F 分布 若U 与V 独立, U ~χ2 ( n), V~χ2 ( m ),则称 的分布为自由度( n, m )的F 分布,记为F~ F( n, m ). F( n, m )分布的密度函数图像如图所示. 注意到: t 分布关于纵轴对称,其密度函数图像与标准正态分布的密度函数图像类似,又χ2 分布与F 分布只取正值. 这三个分布都有表可查,例如: 对给定0 <
α<
1,常用表示相应分布的α分位点,即它们分别满足: , , . 对于α的不同值,从书末附表可查到α分位数的值. 由对称性易知: ;
又由F 分布定义可知: . 这两个公式,对于查分位数表是有用的. 最后要指出,χ2 分布有可加性, 即若 相互独立, ,则,此结果可由χ2 分布定义及归纳法加以证明,留给读者作为练习.
三、正态总体的抽样分布 假设是来自正态总体的样本,即它们是独立同分布的,皆服从分布.我们有 定理2 (i) ;
(ii) 与独立;
(iii) . 其中S2 为样本方差. 通常S2可用作总体方差σ2的估计,它与S, 构成最常用的统计量. 由定理2 的结论(i)知:样本均值有很好的性质,它的分布以总体均值μ为对称中心,但分散程度是总体的,也就是说,如以作μ 的估计,其估计精度要比用单个样本X1 作估计要高n 倍. 结论(ii)表明:在正态总体情形,两个重要统计量S2 与 是相互独立的;
结论(iii)表明,对正态总体来说,总体方差的估计S2 经过适当的变换后,其分布为χ2 ( n - 1),这对总体方差的统计推断是重要的. 该定理是正态总体统计推断的基础,因而是十分重要的,下面列举其应用. 例1 设是来自的样本,则随机变量 . 证令,则由定理2 知: , 且X 与Y 独立.由及t 分布定义即知 . 例2 设是来自, 是来自的两个独立样本,记, , , 则随机变量 . 证 使用χ2 变量的可加性及定理2 的(iii)知,又令,由定理2 的(i)知. 再使用定理2 的(ii)可知:与独立, 与独立,且因与独立,所以与独立, 与独立,因而(,) 与( , ) 独立, 由此即知U 与V 独立. 最后, 由及t分布定义即知T~t(n+m - 2). 例3 (续上例),记, , 则. 此例的证明留给读者作为练习. * 除了正态总体等少数例外, 对一般统计总体,精确的抽样分布多不易得到,为此常借助极限分布. 当一个统计量存在极限分布时,可用此极限分布作为近似的抽样分布,并称此极限分布为统计量的渐近分布,一类最重要的极限分布可通过中心极限定理导出. 设总体有有限均值μ及方差σ2 , 是样本,则由中心极限定理,当n→∞,有,因此统计量 有渐近分布. 例4 某镇有25