编辑: 学冬欧巴么么哒 2019-11-19
** 讲座6.

1 参数估计问题 本讲座导学 实际中, 大多数随机现象(总体)的类型可以知道, 只是其中的参数未知. 利用样本估计参数的问题称为参数估计. 有两种基本方法: 一个是点估计, 以某一样本的统计量作为参数的估计值;

另一个是区间估计, 就是把总体数字特征确定在两个统计量之间. 重点:(1) 了解参数估计问题 (2) 了解估计量常用的三个评选标准 1-估计问题

一、估计问题基本提法 1. 总体分布结构已知, 估计参数问题 这种情况下, 是已知总体的分布函数结构或概率分布密度函数, 但其中的参数未知, 如何由样本(观察值)去估计参数? 譬如, 已知随机变量, 如何由去估计其中的参数;

再如已知随机变量, 如何由估计? 另一种情形是 2. 总体的分布未知, 估计参数问题 通常就是估计数学期望和方差. 可作某的数学期望的估计值;

,可作的方差的估计值 解决思想: (1) 点估计;

(2) 区间估计;

二、估计量的优劣 1. 一致估计 设, 是的某种估计 若对任意, 当时, 有 则称 为参数的一致估计. 2. 无偏估计 设, 为真的某种估计, 若, 则称 为参数的无偏估计. 注: 中的一般省略. 例1-1 设总体, 取个样本 [注都服从], 则(1) 是无偏估计;

(2) 是的无偏估计. 证(1) ;

(2) ;

另外 和 代入得 是无偏估计. 一般设总体为, 取n 个样本, 则(1) 是的无偏估计;

(2) 是无偏估计. 例1-2 设和是从总体中取得的两个(组)独立样本, 则(1) 是的无偏估计;

(2) 是无偏估计. 其中意义同上. 一般有 (1) 是的无偏估计;

(2) 是无偏估计. 3. 有效估计 设和都是无偏估计(即和), (1) 若, 则称是比有效的估计;

(2) 若, 则称是有效估计. 能证: 是总体的的有效估计量;

例1-3 证明 (1)和都是无偏估计 (2) 比较它们之间的有效性. (上式) 证(1) , 和 故都是的无偏估计 (2) 和.利用 (如), 可得 , 所以有效. 例1-4 (1) 当较大时, 可以把样本均值作为正态变量来处理. (2) 统计量是方差的无偏估计. (3) 样本均值是总体均值的无偏估计. (4) 统计量是方差的有偏估计. 5. 统计量是的无偏估计. 讲座6.2 参数的点估计法 本讲座导学 本讲座是参数估计的第一种方法: 点估计, 通常也称矩法. 另一介绍的内容是最大似然估计法. (1) 会用点估计法(或称矩估计法)进行参数估计;

(2) 理解最大似然估计法;

重点:(1) 矩估计法的应用 (2) 最大似然估计法的应用 1-点估计(亦称矩法估计

一、矩(平均值)法 其核心思想为:样本矩随机变量矩 如一阶样本矩 例2-1某弯道事故数服从,已有采样值, 试估. 解 因为~, =, 用矩法估计得 = =[0*75+1*90+2*54+3*22+4*6+5*2+6*1]=1.22.

二、最大似然法 最大似然法的思想: 样本大多是发生概率较大的事件, 由此确定的参数, 应使之最大. 1. 连续型总体的参数估计的似然函数 设连续型总体服从~,其中常数为待估计的参数. 再设来自的独立样本观察值,则联合密度 只是的函数, 称=为样本的似然函数. 利用最大似然法思想, 求出使 的值. 2. 离散型总体的参数估计的似然函数 设离散型总体服从: ,其中常数为待估计的参数. 再设是来自X的独立样本观察值,则联合概率 也只是的函数, 称=为样本的似然函数,同理: 也是应该取使 的值. 即由 解得 称为参数的最大似然估计值. 3. 最大似然估计法的具体步骤 (1) 写出样本的似然函数, (2) 令或(称为对数似然方程), (3) 解方程, 求出. 例2-2 设~, 试由样本值, 用最大似然法, 导出参数估计公式. 解(1) 作似然函数 再作对数的似然函数 (2) 对参数求导, 得(( 例2-3 设电子管寿命服从~的分布, 现有样本观测值(单位小时):

16 29

50 68

100 130

140 270

280 340

410 450

520 620

190 210

800 1100;

利用最大似然法估计参数. 解 由例2, 得.

三、正态分布的最大似然估计公式 设~(,),,

未知,是来自的一个样本观测值, 求,的最大似然估计量. 因为的概率密度为 = 所以似然函数为 , 为方便后的运算, 再取对数函数 , 这是一个含两个参数的函数, 由多元函数取极值的必要条件, 得 解得 (**), 于是,的最大似然估计量为 . 例2-4 设总体服从指数分布, 为来自总体的样本观测值, 试求未知参数的点估计. 解 因为指数分布的, 而是的估计, 所以有 . 例2-5 设是来自总体的样本, 求(即数学期望)最大似然估计. 解 设样本观察值为: , 每个都取0或1, 对应概率是或, 可表示为 , . 作似然函数 , 再取对数 , 对求导, 且令为零, 得,解得, 所以这种类型的最大似估计值也等于通常的点估计. 例2-6 设是来自总体的样本, 求(数学期望)最大似然估计. 解 均匀分布的概率密度函数为. 设样本观察值为: , 作似然函数 , 这个似然函数不能用求导的方法确定极值点. 根据题意, 样本观察值都在上, 如下图所示 自然地, 对的估计是离最近的, 故取 作为的最大似然估计. 例2-7 设有8个来自N(μ,σ2)的样本观察值: 2.1349 -0.3312 3.2507 3.5754 0.7071 5.3818 5.3783 2.9247 用最大似然法, 估计参数μ,σ2. 解 代公式(**), 得μ=2.877, σ2=3.589. 讲座6.3 参数的区间估计法 本讲座导学 对于未知参数,除了求出它的点估计外,我们还希望能估计出一个范围, 并希望知道这个范围包含参数真值的可信程度,这样的范围通常以区间的形式给出, 这种形式的估计称为区间估计, 这样的区间即所谓置信区间, 本讲的基本要求是 1. 理解置信区间的基本概念;

2. 掌握正态总体均值和方差的置信区间的求法. 重点:(1) 置信区间的基本概念的理解 (2)正态总体均值和方差在给定置信水平条件下的置信区间的求法 1-方差已知的数学期望的区间估计

一、基本方法 设法寻找一个区间[, ] (其中的是来自于总体的独立的样本), 以概率盖住所要估计的参数, 即, 称 为置信区间;

为置信水平, 分别称为置信区间的置信下限和置信上限. 区间估计的优良标准: (1) 可靠性: 越大越可靠;

(2) 精确性: 越小越精确. 但这两个要求互为制约, 只能综合平衡. 给(常取5% 或1%), 求出估计值.

二、已知的数学期望的区间估计 1. 已知分布为正态 因为已知, 所以用来自于总体的样本, 作, 则有 , 中心化 后, 并作单位化 , 得标准正态分布 给定后, 求出相应分位点, 使,即为 , 也即的.(查标准正态分位点) 再由, 可得到置信度为的置信区间为 (*) 方法归纳: 1) 当给了后, 或给了置信度1?, 2) 查表, 求分位点, 3) 将观察值代入上式即得置信区间(置信度1?). 下面列出两个常用的(标准正态的)分位点. 1) ((;

2) ((. 例3-1 设某种节能灯的寿命服从~, 已知10个样本的均值为, 求置信度为95%的置信区间. 解由95%=1?(((及,,

代入(*), 得置信区间为 ( 2. 未知分布―利用近似的方法 (1) 利用 切贝谢夫不等式 估计 这是一个比较简单和 粗糙 的估计法, 利用 切贝谢夫不等式 估计, 方法如下. 设取自总体的个样本,作,则代入切贝谢夫不等式, 得 再由, 得 若要, 只要 , 从中可取出, 所以可得的估计区间为 , 可信度为. 即给出一个、()和, 代入以下(**), 立得可信度为的的区间估计 (**) 注 样本容量越大, 区间小(定位越 准 . 例3-2设已知灯寿的, ,样本容量10个, 观察均值, 求的置信区间, 即区间估计. 解 将和 代入得 (1147?4, 1147+4) = (1143, 1151). 置信度95%. (2) 大容量下, 利用 中心极限定理 中心极限定理 表明: 许多独立小因素之和为 正态分布 , 所以当容很大时, 可以认为, 这里的用样本方差代替, 并认可为已知的情形, 这样就可直接套用(*)来估计区间. 例3-3 设已获得100个某种新型节能灯的寿命数据的平均值, 样本方差,分布未知, 求置信度为95%的平均寿命的置信区间 (这里认为是大容量样本) . 解 由题意, 这里认可, 而且已知, 所以由, 得及, 将这些数据代入(*)式, 得置信区间为 ( 例3-4 设铁水含碳量~, 且, 现今实际测试了9炉样本, 样本平均4.484, 求可靠性为95%的的置信区间. 解 由题意得: (分位点仍是, 代(**)得相应置信区间为 ( 2-方差未知的正态总体的数学期望的区间估计 这种情况就是在分布为, 方差未知的情形下, 求的置信区间. 用分布估计 因为, 由前第5讲中的结果, 知~, 其中. 具体用法: 1) 当给了或给了置信度1?后, 2) 查表, 求出分位点, 3) 根所概率, 也即概率 , 由此即得置信度为的区间估计: (***). 例3-5 新生儿体重~,今得12个数据 3100, 2520, 3000, 3000, 3600, 3160, 3560, 3320, 2880, 2600, 3400, 2540, 试以95%的置信度, 求的置信区间. 解 分位点, 样本均值和样本方差分别为: , , 代入(***)得: ( (2818, 3295).

3 正态总体-方差的区间估计 这里的问题是: 已知~, 不论是否已知, 求的区间估计. 由第5讲座中的统计推论, 得统计量服从 ~, 从而 ~, 用分布, 估计正态方差的区间估计的方法为 1) 给了或给了置信度1?后, 2) 由, 分别确定分位点和, 分位点由(确定, 分位点由确定, 3) 再由, 得.从而得置信区间为 (****). 例3-6 设测得新生儿体重~的12个数据为 3100, 2520, 3000, 3000, 3600, 3160, 3560, 3320, 2880, 2600, 3400, 2540, 试以95%的置信度(), 估计方差的置信区间. 解 这里已有, 由得分位点;

由得分位点, 另外计算得 代入(****)后得置信度为95%的置信区间为 ( (. 例3-7 某车间生产的滚珠直径服从正态分布, 已知其标准差是0.5, 在某一天的产品里随机抽取5个, 量得直径如下(单位:mm): 14.6 15.1 14.9 15.2 15.1, 试估计的置信区间(). 解,,

,,

代入(*)得例3-8 某钢丝厂的质量管理部门定期抽出一批钢缆作抗拉强度试验,经验表明,某种型号的钢缆其抗拉强度服从正态分布. 今从一批该种型号的钢缆中抽出16根组成一个样本组, 经试验后求得平均抗拉强度为3100千克, 样本标准差千克, 以95%的可靠性估计这批钢缆的平均抗拉强度的范围. 解 设抗拉强度, 其中未知, 另外由题意, 可得 , 查分布的双侧分位表, 所以代入(***)得.例3-9 设某矿石密度的测量误差服从正态分布,随机抽测12个样品, 且样本的标准差为,求的置信区间(). 解 这里已有, 由得分位点 ;

再由得分位点 , 另外计算得 代入(****)后得置信度为95%的的置信区间为 即. 第6讲 习题

一、是非题(对的, 打√, 错的, 打*) 1. 当较大时,........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题