编辑: 戴静菡 2019-06-03
多元线性回归的应用 李坦达

0811160005 一.

回归分析原理简述 1.多元线性回归分析模型 在实际中,常常会遇到一个因变量与多个自变量间数量关系的问题, 直线回 归分析模型无法解决这个问题,需要构造一个因变量与多个自变量间的线性数量 关系模型,其数学模型为: Y=β0+β1X1+β2X2+…+βmXm+ε ε~N(0,σ

2 ) 式中,βi ( i=0, 1, 2,…,m)称为偏回归系数,其意义为当其他自变量对应的因 变量的线性影响固定时,βi 反映了第i个自变量Xi 对因变量 Y线性影响的度量;

ε 表示回归值与测量值之间的误差.采用最小二乘法确定回归系数.对Y 和X1, X2, …,Xp 分别进行n 次独立观测, 取得样本 (Y1, Xi1,Xi2, …,Xip ) , i= 1, 2, …n, 则多元线性回归模型的矩阵形式为: 式中 设的估计值 β 的估计值为 ^ β ( ^ ^ ^

0 1

2 ....... , , ^ p b b b b )'

,Y 的估计量为 ( ^ Y ^ ^ ^

0 1 p y y y )'

,采用最小二乘法,得出多元线性回归模型:

1 2.多元线性回归模型的检验 当求出线性回归方程后, 还需对回归方程进行显著性检验,一般采用统计 方法对回归方程进行检验,如R检验,回归方程显著性的 F 检验,回归系数显著 性的 T 检验 (1)对回归方程的显著性检验是指检验假设 如果H0成立,说明不论 如何变化,y并不随之而 改变,显而易见,在这种情况下用模型(7)来表示y与 的关系是不和适的.如果H0不成立,说明 中至少有一个不等于零,从而y至 少随 中之一的变化而线性变化.因此, 对回归方程显著性检验是从整体上 看y与 是否存在 线性关系. 其中回归平方和 残差平方和 对于给定的显著性水平 α,当计算得到的 F 值满足 时, H0不成立, 认为在显著性水平α下, y与有显著的 线性关系,即回归方程是显著的.反之,则认为回归方程不显著. (2) R 检验. R 在这里被称为复相关系数或全相关系数,复相关系 R 的计算公式为 复相关系数 R 说明 x1 ~ xm 这一组影响因素与 Y 的相关程度. R 值越接近

1 , 说明利用多元线性回归的效果越好. (3) F 检验 F 检验是用来检验整个回归系数是否有意义.构造统计量 F 为:

2 F 服从第一自由度为 m ,第二自由度为 n - m -

1 的F分布,给定显著水平 A , 查F分布表得 FA ( m , n - m - 1) .如果 F >

FA ( m , n - m - 1) ,则认为 这一组回归系数有意义,可以利用所建立的多元线性回归预测模型进行预测;

否 则认为这一组回归系数无意义,所建立的多元回归模型不成立. (4) T 检验.它是用来对每个回归系数是否有意义进行的检验.构造统计量 T. 其中 cii 是矩阵( X′ X)主对角线的第 j 个元素, Tj 服从自由度为 n - m -

1 的分布.当给定显著水平 A ,如果 则认为 xi 对y有显著影响,否则认为无影响,应将相应的无影响因素去掉. (5)残差检验 残差是各观测值Yi与回归方程所对应得到的拟合值 之差,实际上,它是线 性回归模型中误差ε的估计值.ε~N (0 ,σ ^ Y

2 )即有零均值和常值方差 ,利用残 值的这种特性反过来考察原模型的合理性就是残差分析的基本思想. 因此残差应 该围绕零点随机出现,其期望应为 0. 二.适用问题 在我们探讨理论如何应用理论模型之前先分析一下哪类问题适合用线性回 归分析来解决. 人们经常会遇到一些处于同一个统一体中的变量 ,这些变量相互联系、相 互制约 ,客观上存在一定的关系. 但由于随机因素的影响 ,使变量之间的关系具 有某种不确定性 ,无法得到精确的关系表达式.这时人们往往用统计的方法 , 在大量的试验和观察中 ,寻找隐藏在随机变量后的统计规律性 ,即相关关系. 研 究变量间相关关系时所建立的数学模型及所作的统计分析称为回归分析建模 , 它主要包括以下内容: (1)从一组数据出发,建立有相关关系的变量间的经验公式;

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题
大家都在看的话题