回归方程是根据样本资料通过
回归分析所得到的反映一个变量(因变量)对另一个或一组变量(
自变量)的回归关系的数学表达式。回归直线方程用得比较多,可以用
最小二乘法求回归直线方程中的a,b,从而得到回归直线方程。回归线方程公式是:b=((x1+x2+...+xi)(y1+y2+..+yi)-nxy)/(x1^2+x2^2+...+xi^2-n*(x^2))a=y-bxx,y为
平均数求回归线
方程式需根据公式:Yi-y^=Yi-a-bXi,再代入具体的数据即可,回归线方程式一般指的是回归直线方程,指在一组具有相关关系的变量的数据(x与Y)间,反映x与y之间的关系直线。其中离差作为表示Xi对应的回归直线纵坐标y与观察值Yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述,而总离差不能用n个离差之和来表示,通常是用离差的平方和。
回归线方程:y=bx+a
回归直线的原理。如果
散点图中点的分布从整体看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系。以下图为例
先求 x、y 的平均数 x_=(3+4+5+6)/4=9/2,y_=(2.5+3+4+4.5)/4=7/2,然后求对应的 x、y 的乘积之和 :3*2.5+4*3+5*4+6*4.5=66.5 ,x_*y_=63/4 ,接着计算 x 的平方之和:9+16+25+36=86,x_^2=81/4 ,现在可以计算 b 了:b=(66.5-4*63/4) / (86-4*81/4)=0.7 ,而 a=y_-bx_=7/2-0.7*9/2=0.35 ,所以回归线方程为 y=bx+a=0.7x+0.35 。
建模步骤:
A,理论模型的设计: a,选择变量b,确定变量关系c,拟定参数范围
B,样本数据的收集: a,数据的类型b,数据的质量
C,样本参数的估计: a,模型的识别b,估价方法选择
D,模型的检验
a,经济意义的检验:1、正相关;2、反相关等等
b,统计检验:1、检验样本回归函数和样本的拟合优度;2、样本回归函数和总体回归函数的接近程度:单个解释变量显著性即
t检验,函数显著性即
F检验,接近程度的区间检验
c,模型预测检验:1、解释变量条件条件均值与个值的预测测;2、预测置信空间变化
d,参数的线性约束检验:1、参数线性约束的检验;2、模型增加或减少变量的检验;3、参数的稳定性检验:邹氏参数稳定性检验,邹氏预测检验(主要方法是以F检验受约束前后模型的差异)
e,参数的非线性约束检验:1、最大似然比检验;2、沃尔德检验;3、
拉格朗日乘数检验(主要方法使用F 分布检验统计量分布特征)
f,计量经济学检验
1,异方差性问题:特征:无偏,一致但
标准差偏误。检测方法:图示法,Park与Gleiser检验法,Goldfeld-Quandt检验法,White检验法-------用WLS修正异方差
2,序列相关性问题:特征:无偏,一致,但检验不可靠,预测无效。检测方法:图示法,回归检验法,Durbin-Waston检验法,Lagrange乘子检验法-------用GLS或广义差分法修正序列相关性
3,
多重共线性问题:特征:无偏,一致但标准差过大,t减小,
正负号混乱。检测方法:先检验多重共线性是否存在,再检验多重共线性的范围-------------用逐步回归法,差分法或使用额外信息,增大样本容量可以修正。
4,随机解释变量问题:随机解释变量与随机干扰项独立,对OLS没有坏影响。随机变量与随机干扰项同期相关:有偏但一致,扩大样本容量可以克服。随机变量与随机干扰项同期相关:有偏且非一致,工具变量法可以克服