一元线性回归拟合的原则

如题所述

一元二次回归模型拟合方法一、一元线性回归模型引入从简单的一元线性回归开始。这里,我们以房屋面积(x)与房屋价格(y)为例,显而易见,二者是一种线性关系,房屋价格正比于房屋面积,我们假设比例为w:y ^ = w ∗ x \hat{y} = w * x y^=w∗x然而,这种线性方程一定是过原点的,即当x为0时,y也一定为0。这可能并不符合现实中某些场景。为了能够让方程具有更广泛的适应性,我们这里再增加一个截距,设为b,即之前的方程变为:y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b而以上方程,就是我们数据建模的模型。方程中的w与b,就是模型的参数。假定数据集如下:线性回归是用来解释自变量与因变量之间的关系,但是,这种关系并非严格的函数映射关系。从数据集中,我们也看到了这一点。相同面积的房屋,价格并不完全相同,但是,也不会相差过大。二、下一步目的,去学习(确定)w与b的值我们现在的目的就是,从现有的数据(经验)中,去学习(确定)w与b的值。一旦w与b的值确定,我们就能够确定拟合数据的线性方程,这样就可以对未知的数据x(房屋面积)进行预测y(房屋价格)。1. 引入权重eg. 房屋价格会随着房屋面积改变而改变,也符合常规认识,我们认为房屋面积越大,房屋价格越高。对于这种线性关系,接下来我们就可以去建立这个函数的模型。对于这个线性的模型,可以表示为x y 之间有一定的比例。这个时候 我们可以建立这样的关系,建立这样的模型。模型就是一个映射,一个函数,通过历史数据,建立一个模型,一个函数。Y = f(x) ,法则,成比例,法则我们不知道,可以先预设出来,用w表示比例,表示法则,W*x;W表示我们这个x的比例关系,W :weight 权重应用的房屋价格这个例子:Y就是房屋的价格, x就是面积,所以可以把比例认为是房屋的单价;单价不知道,应该从我们数据集中求出来,因为模型要靠历史数据集建立出来。值是多少不知道,我们需要传递历史数据集
我们要把W学出来,y=100*x,学出来后,对于未知的x,我们也能够进行求y。咱们就能够建立这样的模型:y = w ∗ x y = w*xy=w∗x注意:预测的我们一般用 y_hat ,y上面有帽子,预测值 y_hat;而y通常表示我们真实的数据。我们有一个小小的疑问:有一点不足的地方:这个模型建立起来了,不管w取什么 y一定过原点。所以引入偏置b (bias)举例打车eg. 打车打车有一个里程,里程和价格也是有一种固定的比例,这个线性的关系:Y随着里程的变化而变化;W可以看成每公里的价格;但是打车有一个起步价,所以很多场景中,模型不一定过原地,我们可以在后面加上一个偏置b,如果线过原点, b为0就行了。这样我们就能把线性回归更通用的模型建立起来了。房屋的取暖费eg. 房屋的取暖费也有起步价,而不是简单的房屋的面积和最终价格。y ^ = w ∗ x + b \hat{y} = w*x + by^=w∗x+b通过历史数据的训练,w和b就能学出来了,以后遇到未知的数据,也能学出来了。这就体现了预测。2. 引入噪声有一个重要的概念噪声。因为在我们真实的场景中,不见得数据都是线性关系,可能和真实场景有偏差。也就是不是严格函数的映射关系;换一种说法:是一种线性,但不是完全的函数式线性关系。eg. 跳远 Y = f(x)Y 跳远的距离X 同学只要是同一个同学,跳远距离能相同吗?当然做不到。X 相同 y不一定相同。但是偏差也不会太大,不会特别明显。三、从回归分析到线性回归1. 回归分析回归分析是用来评估变量之间关系的统计过程。用来解释自变量X与因变量Y的关系。即当自变量X发生改变时,因变量Y会如何发生改变。自变量,因变量 是 x , y;建立这样的映射关系用来解释自变量x与因变量y的关系2. 线性回归回归分析的一种,评估自变量X与因变量Y之间是一种线性关系。当只有一个自变量时,称为一元线性回归,当具有多个自变量时,称为多元线性回归。
线性关系的理解,2个点:画出来的图像是直的。每个自变量的最高次项为1。线性回归,是一种特殊的回归分析;特殊之处在于: x y 之间 是 线性关系eg. y = 2x + 1几个特点:图像是直的,最高次项是1;换个角度讲,只有1次方不弯。y=f(x),X其实是一个向量,它含有很多值,x1 x2 x3 x4…,可以有很多个eg. 身高,体重等等;每一个都是x值线性回归还可以根据x的数量进行划分为:X只有1个的: 即是一元线性回归(一元就是一个自变量)X如果有很多个的:即是多元线性回归四. 拟合FittingFit拟合,是指构建一种算法(数学函数),使得该算法能够符合真实的数据。从机器学习角度讲,线性回归就是要构建一个线性函数,使得该函数与目标值之间的拟合性最好。从空间的角度来看,就是要让函数的直线(面),尽可能穿过空间中的数据点。线性回归会输出一个连续值。解释拟合:从空间角度来说,这些真实点都不一定在这条线上,而是尽可能靠近,穿过。这是二维的,不一定都是二维有可能是三维,如3个轴的体。什么是拟合?函数的输出值,就要尽可能和真实值进行匹配;Y有一系列值,Y尽可能靠近真实值,尽可能去切合真实值,这个过程,就是拟合过程。引入,对于一个目标的数据,要产生一个模型,一个算法,一个函数不是一个匹配就完事了,只预测一个不行;拟合,不是完全能和真实值一致。

5.9
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
一元二次回归模型拟合方法
一元二次回归模型拟合方法
一、一元线性回归模型引入
从简单的一元线性回归开始。这里,我们以房屋面积(x)与房屋价格(y)为例,显而易见,二者是一种线性关系,房屋价格正比于房屋面积,我们假设比例为w:
y ^ = w ∗ x \hat{y} = w * x y^=w∗x
然而,这种线性方程一定是过原点的,即当x为0时,y也一定为0。这可能并不符合现实中某些场景。为了能够让方程具有更广泛的适应性,我们这里再增加一个截距,设为b,即之前的方程变为:
第 1 页
y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b
而以上方程,就是我们数据建模的模型。方程中的w与b,就是模型的参数。
假定数据集如下:
线性回归是用来解释自变量与因变量之间的关系,但是,这种关系并非严格的函数映射关系。从数据集中,我们也看到了这一点。相同面积的房屋,价格并不完全相同,但是,也不会相差过大。
二、下一步目的,去学习(确定)w与b的值
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜