一元线性回归拟合的原则

如题所述

推荐答案 2022-12-15

一元二次回归模型拟合方法一、一元线性回归模型引入从简单的一元线性回归开始。这里，我们以房屋面积（x）与房屋价格（y）为例，显而易见，二者是一种线性关系，房屋价格正比于房屋面积，我们假设比例为w：y ^ = w ∗ x \hat{y} = w * x y^=w∗x然而，这种线性方程一定是过原点的，即当x为0时，y也一定为0。这可能并不符合现实中某些场景。为了能够让方程具有更广泛的适应性，我们这里再增加一个截距，设为b，即之前的方程变为：y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b而以上方程，就是我们数据建模的模型。方程中的w与b，就是模型的参数。假定数据集如下：线性回归是用来解释自变量与因变量之间的关系，但是，这种关系并非严格的函数映射关系。从数据集中，我们也看到了这一点。相同面积的房屋，价格并不完全相同，但是，也不会相差过大。二、下一步目的，去学习（确定）w与b的值我们现在的目的就是，从现有的数据（经验）中，去学习（确定）w与b的值。一旦w与b的值确定，我们就能够确定拟合数据的线性方程，这样就可以对未知的数据x（房屋面积）进行预测y（房屋价格）。1. 引入权重eg. 房屋价格会随着房屋面积改变而改变，也符合常规认识，我们认为房屋面积越大，房屋价格越高。对于这种线性关系，接下来我们就可以去建立这个函数的模型。对于这个线性的模型，可以表示为x y 之间有一定的比例。这个时候我们可以建立这样的关系，建立这样的模型。模型就是一个映射，一个函数，通过历史数据，建立一个模型，一个函数。Y = f(x) ，法则，成比例，法则我们不知道，可以先预设出来，用w表示比例，表示法则，W*x；W表示我们这个x的比例关系，W ：weight 权重应用的房屋价格这个例子：Y就是房屋的价格， x就是面积，所以可以把比例认为是房屋的单价；单价不知道，应该从我们数据集中求出来，因为模型要靠历史数据集建立出来。值是多少不知道，我们需要传递历史数据集
我们要把W学出来，y=100*x，学出来后，对于未知的x，我们也能够进行求y。咱们就能够建立这样的模型：y = w ∗ x y = w*xy=w∗x注意：预测的我们一般用 y_hat ，y上面有帽子，预测值 y_hat；而y通常表示我们真实的数据。我们有一个小小的疑问：有一点不足的地方：这个模型建立起来了，不管w取什么 y一定过原点。所以引入偏置b (bias)举例打车eg. 打车打车有一个里程，里程和价格也是有一种固定的比例，这个线性的关系：Y随着里程的变化而变化；W可以看成每公里的价格；但是打车有一个起步价，所以很多场景中，模型不一定过原地，我们可以在后面加上一个偏置b，如果线过原点， b为0就行了。这样我们就能把线性回归更通用的模型建立起来了。房屋的取暖费eg. 房屋的取暖费也有起步价，而不是简单的房屋的面积和最终价格。y ^ = w ∗ x + b \hat{y} = w*x + by^=w∗x+b通过历史数据的训练，w和b就能学出来了，以后遇到未知的数据，也能学出来了。这就体现了预测。2. 引入噪声有一个重要的概念噪声。因为在我们真实的场景中，不见得数据都是线性关系，可能和真实场景有偏差。也就是不是严格函数的映射关系；换一种说法：是一种线性，但不是完全的函数式线性关系。eg. 跳远 Y = f(x)Y 跳远的距离X 同学只要是同一个同学，跳远距离能相同吗？当然做不到。X 相同 y不一定相同。但是偏差也不会太大，不会特别明显。三、从回归分析到线性回归1. 回归分析回归分析是用来评估变量之间关系的统计过程。用来解释自变量X与因变量Y的关系。即当自变量X发生改变时，因变量Y会如何发生改变。自变量，因变量是 x ， y；建立这样的映射关系用来解释自变量x与因变量y的关系2. 线性回归回归分析的一种，评估自变量X与因变量Y之间是一种线性关系。当只有一个自变量时，称为一元线性回归，当具有多个自变量时，称为多元线性回归。
线性关系的理解，2个点：画出来的图像是直的。每个自变量的最高次项为1。线性回归，是一种特殊的回归分析；特殊之处在于： x y 之间是线性关系eg. y = 2x + 1几个特点：图像是直的，最高次项是1；换个角度讲，只有1次方不弯。y=f(x)，X其实是一个向量，它含有很多值，x1 x2 x3 x4…，可以有很多个eg. 身高，体重等等；每一个都是x值线性回归还可以根据x的数量进行划分为：X只有1个的：即是一元线性回归（一元就是一个自变量）X如果有很多个的：即是多元线性回归四. 拟合FittingFit拟合，是指构建一种算法（数学函数），使得该算法能够符合真实的数据。从机器学习角度讲，线性回归就是要构建一个线性函数，使得该函数与目标值之间的拟合性最好。从空间的角度来看，就是要让函数的直线（面），尽可能穿过空间中的数据点。线性回归会输出一个连续值。解释拟合：从空间角度来说，这些真实点都不一定在这条线上，而是尽可能靠近，穿过。这是二维的，不一定都是二维有可能是三维，如3个轴的体。什么是拟合？函数的输出值，就要尽可能和真实值进行匹配；Y有一系列值，Y尽可能靠近真实值，尽可能去切合真实值，这个过程，就是拟合过程。引入，对于一个目标的数据，要产生一个模型，一个算法，一个函数不是一个匹配就完事了，只预测一个不行；拟合，不是完全能和真实值一致。
￥
5.9
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
一元二次回归模型拟合方法
一元二次回归模型拟合方法
一、一元线性回归模型引入
从简单的一元线性回归开始。这里，我们以房屋面积（x）与房屋价格（y）为例，显而易见，二者是一种线性关系，房屋价格正比于房屋面积，我们假设比例为w：
y ^ = w ∗ x \hat{y} = w * x y^=w∗x
然而，这种线性方程一定是过原点的，即当x为0时，y也一定为0。这可能并不符合现实中某些场景。为了能够让方程具有更广泛的适应性，我们这里再增加一个截距，设为b，即之前的方程变为：
第 1 页
y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b
而以上方程，就是我们数据建模的模型。方程中的w与b，就是模型的参数。
假定数据集如下：
线性回归是用来解释自变量与因变量之间的关系，但是，这种关系并非严格的函数映射关系。从数据集中，我们也看到了这一点。相同面积的房屋，价格并不完全相同，但是，也不会相差过大。
二、下一步目的，去学习（确定）w与b的值

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/TTnn0DInBTBrjnBBIn.html

相似回答

大家正在搜