数据缺失想要补齐有什么方法，用spss的替换缺失值和缺失值分析完全不会用

替换缺失值无论我用序列均值还是临近点均值等等插入的都是不合适的同一个值。

推荐答案 2020-04-12

1、均值插补。数据的属性分为定距型和非定距型。如果缺失值是定距型的，就以该属性存在值的平均值来插补缺失的值；如果缺失值是非定距型的，就根据统计学中的众数原理，用该属性的众数(即出现频率最高的值)来补齐缺失的值。

2、利用同类均值插补。同均值插补的方法都属于单值插补，不同的是，它用层次聚类模型预测缺失变量的类型，再以该类型的均值插补。假设X=（X1，X2...Xp）为信息完全的变量，Y为存在缺失值的变量。

那么首先对X或其子集行聚类，然后按缺失个案所属类来插补不同类的均值。如果在以后统计分析中还需以引入的解释变量和Y做分析，那么这种插补方法将在模型中引入自相关，给分析造成障碍。

3、极大似然估计（Max Likelihood ，ML）。在缺失类型为随机缺失的条件下，假设模型对于完整的样本是正确的，那么通过观测数据的边际分布可以对未知参数进行极大似然估计（Little and Rubin）。

这种方法也被称为忽略缺失值的极大似然估计，对于极大似然的参数估计实际中常采用的计算方法是期望值最大化(Expectation Maximization，EM）。

4、多重插补（Multiple Imputation，MI）。多值插补的思想来源于贝叶斯估计，认为待插补的值是随机的，它的值来自于已观测到的值。具体实践上通常是估计出待插补的值，然后再加上不同的噪声，形成多组可选插补值。根据某种选择依据，选取最合适的插补值。

扩展资料

缺失值产生的原因很多，装备故障、无法获取信息、与其他字段不一致、历史原因等都可能产生缺失值。一种典型的处理方法是插值，插值之后的数据可看作服从特定概率分布。另外，也可以删除所有含缺失值的记录，但这个操作也从侧面变动了原始数据的分布特征。

对于缺失值的处理，从总体上来说分为删除存在缺失值的个案和缺失值插补。对于主观数据，人将影响数据的真实性，存在缺失值的样本的其他属性的真实值不能保证，那么依赖于这些属性值的插补也是不可靠的，所以对于主观数据一般不推荐插补的方法。插补主要是针对客观数据，它的可靠性有保证。

参考资料来源：百度百科-不确定性数据

参考资料来源：百度百科-缺失值

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/eD0BrnnjernenIeBjn.html

其他回答

第1个回答推荐于2017-09-07

如果缺失值只占数据的5%不到，那么缺失值对数据的影响不大，各种缺失处理方式差异不大，简单点处理就好，比如均值填补，或者索性直接删除有缺失的个案，但均值填补无法利用缺失数据里面可能含有的有效信息，而删除个案有可能导致对数据的结构产生不利影响（比如绩效考核的时候不合格者没有成绩，形成缺失，这样删掉缺失就会让数据缺乏代表性，只有合格者，没有不合格者）。相较于均值填补，回归填补法要更准确一些（这只限于并非大量缺失的情况，否则回归也会产生有偏的估计

如果确实数量较大，建议用EM算法，有不少研究者通过模拟研究表明这种填补法得到的结果最为准确，其操作是spss菜单里选择分析——缺失值分析，会弹出下面这个对话框

然后将需要填补缺失的数据选入右边的变量框（要注意变量类型），然后在估计方法那里选EM，然后点击EM按钮，将填补后的数据保存为新数据集就OK

追问

谢谢你我会采纳你的但是请问一下是将需要填补的数据选到哪个框？定量还是分类呀
这样的方法是不是只适用于缺失处空行或空格？如果是没空行是不是查不出这里缺失数据不连续？

追答

如果你缺的是连续变量，就把数据选入定量变量里面（一般的问卷题目都是算定量的），如果是分类变量，就选到分类变量（分类变量的数值没有实际意义，只是为了将不同的水平区分开，比如性别就属于分类变量，赋予它们数值并不表示谁高谁低），但是一般情况下，如果性别信息缺失，是不需要填补的，因为填补了意义也不大，比如男1女0的情况下，缺失填补后出现一个0.8，那这没法算。
只要是有缺失，都可以用这个方法填补，spss会自动给你填好，不需要手动查找缺失。

本回答被提问者采纳

相似回答

数据缺失想要补齐有什么方法,用spss的替换缺失值和缺失值分析完全不会...答：1. 均值插补是处理定距型数据缺失值的一种方法，它通过计算存在值的平均值来估计缺失的数据。对于非定距型数据，则常用众数——即出现频率最高的值——来填补缺失。2. 同类均值插补则是在均值插补的基础上，通过聚类分析确定数据点所属的类别，然后使用该类别的平均值来插补缺失值。这种方法先对解释变...

如何将SPSS的数据补全?答：2、我们在菜单栏依次点击“转换”、“替换缺失值”。3、之后会弹出“替换缺失值”对话框。我们将生物字段点选入右侧选框。可以根据个人需要重新命名名称。4、之后在查看器中可以看到对于缺失值的描述及处理方法。5、返回SPSS主界面，可以看到新增的一列数据，对于缺失值已经进行了补充。

如何使用SPSS处理缺失数据Missing Data?答：处理缺失数据的另外一种替代方法为多重替代法，即从相似情况中或根据后来在可观测的数据上得到的缺省数据的分布情况给每个缺省数据赋予一个模拟值。具体的操作步骤为，依次点击菜单栏“转换-替换缺失值”，然后就会弹出【替换缺失值】设置窗口。我们首先把左侧框内需要替换缺失值的变量拖入右侧的“新变量”...

SPSS如何处理缺失值答：解决方法：重新正确设置来解决此问题。如下参考：1.以下表为例，生物成绩中存在缺失值，由于样本量不大，很有可能直接将缺失值去除，这将影响最终的结果。2.在菜单栏中，依次点击“转换”和“替换缺失的值”。3.“替换丢失的值”对话框将在稍后弹出。我们选择生物场点到右边的选框。可根据个人需要重新...

大家正在搜

spss缺失值填补方法在spss中有缺失值怎么办 spss中缺失值是什么意思 spss缺失值替换 spss怎么寻找缺失值的位置 spss数据缺失值处理阵列数据缺失补齐的原则 spss数据缺失面板数据缺失补齐命令