如何判定温度列数据中的缺失值和异常值?

如题所述

可以通过数据清洗与整理来判断,具体方法如下:
数据清洗:当发现数据中的缺失与异常值时进行数据处理。
第一步:检查原表——先检查原表是否是同样的数据
第二步:确认问题——检查此数据是如何收集而来,和业务团队确认
第三步:数据清洗——从技术角度评估该数据是否缺失/异常,以及如何进行处理
1、遇到数据缺失时,可以依次思考以下问题:缺失的信息来自于哪个数据表?在原表中它们也是缺失的吗?如果在原表也缺失,那么是否是有收集信息的疏漏?
当判定该数据为缺失值时,往往会通过python等工具进行缺失值填充
数据整理:为了能够进一步进行数据分析,将进行数据整理环节。
1、对数据进行统一的格式化和命名规则处理
2、对某些信息进行重新编码以满足后续分析需求。
温馨提示:答案为网友推荐,仅供参考
相似回答