统计学中,定性变量怎么转化成定量变量

如题所述

将定量变量转换为定性变量的方法为:分区间(Binning),包括等宽分区间以及自适应分区间。

1、等宽分区间(Fixed-Width Binning):可以用pandas的cut()方法自己设定区间范围。

等宽分区间的缺点是:落在某个区间中的数据点的数目不一定是均匀的,因此可能会得到不规则的区间。一些区间中的数据可能会非常的密集,一些区间则会非常稀疏甚至是空的。因此,自适应分区间方法是一个更安全的策略。

2、自适应分区间(Adptive Binning):使用数据的四分位数来确定区间范围,这样确保每个区间内的数据个数是相同的。

扩展资料

要对定量变量进行转换的原因:大多数情况下,可以直接使用定量变量。但是有时候,特征和目标之间不呈线性关系。比如说年龄和收入之间的关系,当人年轻时,收入通常会稳步上升,但到了一定年纪之后,收入便开始降低。

当然可以用非线性模型来拟合数据,但是这样会把模型弄得很复杂。因此比较好的做法是在数据准备的阶段就对定量变量做分箱处理(Binning,也称为分区间)。在对定量变量分箱处理之后,还要再将其转换为虚拟变量或对其进行WOE转换

参考资料来源:

百度百科——定性变量

百度百科——定量变量

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-07-06
需要设置虚拟变量,也叫哑变量。
第2个回答  2016-07-06
定性数据(Qualitative data):包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。
定性数据说明的是事物的品质特征,是不能用数值表示的,通常表现为类别.
定量数据说明的是现象的数量特征,是必须用数值来表现的.
分为离散数据(Discrete data)和连续数据 (Continuous numerical data) .
定性分析与定量分析应该是统一的,相互补充的;定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量分析使定性分析更加科学、准确,它可以促使定性分析得出广泛而深入的结论。本回答被提问者采纳
相似回答