统计学中的categorical and numerical data 怎么区分

如题所述

Numerical data 具有实际测量的物理意义,比如人的身高、体重、IQ、血压等等,统计学中,Numerical data也称作quantitative data,Numerical data又分为两种类型:

1、离散型数据(Discrete data)代表数量是可以被数出来的,它可能是有限的,也可能是无限的。比如掷硬币100次人头朝上的次数(次数范围为0到100,是有限的);又如,掷硬币直到有100次是人头朝上的次数(次数范围为100到无穷大,是无限的)。

2、连续数据代表测量的结果是不能被数出来的,它只能被区间所描述。比如桶里有20L水,随机倒掉一部分,剩余的水量为[0,20]区间内的某一个值,9.4L,9.41L,9.416789L等等,任何在[0,20]区间内的值都有可能。

Categorical data代表了被描述对象的性质,比如一个人的性别、婚姻状况、家乡等等, Categorical data 可以用Numerical data来表示,比如说描述性别时,1代表男,2代表女,但是这些数据并没有数学意义,你不能拿他做运算。Categorical data也叫作qualitative data或是Yes/No data。

作者:常智超

链接:https://www.zhihu.com/question/41484616/answer/125883830

来源:知乎

参考资料

知乎:https://www.zhihu.com/question/41484616/answer/125883830

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-09-18
categorical data是指分类数据:数据类型为:男女、班级(一班、二班)、省份(河北、江苏等),若使用赋值法给变量赋值,例如(男=1,女=0),数字1,0之间没有大小之分,不能认为1是比0大的。
numerical data是指数值型数据:收入(1000元,500元),是可以进行比较大小并进行运算的数据。本回答被提问者采纳
相似回答