数据分类的本质是什么

如题所述

数据分类调研分析的基础是数据,而数据的类型可以分为连续性的变量和分类变量。数据分类就是把具有某种共同属性或特征的数据归并在一起,

通过其类别的属性或特征来对数据进行区别。换句话说,就是相同内容、相同性质的信息以及要求统一管理的信息集合在一起,而把相异的和需要分别管理的信息区分开来,然后确定各个集合之间的关系,形成一个有条理的分类系统。

数据分类就是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。为了实现数据共享和提高处理效率,必须遵循约定的分类原则和方法,按照信息的内涵、性质及管理的要求,将系统内所有信息按一定的结构体系分为不同的集合,

从而使得每个信息在相应的分类体系中都有一个对应位置。换句话说,就是相同内容、相同性质的信息以及要求统一管理的信息集合在一起,而把相异的和需要分别管理的信息区分开来,然后确定各个集合之间的关系,形成一个有条理的分类系统。

数据分类的目的是根据新数据对象的属性,将其分配到一个正确的类别中。分类分析用预测方法预测给定数据对象的类标号,被广泛地应用到信誉证实、医疗诊断及选择购物等领域。

我们都知道调研分析的基础是数据,而数据的类型可以分为:连续性的变量:比如,身高,体重,化验值等等,这些变量的特点可以有小数点,可以直接录入;

分类变量:其变量值是定性的,表现为互不相容的类别或属性。实际上在调研当中运用最多的就是分类变量,可分为无序变量和有序变量两类。

无序分类变量是指所分类别或属性之间无程度和顺序的差别,例如二项分类,性别(男、女),药物反应(阴性、阳性)等。例如多项分类,血型( O、A、B、AB),职业(工、农、商、学、兵)等。

有序分类变量是指各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。

温馨提示:答案为网友推荐,仅供参考
相似回答