算法有哪些特点？并一一举例说明？

如题所述

推荐答案 2019-05-06

1.决策树
优点：　
计算量简单，可解释性强，比较适合处理有缺失属性值的样本，能够处理不相关的特征；
擅长对人、地点、事物的一系列不同特征、品质、特性进行评估
缺点：
容易过拟合（后续出现了随机森林，减小了过拟合现象）,使用剪枝来避免过拟合；
适用数据范围：
数值型和标称型
CART分类与回归树:
决策树分类方法，采用基于最小距离的基尼指数估计函数，用来决定由该子数据集生成的决策树的拓展形。决策树回归方法，采用切分点与切分变量来计算的损失来估计函数。如果目标变量是标称的，称为分类树；如果目标变量是连续的，称为回归树。分类树是使用树结构算法将数据分成离散类的方法。
优点:
非常灵活，可以允许有部分错分成本，还可指定先验概率分布，可使用自动的成本复杂性剪枝来得到归纳性更强的树,产生的分类规则易于理解，准确率较高。
缺点：
在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。此外，C4.5只适合于能够驻留于内存的数据集，当训练集大得无法在内存容纳时程序无法运行。
2.随机森林
特点：
准确率可以和Adaboost相媲美，对错误和离群点更鲁棒。准确率依赖于个体分类器的实力和它们之间的依赖性。理想情况是保持个体分类器的能力而不提高它们的相关性。对每次划分所考虑的属性数很敏感。通常选取logn2+1个属性，其中n是数据集的实例数。（一个有趣的观察是，使用单个随机选择的属性可能导致很好的准确率，常常比使用多个属性更高。）
场景举例：用户流失分析、风险评估
优点：
不易过拟合，可能比Bagging和Boosting更快。由于在每次划分时只考虑很少的属性，因此它们在大型数据库上非常有效。有很好的方法来填充缺失值，即便有很大一部分数据缺失，仍能维持很高准确度。给出了变量重要性的内在估计，对于不平衡样本分类，它可以平衡误差。可以计算各实例的亲近度，对于数据挖掘、检测离群点和数据可视化非常有用。
随机森林方法被证明对大规模数据集和存在大量且有时不相关特征的项（item）来说很有用
缺点：
在某些噪声较大的分类和回归问题上会过拟合。对于有不同级别的属性的数据，级别划分较多的属性会对随机森林产生更大的影响，所以随机森林在这种数据上产生的属性权值是不可信的。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/erBT0ZDnnn0jIZTreZ.html

相似回答

程序员都应该精通的六种算法,你会了吗?答：迭代法也称辗转法，是一种不断用变量的旧值递推新值的过程。迭代算法是用计算机解决问题的一种基本方法，它利用计算机运算速度快、适合做重复性操作的特点，让计算机对一组指令(或一定步骤)进行重复执行，在每次执行这组指令(或这些步骤)时，都从变量的原值推出它的一个新值。最终得到问题的结果。迭代...

C语言算法有哪些 并举例和分析答：*第二最短路径:每举最短路径上的每条边,每次删除一条,然后求新图的最短路径,取这些路径中最短的一条即为第二最短路径。*同理,第n最短路径可在求解第n-1最短路径的基础上求解。三、背包问题*部分背包问题可有贪心法求解:计算Pi/Wi数据结构:w[i]:第i个背包的重量;p[i]:第i个背包的价值; 1.0-1背...

跪求:路由器算法及它们的特点答：网络上的设备看不到网桥的存在,设备之间的通信就如同在一个网上一样方便。由于网桥是在数据帧上进行转发的,因此只能连接相同或相似的网络(相同或相似结构的数据帧),如以太网之间、以太网与令牌环(token ring)之间的互连,对于不同类型的网络(数据帧结构不同),如以太网与X.25之间,网桥就无能为力了。网桥扩大了...

DES和AES算法的比较,各自优缺点有哪些?答：一、数据加密标准不同 1、DES算法的入口参数有三个：Key、Data、Mode。其中Key为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密。2、AES的基本要求是，采用对称分组密码体制，密钥的长度最少支持为128、192、256，分组...

大家正在搜

艺术的特征有哪些举例说明二分查找算法举例说明利息的算法举例说明联系的特点举例说明举例说明屈折语的主要特点举例说明孤立语的特点举例说明语言演变的特点算理和算法举例算法有哪些