TAN分类器的分类性能明显优于naive 贝叶斯分类器。其基本思想是放宽naive 贝叶斯分类器中的独立性假设,贝叶斯分类器朴素贝叶斯分类器、贝叶斯原理、贝叶斯分类和朴素贝叶斯之间存在差异,贝叶斯原理是最大的概念,它解决了概率论中的“反向概率”问题,基于这个理论,人们设计了贝叶斯分类器,朴素贝叶斯分类是贝叶斯分类器,也是最简单的。

斯分类器,Naive 贝叶斯分类器

斯分类器,Naive 贝叶斯分类器

朴素贝叶斯基于贝叶斯定理,使用概率模型进行分类。Naive 贝叶斯分类器实际上是一种算法对人们常识的完善。但贝叶斯算法也存在一些缺点,如:训练集中选取的特征值决定了贝叶斯分类器的性能,如果选取的特征值不完整或存在大量噪声,分类效果会很差;此外,贝叶斯算法假设每个特征是独立的。

扩展朴素贝叶斯的结构,借鉴贝叶斯网络中表示依赖关系的方法,贝叶斯分类器是通过概率统计得到的,神经网络和神经网络都需要训练才能得到相应的分类函数。如果非要说区别,那就是结构上的区别。神经网络由高阶级数或几何空间逼近,无数个节点构成了非常复杂的数据关联。以垃圾邮件分类为例,线性分类,

在与决策树比较的基础上,介绍了先验概率和后验概率的关系,并详细介绍了朴素贝叶斯算法的流程。它使用更精确的量化来判断分类,使用的方法是后验概率,所谓分类问题就是我们可以在数据的自变量X空间中找到一些决策边界,用不同的标号将数据分开。如果通过某种方法找到的这些判定边界在自变量X空间中是线性的,那么这种方法被称为线性分类器。


文章TAG:贝叶斯  分类  朴素  器中  原理  
下一篇