python中如何使用朴素贝叶斯算法

如何使用朴素算法 2022-06-04 18:06:35 285人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

这里再重复一下标题为什么是"使用"而不是"实现"：首先，专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。其次，对于数学不好的人来说，为了实现算法而去研究一堆公式是很痛苦的事情。再次，

这里再重复一下标题为什么是"使用"而不是"实现"：

首先，专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。

其次，对于数学不好的人来说，为了实现算法而去研究一堆公式是很痛苦的事情。

再次，除非他人提供的算法满足不了自己的需求，否则没必要"重复造轮子"。

下面言归正传，不了解贝叶斯算法的可以去查一下相关资料，这里只是简单介绍一下：

1.贝叶斯公式：

P(A|B)=P(AB)/P(B)

2.贝叶斯推断：

P(A|B)=P(A)×P(B|A)/P(B)

用文字表述：

后验概率=先验概率×相似度/标准化常量

而贝叶斯算法要解决的问题就是如何求出相似度，即：P(B|A)的值

3. 在scikit-learn包中提供了三种常用的朴素贝叶斯算法，下面依次说明：

1）高斯朴素贝叶斯：假设属性/特征是服从正态分布的(如下图)，主要应用于数值型特征。

查看图片

使用scikit-learn包中自带的数据，代码及说明如下：


>>>from sklearn import datasets ##导入包中的数据
>>> iris=datasets.load_iris() ##加载数据
>>> iris.feature_names  ##显示特征名字
 ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
>>> iris.data   ##显示数据
 array([[ 5.1, 3.5, 1.4, 0.2],[ 4.9, 3. , 1.4, 0.2],[ 4.7, 3.2, 1.3, 0.2]............
>>> iris.data.size  ##数据大小 ---600个
>>> iris.target_names  ##显示分类的名字 
 array(['setosa', 'versicolor', 'virginica'], dtype='<U10')
>>> from sklearn.naive_bayes import GaussianNB ##导入高斯朴素贝叶斯算法
>>> clf = GaussianNB()    ##给算法赋一个变量，主要是为了方便使用
>>> clf.fit(iris.data, iris.target)  ##开始分类。对于量特别大的样本，可以使用函数partial_fit分类，避免一次加载过多数据到内存

>>> clf.predict(iris.data[0].reshape(1,-1)) ##验证分类。标红部分特别说明：因为predict的参数是数组，data[0]是列表，所以需要转换一下
array([0])
>>> data=np.array([6,4,6,2])   ##验证分类
>>> clf.predict(data.reshape(1,-1))
array([2])

这里涉及到一个问题：如何判断数据符合正态分布？ R语言里面有相关函数判断，或者直接绘图也可以看出来，但是都是P(x,y)这种可以在坐标系里面直接

画出来的情况，而例子中的数据如何确定，目前还没有搞明白，这部分后续会补上。

2）多项式分布朴素贝叶斯：常用于文本分类，特征是单词，值是单词出现的次数。


##示例来在官方文档，详细说明见第一个例子
>>> import numpy as np
>>> X = np.random.randint(5, size=(6, 100)) ##返回随机整数值：范围[0,5) 大小6*100 6行100列
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB()
>>> clf.fit(X, y)
MultinomialNB(alpha=1.0, class_prior=None, fit_prior=True) 
>>> print(clf.predict(X[2]))
[3]

3）伯努力朴素贝叶斯：每个特征都是是布尔型，得出的结果是0或1，即出现没出现


##示例来在官方文档，详细说明见第一个例子
>>> import numpy as np
>>> X = np.random.randint(2, size=(6, 100))
>>> Y = np.array([1, 2, 3, 4, 4, 5])
>>> from sklearn.naive_bayes import BernoulliNB
>>> clf = BernoulliNB()
>>> clf.fit(X, Y)
BernoulliNB(alpha=1.0, binarize=0.0, class_prior=None, fit_prior=True) 
>>> print(clf.predict(X[2]))
[3]

补充说明：此文还不完善，示例一中也有部分说明需要写，最近事情较多，后续会逐渐完善。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，同时也希望多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: python中如何使用朴素贝叶斯算法

本文链接: https://lsjlt.com/news/13451.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python中如何使用朴素贝叶斯算法

这里再重复一下标题为什么是"使用"而不是"实现"：首先，专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。其次，对于数学不好的人来说，为了实现算法而去研究一堆公式是很痛苦的事情。再次，...

99+

2022-06-04

如何使用朴素算法
朴素贝叶斯算法的Python实现

注意：1、代码中的注释请不要放在源程序中运行，会报错。 2、代码中的数据集来源于http://archive.ics.uci.edu/ml/datasets/Car+Evaluation 3、对于朴素贝叶斯的原理，可以查看我的...

99+

2023-01-31

朴素算法贝叶斯
朴素贝叶斯和半朴素贝叶斯（AODE）分类器Python实现

　　一、概述　　机器学习最后一次实验，要求实现朴素贝叶斯和AODE的半朴素贝叶斯分类器。由于老师说可以调用现成的相关机器学习的库，所以我一开始在做朴素贝叶斯分类器的时候，直接调用了sklearn库，很方便，可是问题来了，在做AODE半朴素贝...

99+

2023-06-02
web算法中朴素贝叶斯如何实现文档分类

本篇内容主要讲解“web算法中朴素贝叶斯如何实现文档分类”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“web算法中朴素贝叶斯如何实现文档分类”吧!　　作业要求：　　实验数据在bayes_data...

99+

2023-06-02
Python机器学习应用之朴素贝叶斯篇

朴素贝叶斯（Naive Bayes，NB）：朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类，垃圾邮件的分类，信用评估，钓鱼网站检测等。 1、...

99+

2024-04-02
R语言朴素贝叶斯技术怎么使用

本篇内容主要讲解“R语言朴素贝叶斯技术怎么使用”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“R语言朴素贝叶斯技术怎么使用”吧!安装package：> install.packag...

99+

2023-06-19
Java利用朴素贝叶斯分类算法实现信息分类

目录贝叶斯分类算法代码实例数据集data.txt代码实现输出结果使用场景贝叶斯分类算法贝叶斯分类算法是统计学的一种分类方法，它是一类利用概率统计知识进行分类...

99+

2024-04-02
如何优化数据库的数据朴素贝叶斯

要优化数据库的数据朴素贝叶斯，可以考虑以下几点：数据清洗：确保数据质量高，包括去除重复数据、处理缺失值、处理异常值等。特征选择：选择合适的特征对模型进行训练，可以使用特征选择技术如方差分析、相关性分析等。数据标准化：对数据...

99+

2024-07-03

数据库
机器学习：朴素贝叶斯模型算法原理（含实战案例）

机器学习：朴素贝叶斯模型算法原理作者：i阿极作者简介：Python领域新星作者、多项比赛获奖者：博主个人首页 😊😊😊如果觉得文章不错或能帮助到你学习，可以点赞👍收藏📁评论📒+关注哦！👍👍👍...

99+

2023-09-04

机器学习人工智能 python 朴素贝叶斯开发语言
Python编程之基于概率论的分类方法：朴素贝叶斯

概率论啊概率论，差不多忘完了。基于概率论的分类方法：朴素贝叶斯 1. 概述贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理...

99+

2022-06-04

概率论朴素方法
python机器学习朴素贝叶斯算法及模型的选择和调优详解

目录一、概率知识基础1.概率2.联合概率3.条件概率二、朴素贝叶斯1.朴素贝叶斯计算方式2.拉普拉斯平滑3.朴素贝叶斯API三、朴素贝叶斯算法案例1.案例概述2.数据获取3.数据处理...

99+

2024-04-02
python机器学习中朴素贝叶斯算法及模型选择和调优的示例分析

这篇文章将为大家详细讲解有关python机器学习中朴素贝叶斯算法及模型选择和调优的示例分析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。一、概率知识基础1.概率概率就是某件事情发生的可能性。2.联合概率包...

99+

2023-06-25
Python如何通过朴素贝叶斯和LSTM分别实现新闻文本分类

这篇文章主要介绍Python如何通过朴素贝叶斯和LSTM分别实现新闻文本分类，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！数据处理与分析本次大赛提供的材料是由csv格式编写，只需调用python中的pandas库读取...

99+

2023-06-22
Python通过朴素贝叶斯和LSTM分别实现新闻文本分类

目录一、项目背景二、数据处理与分析三、基于机器学习的文本分类–朴素贝叶斯1. 模型介绍2. 代码结构3. 结果分析四、基于深度学习的文本分类–LSTM1. 模型介绍2. 代码结构3....

99+

2024-04-02
如何使用Python pomegranate库实现基于贝叶斯网络拼写检查器

这篇文章主要介绍“如何使用Python pomegranate库实现基于贝叶斯网络拼写检查器”，在日常操作中，相信很多人在如何使用Python pomegranate库实现基于贝叶斯网络拼写检查器问题上存在疑惑，小编查阅...

99+

2023-07-06
使用ggplot()和bsts()包从贝叶斯时间序列分析中生成BS

首先，需要安装并加载`ggplot2`和`bsts`包。```Rinstall.packages("ggplot2")install...

99+

2023-09-27

ggplot()
如何在Python中使用Blending算法

如何在Python中使用Blending算法？相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。一、前言普通机器学习：从训练数据中学习一个假设。集成方法：试图构建一组假设并将它们组合...

99+

2023-06-15
JavaScript中如何使用扩展运算符拷贝数组

这篇文章将为大家详细讲解有关JavaScript中如何使用扩展运算符拷贝数组，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。拷贝数组const arr = [1, 2...

99+

2023-06-05
python中怎么使用scipy.fftpack模块计算快速傅里叶变换

这篇文章将为大家详细讲解有关python中怎么使用scipy.fftpack模块计算快速傅里叶变换，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。python可以做什么Python是一种编程语言，内置了许多...

99+

2023-06-14
使用Python怎么实现一个阿姆斯特朗数算法

这篇文章将为大家详细讲解有关使用Python怎么实现一个阿姆斯特朗数算法，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。一、什么是阿姆斯特朗数？如果一个正整数等于其各个数字的立方和，则称该数为...

99+

2023-06-08