首页 > 资讯 > 后端开发 > Python >python机器学习创建基于规则聊天机器人过程是什么

384

分享到

python机器学习创建基于规则聊天机器人过程是什么

2023-06-25 12:06:13 384人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要讲解了“python机器学习创建基于规则聊天机器人过程是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python机器学习创建基于规则聊天机器人过程是什么”吧！while&n

这篇文章主要讲解了“python机器学习创建基于规则聊天机器人过程是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python机器学习创建基于规则聊天机器人过程是什么”吧！

while True:    ai = input('我：')    print(AI.replace("吗", " ").replace('?','!').replace('？','！'))

以上这段代码就是我们今天的主题，基于规则的聊天机器人

聊天机器人

聊天机器人本身是一种机器或软件，它通过文本或句子模仿人类交互。简而言之，可以使用类似于与人类对话的软件进行聊天。

为什么要尝试创建聊天机器人？也许你对一个新项目感兴趣，或者公司需要一个，或者想去拉投资。无论动机是什么，本文都将尝试解释如何创建一个简单的基于规则的聊天机器人。

基于规则的聊天机器人

什么是基于规则的聊天机器人？它是一种基于特定规则来回答人类给出的文本的聊天机器人。由于它基于强加的规则所以这个聊天机器人生成的响应几乎是准确的；但是，如果我们收到与规则不匹配的查询，聊天机器人将不会回答。与它相对的另一个版本是基于模型的聊天机器人，它通过机器学习模型来回答给定的查询。（二者的区别就是基于规则的需要我们指定每一条规则，而且基于模型的会通过训练模型自动生成规则，还记得我们上一篇的”机器学习介绍“吗，“机器学习为系统提供无需明确编程就能根据经验自动学习和改进的能力。”）

基于规则的聊天机器人可能基于人类给出的规则，但这并不意味着我们不使用数据集。聊天机器人的主要目标仍然是自动化人类提出的问题，所以我们还是需要数据来制定特定的规则。

在本文中，我们将利用余弦相似距离作为基础开发基于规则的聊天机器人。余弦相似度是向量（特别是内积空间的非零向量）之间的相似度度量，常用于度量两个文本之间的相似度。

我们将使用余弦相似度创建一个聊天机器人，通过对比查询与我们开发的语料库之间的相似性来回答查询提出的问题。这也是我们最初需要开发我们的语料库的原因。

创建语料库

对于这个聊天机器人示例，我想创建一个聊天机器人来回答有关猫的所有问题。为了收集关于猫的数据，我会从网上抓取它。

import bs4 as bsimport urllib.request#Open the cat WEB data pagecat_data = urllib.request.urlopen('https://simple.wikipedia.org/wiki/Cat').read()#Find all the paragraph html from the web pagecat_data_paragraphs  = bs.BeautifulSoup(cat_data,'lxml').find_all('p')#Creating the corpus of all the web page paragraphscat_text = ''#Creating lower text corpus of cat paragraphsfor p in cat_data_paragraphs:    cat_text += p.text.lower()print(cat_text)

python机器学习创建基于规则聊天机器人过程是什么

使用上面的代码，会得到来自wikipedia页面的段落集合。接下来，需要清理文本以去除括号编号和空格等无用的文本。

import recat_text = re.sub(r'\s+', ' ',re.sub(r'\[[0-9]*\]', ' ', cat_text))

上述代码将从语料库中删除括号号。我特意没有去掉这些符号和标点符号，因为当与聊天机器人进行对话时，这样听起来会很自然。

最后，我将根据之前创建的语料库创建一个句子列表。

import nltkcat_sentences = nltk.sent_tokenize(cat_text)

python机器学习创建基于规则聊天机器人过程是什么

我们的规则很简单：将聊天机器人的查询文本与句子列表中的每一个文本之间的进行余弦相似性的度量，哪个结果产生的相似度最接近(最高余弦相似度)那么它就是我们的聊天机器人的答案。

创建一个聊天机器人

我们上面的语料库仍然是文本形式，余弦相似度不接受文本数据;所以需要将语料库转换成数字向量。通常的做法是将文本转换为词袋(单词计数)或使用TF-IDF方法(频率概率)。在我们的例子中，我们将使用TF-IDF。

我将创建一个函数，它接收查询文本，并根据以下代码中的余弦相似性给出一个输出。

让我们看一下代码。

from sklearn.metrics.pairwise import cosine_similarityfrom sklearn.feature_extraction.text import TfidfVectorizerdef chatbot_answer(user_query):        #Append the query to the sentences list    cat_sentences.append(user_query)        #Create the sentences vector based on the list    vectorizer = TfidfVectorizer()    sentences_vectors = vectorizer.fit_transfORM(cat_sentences)        #Measure the cosine similarity and take the second closest index because the first index is the user query    vector_values = cosine_similarity(sentences_vectors[-1], sentences_vectors)    answer = cat_sentences[vector_values.argsort()[0][-2]]        #Final check to make sure there are result present. If all the result are 0, means the text input by us are not captured in the corpus    input_check = vector_values.flatten()    input_check.sort()        if input_check[-2] == 0:        return "Please Try again"    else:         return answer

我们可以把上面的函数使用下面的流程图进行表示：

python机器学习创建基于规则聊天机器人过程是什么

最后，使用以下代码创建一个简单的回答交互。

print("Hello, I am the Cat Chatbot. What is your meow questions?:")while(True):    query = input().lower()    if query not in ['bye', 'Good bye', 'take care']:        print("Cat Chatbot: ", end="")        print(chatbot_answer(query))        cat_sentences.remove(query)    else:        print("See You Again")        break

上面的脚本将接收查询，并通过我们之前开发的聊天机器人处理它们。

python机器学习创建基于规则聊天机器人过程是什么

从上面的图片中看到的，结果还是可以接受的，但有也有些奇怪的回答。但是我们要想到，目前只从一个数据源中得到的结果，并且也没有做任何的优化。如果我们用额外的数据集和规则来改进它，它肯定会更好地回答问题。

感谢各位的阅读，以上就是“python机器学习创建基于规则聊天机器人过程是什么”的内容了，经过本文的学习后，相信大家对python机器学习创建基于规则聊天机器人过程是什么这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

您可能感兴趣的文档:

--结束END--

本文标题: python机器学习创建基于规则聊天机器人过程是什么

本文链接: https://lsjlt.com/news/304630.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python机器学习创建基于规则聊天机器人过程是什么

聊天机器人

基于规则的聊天机器人

创建语料库

创建一个聊天机器人

python机器学习创建基于规则聊天机器人过程是什么

python机器学习创建基于规则聊天机器人过程示例详解

使用 Python 创建一个基于规则的聊天机器人

学习Python，开发智能聊天机器人

基于Python如何使用AIML搭建聊天机器人

聊天机器人ChatGPT是什么

Python基于Google Bard实现交互式聊天机器人

基于小程序制作一个ChatGPT聊天机器人

Python基于Google Bard怎么实现交互式聊天机器人

如何使用Python开发基于ChatGPT的聊天机器人

ChatGPT PHP技术解析：构建智能聊天机器人的机器学习算法

什么是Python机器学习

快速实现基于Python的微信聊天机器人示例代码

怎么使用Python人工智能构建简单聊天机器人

python人工智能human learn绘图创建机器学习模型

2019最新Python学习路线图：如何用Python创建微信机器人

Python中怎么创建线性回归机器学习模型

python机器学习Logistic回归原理是什么

Python机器学习应用之基于天气数据集的XGBoost分类篇解读

python怎么使用Evidently创建机器学习模型仪表板

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义