首页 > 资讯 > 后端开发 > Python >基于闻达（wenda+chatGLM-6B），构建自己的知识库小助手

934

分享到

基于闻达（wenda+chatGLM-6B），构建自己的知识库小助手

语言模型人工智能 python 2023-08-31 17:08:16 934人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录安装miniconda 拉取仓库使用内置python 安装依赖上传模型克隆及下载 text2vec-large-chinese 修改配置上传知识库（txt文件）处理txt数据启动服务测试 ChatGLM-6B是清华团

克隆及下载 text2vec-large-chinese

ChatGLM-6B是清华团队+智谱ai 开发的，一个开源的、支持中英双语的对话语言模型，具有 62 亿参数。被很多人视为ChatGPT的平替。但是由于ChatGLM-6B 的规模较小，目前已知其具有相当多的局限性。解决这一问题的方式大体上有两种：

一种是使用更大规模的模型来提升整体能力，提升其自我认知能力。开发者表示基于 1300 亿参数 GLM-130B 的 ChatGLM 已经在内测开发中。

另一种便是使用插件或者外挂的方式，提升模型在某一个领域的能力。

wenda就属于后者，wenda是一个大规模语言模型调用平台。旨在通过使用为小模型外挂知识库查找的方式，实现近似于大模型的生成能力。

既然我们已经了解 wenda 的作用，快让我们进入正文吧！

我的文件目录结构

 # 闻达路径(我的路径为nogit，以下图片中nogit路径理解为wenda即可) /home/user/data/wenda # miniconda路径 /home/user/data/miniconda3

安装miniconda

 # 进入路径 cd /home/user/data/

从 https://pan.baidu.com/s/1w33G8xp66Q6kwLN6pDC_3A?pwd=dim9 提取码: dim9

下载 Miniconda3-latest-linux-x86_64.sh，将下载好的文件放入 /home/user/data/ 路径下

 # 安装miniconda sh Miniconda3-latest-Linux-x86_64.sh

安装完成后查看是否成功

 cd miniconda3/bin ./conda -V

显示如下表示安装成功

拉取仓库

进入 /home/user/data/ 路径下

 cd /home/user/data/

 # 拉取仓库 git clone https://GitHub.com/l15y/wenda.git

使用内置python

 # 进入wenda目录 cd /home/user/data/wenda

 # 使用conda命令创建内置Python环境 /home/user/data/miniconda3/bin/conda create -p ./env python=3.8

安装依赖

env/bin/pip install -r requirements/requirements.txt -i Https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install torch BeautifulSoup4 torchvision torchaudio pdfminer.six -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-chatglm.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-st.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-rwkv.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-bing.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-glm6b-lora.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-gpt4free.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-fess.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-llama.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-openai.txt -i https://pypi.tuna.tsinghua.edu.cn/simpleenv/bin/pip install -r requirements/requirements-qdrant.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

上传模型

我使用的模型是chatGLM-6B，大家也可以使用其他的基础模型

链接：https://pan.baidu.com/s/16L7K-2pa5EfXzcUOJEBJLA?pwd=xt9l 提取码：xt9l

下载完成后上传到 /home/user/data/wenda 路径

解压文件

 cd /home/user/data/wenda 7z x -y model.7z -o/home/user/data/wenda

注意，解压后的文件路径是否为 /home/user/data/wenda/model/chatglm-6b，如果不是，请修改

如果没有7z命令，需要先安装7z命令，如下：

 sudo apt install p7zip-full p7zip-rar

克隆及下载 text2vec-large-chinese

cd /home/user/data/wenda/model# 安装 git lfsgit lfs install# 如果报错 git: 'lfs' is not a git command.# 执行如下（ubuntu）：sudo apt-get install git-lfs# 从huggingface官网拉取模型指针文件git clone https://huggingface.co/GanymedeNil/text2vec-large-chinese# 下载模型wget https://huggingface.co/GanymedeNil/text2vec-large-chinese/resolve/main/PyTorch_model.bin# 覆盖text2vec-large-chinese中的 pytorch_model.bin文件mv pytorch_model.bin text2vec-large-chinese/

修改配置

将example.config文件改名为config.xml

 cd /home/user/data/wenda/ mv example.config.xml config.xml

修改config.xml文件

                 LLM_Type            glm6b            LLM模型类型:glm6b、rwkv、llama、chatglm                                    Path                model/chatglm-6b                glm模型位置                                        Strategy                cuda fp16                glm 模型参数  支持：                    "cuda fp16"  所有glm模型 要直接跑在gpu上都可以使用这个参数                    "cuda fp16i8"  fp16原生模型 要自行量化为int8跑在gpu上可以使用这个参数                    "cuda fp16i4"  fp16原生模型 要自行量化为int4跑在gpu上可以使用这个参数                    "cpu fp32"  所有glm模型 要直接跑在cpu上都可以使用这个参数                    "cpu fp16i8" fp16原生模型 要自行量化为int8跑在cpu上可以使用这个参数                    "cpu fp16i4" fp16原生模型要 自行量化为int4跑在cpu上可以使用这个参数                                                        Lora                                glm-lora模型位置

上传知识库（txt文件）

创建txt文件夹

 cd /home/user/data/wenda/ mkdir txt

将自己的txt文件上传到这里

我的txt如下

 中国管理案例共享中心案例库 教学案例 1 案例正文： 飞友科技人力发展何去何从 摘要： 飞友科技有限公司（以下简称“飞友科技”）创建于 2005 年，是目前国内 最大的民航数据服务提供商。 随着飞友科技 APP 下载量与 Association for Clinical Data Management (A-CDM)系统机场覆盖率的大大提升，飞友科技目前正以高速 发展趋势拓展业务领域，基于公司发展战略的调整，人力资源部门在完善管理体 系的过程中出现了障碍： 1.合肥是相对落后的城市，人力资源部门在本地招聘困 难；2.人力资源部门人员不稳定、流动性大，无法保证高效运作进而支持其他部 门工作。 本案例通过介绍飞友科技人力资源部门发展现状，启发案例使用者运用 战略性人力资源管理等理论知识分析公司人力资源现状背后的原因，为公司人力 资源部门的发展在未来如何适应公司及外部环境提出建议。 关键词： IT 产业，高端人才招聘，人力资源管理，团队建设 0 引言 近年来，随着交通运输业的蓬勃发展, 生活节奏越来越快，飞机成了人们出 差旅行首选的快捷出行方式，中国航空市场也快速从原来的公务出行市场转化为 个人出行市场。 但是，由于各种自然非自然原因，航班延误，飞行取消及中转停 留等，也为乘客出行造成了不便，毕竟不是所有飞机都能风雨无阻按时起飞停降。 民航业，作为服务产业，面对竞争日益激烈的市场，如何为客户提供高速便捷的 出行服务，成为他们成功的关键。 在大环境互联网+及大用户手机网民+的背景 下，“飞常准”APP 就这样应运而生了。 正是这样一款方便快捷的航空服务 APP， 在你面对查询订票的繁琐流程以及突发情况时，帮助你更合理的安排时间，顺利 起飞。

处理txt数据

/home/user/data/wenda/env/bin/python3 /home/user/data/wenda/plugins/gen_data_st.py

启动服务

 /home/user/data/wenda/env/bin/python3 /home/user/data/wenda/wenda.py

测试

未开启知识库，只使用chatglm-6b模型

开启知识库，如下：

以上便是本次搭建的全部过程啦

来源地址：https://blog.csdn.net/yuyangchenhao/article/details/130431141

您可能感兴趣的文档:

--结束END--

本文标题: 基于闻达（wenda+chatGLM-6B），构建自己的知识库小助手

本文链接: https://lsjlt.com/news/386269.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

基于闻达（wenda+chatGLM-6B），构建自己的知识库小助手

安装miniconda

拉取仓库

使用内置python

安装依赖

上传模型

克隆及下载 text2vec-large-chinese

修改配置

上传知识库（txt文件）

处理txt数据

启动服务

测试

基于闻达（wenda+chatGLM-6B），构建自己的知识库小助手

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义