首页 > 资讯 > 后端开发 > PHP编程 >【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

446

分享到

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

开源中文 llama2 llama2 llama2-chinese 2023-10-07 12:10:30 446人浏览安东尼

摘要

【ai实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat 简介环境配置环境搭建依赖安装代码及模型权重拉取拉取 Ll

【ai实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

简介

Llama2
2023年7月19日：Meta 发布开源可商用模型 Llama2。

Llama2 是一个预训练和微调的生成文本模型的集合，其规模从70亿到700亿个参数不等。

LLaMA2 的详细介绍可以参考这篇文章：【大模型】更强的 LLaMA2 来了，开源可商用、与 ChatGPT 齐平
Llama2-Chinese

Llama2中文社区

Llama2-Chinese GitHub地址

Llama2 中文 Hugging Face仓库 FlagAlpha: https://huggingface.co/FlagAlpha

Llama2在线体验链接 llama.family

模型数据：

中文微调参数:

环境配置

环境搭建

系统环境
- ubuntu 20.04LTS
- CUDA 11.8
- Docker 18.09.5
创建docker容器

拉取docker镜像

docker pull nvcr.io/nvidia/PyTorch:21.08-py3

创建docker

nvidia-docker run -it -d \    --name llama2_chinese \    -p 15550:15550 \    -p 15551:15551 \    -v /xx/xx/llm:/notebooks \    -e TZ='Asia/Shanghai' \    --shm-size 16G \    nvcr.io/nvidia/pytorch:21.08-py3    # docker exec -it llama2_chinese env LANG=C.UTF-8 /bin/bash

修改 /xx/xx/llm 为自己的路径

进入容器内：

docker exec -it llama2_chinese env LANG=C.UTF-8 /bin/bash

安装conda

下载：

cd /notebookswget https://repo.anaconda.com/miniconda/Miniconda3-latest-linux-x86_64.sh

安装：

bash Miniconda3-latest-Linux-x86_64.sh

安装提升安装即可

将miniconda加入PATH路径：

export PATH="/root/miniconda3/bin:$PATH"

创建 conda 环境:

conda create -n llama2 python=3.10.9

安装依赖库

conda activate llama2conda init

exit退出docker，重新进入docker

docker exec -it llama2_chinese  env LANG=C.UTF-8 /bin/bashcd /notebooksconda activate llama2

依赖安装

安装依赖库：

pip install -r requirements-2.txt  -i Https://pypi.tuna.tsinghua.edu.cn/simple

代码及模型权重拉取

拉取 Llama2-Chinese

git clone https://GitHub.com/FlagAlpha/Llama2-Chinese.git

github网站偶尔会抽风，需要耐心等待，如果失败了，执行 rm -rf Llama2-Chinese，再重新拉取

拉取 Llama2-Chinese-13b-Chat 模型权重及代码

cd Llama2-Chinesegit clone git clone https://huggingface.co/FlagAlpha/Llama2-Chinese-13b-Chat

由于权重文件特别大，如果失败了，执行 rm -rf Llama2-Chinese-13b-Chat，再重新拉取。
建议中午时间拉取，速度比较快，大概 1 小时（和你的网络带宽有很大关系！）。

文件大小查看：

du -sh Llama2-Chinese-13b-Chat

输出：

25G    Llama2-Chinese-13b-Chat

如果文件大小不一致，或者太小，说明权重文件下载识别，
请执行： rm -rf Llama2-Chinese-13b-Chat，再重新拉取
或者按照后面的方法去下载权重文件

查看文件列表：

ls -l Llama2-Chinese-13b-Chat/

输出：

# ls -l Llama2-Chinese-13b-Chat/total 25421840-rw-r--r-- 1 root root       1514 Jul 27 06:33 README.md-rw-r--r-- 1 root root        683 Jul 27 06:33 config.JSON-rw-r--r-- 1 root root        327 Jul 27 07:12 down.sh-rw-r--r-- 1 root root        175 Jul 27 06:33 generation_config.json-rw-r--r-- 1 root root 9948728430 Jul 24 23:12 pytorch_model-00001-of-00003.bin-rw-r--r-- 1 root root 9904165024 Jul 24 12:44 pytorch_model-00002-of-00003.bin-rw-r--r-- 1 root root 6178983625 Jul 24 12:14 pytorch_model-00003-of-00003.bin-rw-r--r-- 1 root root      33444 Jul 27 06:33 pytorch_model.bin.index.json-rw-r--r-- 1 root root        414 Jul 27 06:33 special_tokens_map.json-rw-r--r-- 1 root root        131 Jul 27 06:33 tokenizer.model-rw-r--r-- 1 root root        749 Jul 27 06:33 tokenizer_config.json

【】如果大文件下载识别，按照下面的方法下载模型文件；

wget https://huggingface.co/FlagAlpha/Llama2-Chinese-13b-Chat/resolve/main/pytorch_model-00001-of-00003.binwget https://huggingface.co/FlagAlpha/Llama2-Chinese-13b-Chat/resolve/main/pytorch_model-00002-of-00003.binwget https://huggingface.co/FlagAlpha/Llama2-Chinese-13b-Chat/resolve/main/pytorch_model-00003-of-00003.bin

如果还是没法下载，参考下面的“国内 Llama2 最新下载地址” 进行下载

终端测试

进入Python环境：

python3

输入代码：

import torchfrom transfORMers import AutoTokenizer, AutoModelForCausalLMmodel = AutoModelForCausalLM.from_pretrained('Llama2-Chinese-13b-Chat',device_map='auto',torch_dtype=torch.float16,load_in_8bit=True)model =model.eval()tokenizer = AutoTokenizer.from_pretrained('Llama2-Chinese-13b-Chat',use_fast=False)tokenizer.pad_token = tokenizer.eos_tokeninput_ids = tokenizer(['Human: 介绍一下深圳\nAssistant: '], return_tensors="pt",add_special_tokens=False).input_ids.to('cuda')        generate_input = {    "input_ids":input_ids,    "max_new_tokens":512,    "do_sample":True,    "top_k":50,    "top_p":0.95,    "temperature":0.3,    "repetition_penalty":1.3,    "eos_token_id":tokenizer.eos_token_id,    "bos_token_id":tokenizer.bos_token_id,    "pad_token_id":tokenizer.pad_token_id}generate_ids  = model.generate(**generate_input)text = tokenizer.decode(generate_ids[0])print(text)

页面测试

使用 gradio 搭建页面

安装 gradio

pip install gradio -i https://pypi.tuna.tsinghua.edu.cn/simple

加载模型并启动服务

修改端口；

vi /notebooks/Llama2-Chinese/examples/chat_gradio.py

到94行：

demo.queue().launch(share=False, debug=True, server_name="0.0.0.0")

修改为：

demo.queue().launch(share=False, debug=True, server_name="0.0.0.0", server_port=15550)

启动脚本：

python examples/chat_gradio.py --model_name_or_path Llama2-Chinese-13b-Chat

如果出现下面的错误：

File "/notebooks/Llama2-Chinese/examples/chat_gradio.py", line 94 demo.queue().launch(share=False, debug=True， server_name="0.0.0.0") ^SyntaxError: invalid character '，' (U+FF0C)

则按照下面的步骤修改代码：

vi /notebooks/Llama2-Chinese/examples/chat_gradio.py:94 修改中文逗号，为英文逗号,94 demo.queue().launch(share=False, debug=True， server_name="0.0.0.0")=>94 demo.queue().launch(share=False, debug=True, server_name="0.0.0.0")

测试

浏览器打开地址：http://10.192.x.x:15550/

国内 Llama2 最新下载地址

Llama2-7B官网版本：https://pan.xunlei.com/s/VN_kR2fwuJdG1F3CoF33rwpIA1?pwd=z9kfLlama2-7B-Chat官网版本：https://pan.xunlei.com/s/VN_kQa1_HBvV-X9QVI6jV2kOA1?pwd=xmraLlama2-13B官网版本：https://pan.xunlei.com/s/VN_izibaMDoptluWodzJw4cRA1?pwd=2qqbLlama2-13B-Chat官网版本：https://pan.xunlei.com/s/VN_iyyponyapjIDLXJCNfqy7A1?pwd=t3xwLlama2-7B Hugging Face版本：https://pan.xunlei.com/s/VN_t0dUikZqOwt-5DZWHuMvqA1?pwd=66epLlama2-7B-Chat Hugging Face版本：https://pan.xunlei.com/s/VN_oaV4BpKFgKLto4KGohBcaA1?pwd=ufirLlama2-13B Hugging Face版本：https://pan.xunlei.com/s/VN_yT_9G8xNOz0SDWQ7Mb_GZA1?pwd=yvgfLlama2-13B-Chat Hugging Face版本：https://pan.xunlei.com/s/VN_yA-9G34NGL9B79b3OQZZGA1?pwd=xqrg

参考

https://github.com/FlagAlpha/Llama2-Chinese
2.https://huggingface.co/FlagAlpha/Llama2-Chinese-13b-Chat/tree/main
3.https://github.com/facebookresearch/llama
4.https://huggingface.co/meta-llama

来源地址：https://blog.csdn.net/zengNLP/article/details/131965453

您可能感兴趣的文档:

Elasticsearch-PHP 中文文档

PHP 内核与原生扩展开发

Composer 中文文档

--结束END--

本文标题: 【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

本文链接: https://lsjlt.com/news/424503.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat 简介环境配置环境搭建依赖安装代码及模型权重拉取拉取 Ll...

99+

2023-10-07

开源中文 llama2 llama2 llama2-chinese

软考高级职称资格查询

热门wiki

mysql删除数据恢复

mysql删表能回滚吗

mysql找回删除的表

mysql不小心删除了表

mysql不小心把表删了怎么恢复数据

mysql数据表删除后能恢复么

mysql误删表数据恢复

mysql误删表恢复

mysql删除表怎么恢复

mysql删除表

近期文章

【PHP小课堂】PHP中的数组函数学习（三）

LaravelORM+协程在Webman中的应用

2024最新Consul集群搭建看这篇就够了

php如何实现高并发

PHP XSS防御：构建坚固的网络安全基础

PHP XSS防范：确保你的网站安全可靠

PHP XSS预防措施：保护你的网站免受恶意攻击

PHP XSS防护：网络安全的关键

PHP XSS防御：保护你的网站免受黑客入侵

PHP XSS防范：建立牢不可破的网络安全

推荐阅读

php变量作用域是什么

2024-02-29

PHP isset按钮不起作用怎么解决

2024-02-29

php中target标签怎么使用

2024-02-29

php怎么获取网页内容

2024-02-29

php怎么实现批量发送邮件

2024-02-29

PHP方法参数传递及返回值详解

2024-02-29

PHP7下载PDF文件失败的解决方法

2024-02-29

最佳在线PHP编辑器：快速创建文件

2024-02-29

解决PHP数据库中爱好无法显示的问题

2024-02-29

PHP验证码复制粘贴问题解决方法分享

2024-02-29

热门问答

1
回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

1
回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

1
回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

1
回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

1
回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

1
回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

1
回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

1
回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

1
回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

1
回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

热门标签

Python操作PostgreSQL Python连接PostgreSQL Python连接和操作PostgreSQL SQL建表语句 SQL建表语句使用 RedisTemplate使用 MySQL提取数据 JSON提取数据 MySQL从JSON提取数据 MySQL免密登录 MySQL免密登录配置 Oracle端口 Oracle修改端口 Oracle更换端口 Oracle更换监听端口 HBASE部署 HBASE集群部署 oracle中的trunc函数 oracle中trunc winx64安装格式化yyyy-mm-dd mysql时间戳格式化yyyy-mm-dd mysql8.0.15重置密码 mysql8.0.15修改密码 2059 Navicat连接MySQL出现2059 DBeaver导入数据 DBeaver导入excel大量数据 DBeaver导入excel数据 dbeaver导出