在我们线上的生产环境中要备份的东西很多,各种服务日志、数据库数据、用户上传数据、代码等等。用 JuiceFS 来备份可以节省你大量时间,我们会围绕这个主题写一系列的教程,整理出一套最佳实践,方便大家。 今天第一篇就写写最常用的 Nginx
在我们线上的生产环境中要备份的东西很多,各种服务日志、数据库数据、用户上传数据、代码等等。用 JuiceFS 来备份可以节省你大量时间,我们会围绕这个主题写一系列的教程,整理出一套最佳实践,方便大家。
今天第一篇就写写最常用的 Nginx 日志备份。
生产环境中的 Nginx 经常作为反向代理,配置多台,用来对接后面的各种应用服务。日志主要有两类,访问日志 (access.log) 和错误日志 (error.log)。
日志是分散在每个 Nginx 节点的磁盘上的,每台机器自己的磁盘并不安全,而且分散的日志也难以维护和使用。所以,我们都会将日志汇总在一个更靠谱的存储系统中,一方面长期存储安全可靠,一方面也方便做分析使用。
在日志的存储上需要里,容量扩展性强,稳定安全,方便运维操作,价格便宜,最好按使用量付费是重点,对于存储性能的要求会低一些。目前常用的有 NFS、hdfs、对象存储等,把这些存储与 JuiceFS 做个比较:
说到日志的收集方式,主要有两种:定时收集 和 实时收集,我们在下面分别说明。JuiceFS 使用客户自己的对象存储保存文件数据,所以也自然继承了对象存储的好处,在此之上,我们提供了高性能的元数据服务和完整的 POSIX 兼容,使用上又比对象存储便利的多。
通常按照 小时、天,把日志拷贝到一个统一的存储点。这方面的工具集很多,我们用 linux 默认安装的 logrotate 举例说明。
首先,要在 JuiceFS 创建一个文件系统,假设叫 super-backup。
第一步,每台机器安装 JuiceFS 客户端,挂载到 /jfs
。
下载 JuiceFS 客户端
curl -L juicefs.io/static/juicefs -o juicefs && chmod +x juicefs
挂载文件系统
sudo ./juicefs mount super-backup /jfs
在自动化配置管理中使用 JuiceFS 也同样方便,具体方法请在上手指南中查看 如何通过命令行认证 和 开机自动挂载,我们支持 Docker 中挂载 和 Kubernates 中挂载。
第二步,在每台机器上用 logrotate 配置日志的滚动策略,修改 /etc/logrotate.d/nginx
/var/log/nginx/*.log {
daily # 每天滚动一次
compress
dateext # 把日期添加到文件名中
sharedscripts
postrotate
[ -f /var/run/nginx.pid ] && kill -USR1 `cat /var/run/nginx.pid` # 重新加载日志文件
endscript
lastaction
rsync -au *.gz /jfs/nginx-logs/`hostname -s`/ # 把压缩好的日志同步到 JuiceFS
endscript
}
到此,Nginx 日志就可以每天 rotate 并保存到 JuiceFS 中了。增加 Nginx 节点时,只需要在新增节点上做同样的配置即可。
如果使用 NFS,在 logrotate 中的配置是基本一样的。但是 NFS 有几个不足之处:
再分享几个 Tips:
logrotate -f /etc/logrotate.d/nginx
立即执行对 logrotate 配置做个验证。还可以用 -d 做调试。/etc/crontab
中修改。juicefs merge
命令可以快速合并 gzip 压缩过的日志文件。说完定时汇总,下一节我们再说说日志实时收集。
日志的实时收集已经有了很多开源工具,常用的有 Logstash、Flume、Scribe、kafka 等。
在集群不是很大的时候,日志收集、分析、索引、展示有个全家桶方案 elk,其中用 Logstash 做日志收集和分析。
需要下面的部署方式:
这里不讲 Logstash 在收集、分析、过滤环节的配置了,网络上有很多文章可查,说一下输出环节。
把 Logstash 收集处理好的日志保存到 JuiceFS 只要在配置的 output 部分设置一下:
output {
file {
path => "/jfs/nginx-logs/%{host}-%{+yyyy/MM/dd/HH}.log.gz"
message_format => "%{message}"
gzip => true
}
}
存储到 NFS 也可以用上面的配置,缺点和上文定时收集部分提到的相同。
如果要保存到对象存储、HDFS,需要再配置 Logstash 的第三方插件,大部分是非官方的,随着 Logstash 版本的升级,使用时可能需要折腾一下。
其实还有更简单的实时日志收集方法,就是直接让 Nginx 把日志输出到 JuiceFS 中,省去了维护和部署日志收集系统的麻烦。使用这个方案可能会担心 JuiceFS 出问题时影响 Nginx 的正常运行,有两方面可以帮大家减少一些顾虑:
定时收集和实时收集都讲完了,在 super-backup 中存储的 Nginx 日志如何做个异地备份呢?
只要两步:
这样可以全自动的在另外一个对象存储中同步一份数据,有效防止单一对象存储的故障或者所在区域的灾难。
你一定会问:JuiceFS 挂了怎么办?元数据访问不了,光有对象存储里的数据也没用啊。
我们还有一个重要功能 – 兼容模式的 JuiceFS,所有的文件会按原样保存在对象存储中,脱离 JuiceFS 的元数据服务,也仍然可以访问里面的文件。对于备份这类一次写入不做修改的场景适合使用。
如有帮助的话欢迎关注我们项目 Juicedata/JuiceFS 哟! (0ᴗ0✿)
原文地址:https://www.cnblogs.com/JuiceData/arcHive/2022/02/23/15927944.html
--结束END--
本文标题: 用 JuiceFS 备份 Nginx 日志可以这么简单
本文链接: https://lsjlt.com/news/9123.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-10-23
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0