首页 > 资讯 > 后端开发 > Python >线上SpringCPU高负载解决思路详解

564

分享到

线上SpringCPU高负载解决思路详解

2024-04-02 19:04:59 564人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录引言定位问题日志搜索监控看板ThreadDump优化事后反思引言背景: 在某一天,运营同事突然发现运营看板好几天没有更新数据了, 然后找了过来?! 这里看似抛出了一个问题 ?

引言

背景: 在某一天,运营同事突然发现运营看板好几天没有更新数据了, 然后找了过来?!

这里看似抛出了一个问题 ?

但细想一下, 同时暴露了我们对于线上服务的监控未完全覆盖到!!! 这是致命的!!!

当然, 这篇文章先不讨论监控的问题, 后面会推出完善的监控方案

定位问题

问题抛过来了, 那么我们第一步要怎样做呢?

拿到问题的第一步, 先理解题意, 这里有几个关键的信息点

第一 : 好几天, 具体哪一天, 这个后面确认了一个具体的时间点

第二 : 运营看板, 这是重点, 是我们切入问题的关键

好了, 有了这两个关键的信息, 我们接下来就开始定位问题代码了

从功能出发, 定位到未更新的表
通过表来定位到更新数据的代码

通过上面两步找到了问题代码是某个定时任务

日志搜索

这时按照肌肉记忆, 先是看了代码有没有关键点的日志输出, 发现代码开始和结束都有打印日志的操作

顺藤摸瓜,先登录到服务器端, grep一波关键的日志

发现当天的 info.log 没有打印到日志, 这就很奇怪了, 因为这个定时任务的 cron 是每天凌晨1点开始

然后就查了前一天的日志, 发现有打印到开始的日志, 但是没有打印结束的日志

然后再去找看有没有异常的日志, 发现并没有

监控看板

从日志看出了一点不对劲的味道, 但还没有足够的线索定位到具体的问题

这时去查看容器的资源情况

这里观察的是, 在两台容器中, 有一台容器的 cpu 吃得很紧

另外一台却是风平浪静

从这里可以定位到大概的问题了: CPU负载高

那为什么会造成 CPU 跑那么高呢 ?

ThreadDump

当然有很多方案可以定位 CPU 的瓶颈问题,像使用火焰图定位(下一篇会使用到)

但从上面的蛛丝马迹里可以大体定位到是具体的定时任务引起的

这时 threaddump, 并分析了一波线程的运行情况

从整体的报告可以看出有阻塞的线程两个, 同时有百分之四十是在超时等待

再看看具体被阻塞的线程

看起来是数据库查询阻塞

看具体的业务代码

分析一下这条 sql 的变量

入参只有一个就是 classIds 数组:

数量很小
数量很大
数量为 0

数组的分布情况可以为上面几种

套进去

数量很小, 查询应该很快
数量很大, 查询应该会相对慢一点
数量为 0 呢, if 标签, classIds 数量为 0, 不会拼接下面的 sql, 也就是会查全表

优化

定位到具体的代码了, 那就是要出优化方案了

做法就是当 classIds 的大小为 0 的时候, 不要扫描全表

这里添加 otherwise 分支, classIds 大小为 0 是 and false

重新部署再观察线上情况, CPU 降了下来

事后反思

为什么会这么久才发现问题? 而且依赖于业务侧发现问题

能不能提前感知问题呢?

想了一下, 我们的监控更多是在监测代码抛出异常, 对于操作系统的资源缺少监控下一步的优化, 对操作系统资源进行监控

以上就是线上spring CPU 高负载解决思路详解的详细内容，更多关于线上Spring CPU 高负载的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

--结束END--

本文标题: 线上SpringCPU高负载解决思路详解

本文链接: https://lsjlt.com/news/167131.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

线上SpringCPU高负载解决思路详解

目录引言定位问题日志搜索监控看板ThreadDump优化事后反思引言背景: 在某一天,运营同事突然发现运营看板好几天没有更新数据了, 然后找了过来! 这里看似抛出了一个问题但细...

99+

2024-04-02
负载均衡引起线路中断怎么解决

负载均衡引起线路中断可能是因为某个负载均衡设备或者配置出现问题导致的。要解决这个问题，可以采取以下几个步骤：1. 检查负载均衡设备的...

99+

2023-09-01

负载均衡
win10cpu负载过高如何解决

当 Windows 10 的 CPU 负载过高时，可以尝试以下解决方法：1. 关闭不必要的程序：打开任务管理器，查看哪些程序正在占用...

99+

2023-09-12

win10
电脑cpu负载过高如何解决

这篇文章主要介绍“电脑cpu负载过高如何解决”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“电脑cpu负载过高如何解决”文章能帮助大家解决问题。电脑cpu负载过高解决方法：一、软件我们打开软件、文件...

99+

2023-07-02
Docker离线部署geoserver的思路详解

总体思路安装Docker和docker-compose写geoserver配置文件下载geoserver和启动geoserver镜像导出geoserver镜像内网环境导入geose...

99+

2022-12-15

Docker离线部署geoserver Docker离线部署
Asp.Net在线预览Word文档的解决方案与思路详解

目录项目特点解决方案大致思路：先将Word文档转换Html，再预览Html。1、Word文档转Html2、预览前几天有个老项目找到我，有多老呢？比我工作年限都长，见到这个项目我还得叫...

99+

2024-04-02
云服务器负载过高如何解决

当云服务器负载过高时，可以采取以下几种解决方法：1. 垂直扩展（Vertical Scaling）：增加服务器的硬件资源，如CPU、...

99+

2023-09-08

云服务器
dns服务器负载过高怎么解决

要解决DNS服务器负载过高的问题，可以尝试以下几个方法：1. 增加服务器资源：可以考虑增加服务器的CPU、内存和网络带宽等资源，以提...

99+

2023-08-20

dns服务器服务器
Go-RESTful实现下载功能思路详解

目录Go-RESTful实现下载功能下载实现思路文件系统IO：网络IO：服务建立配置路由总结Go-RESTful实现下载功能下载实现思路下图为实现一个文件下载所需要考虑的因素： ...

99+

2024-04-02
如何解决网站访问慢-MySQL负载高

故障分析首先，判断访问慢现象，是个人还是集体？？？"个人"现象排查：检查个人网络，pc，浏览器、中毒等，无需多说自己百度；"集体"现象排查：检查核心路由交换，ISP运行商网络，ARP***，DNS服务...

99+

2022-06-17

MySQL负载高负载高 MySQL
香港服务器负载过高怎么解决

香港服务器负载过高的解决方法：1、利用DNS实现负载均衡，通过DNS服务器配置多个A记录，将不同的DNS请求解析到不同的IP地址；2、基于IP实现负载均衡，利用负载均衡算法将IP报文转发到集群某个服务器中解决问题；具体内容如下：利用DNS实...

99+

2024-04-02
python通过http上传文件思路详解

这里主要是解决multipart/form-data这种格式的文件上传，基本现在http协议上传文件基本上都是通过这种格式上传 1 思路一般情况下，如果我们往一个地址上传文件，则必...

99+

2024-04-02
Linux上搭载Nginx负载均衡配置使用案例详解

目录1,这里我们来说下很重要的负载均衡, 那么什么是负载均衡呢2, 负载均衡的种类3, 这里我们只来说Nginx(其他的大家有兴趣可以自行查阅相关文档)4, 创建两台Nginx服务器5, 搭建Nginx搭建Keepali...

99+

2022-06-04

linux搭载Nginx负载均衡 linux Nginx负载均衡
使用Redis解决高并发方案及思路解读

目录NoSQLRedis痛点思路分布式锁锁续命扩展结语NoSQL Not Only SQL的简称。NoSQL是解决传统的RDBMS在应对某些问题时比较乏力而提出的。即非关系型数据库，它们不保证关系数据的ACID特性，数...

99+

2023-03-31

Redis高并发 Redis解决高并发 Redis高并发思路
详解MongoDB数据还原及同步解决思路

mongodb数据如何还原，同步到其他系统？只要我们了解了数据库日志原理，一切都是那么简单 oplog原理 Oplog.rs 表类型为 Capped Collections - 表类型： Capped co...

99+

2024-04-02
SpringBoot ScheduledTaskRegistrar解决动态定时任务思路详解

目录前言一、问题背景二、痛点所在三、解决思路四、代码示例五、文章小结前言在做SpringBoot项目的过程中，有时客户会提出按照指定时间执行一次业务的需求。如果客户需要改动业务的...

99+

2023-02-01

SpringBoot ScheduledTaskRegistrar动态定时任务 SpringBoot ScheduledTaskRegistrar定时任务 SpringBoot ScheduledTa
Redis中的BigKey问题排查与解决思路详解

目录摘要Big Key问题介绍Big Key问题排查使用BIGKEYS命令Debug Objectmemory usageRedis-rdb-toolsBig Key问题解决思路分割大key对象压缩直接删除总结摘要 Re...

99+

2023-03-31

Redis BigKey问题 Redis BigKey
Java跳跃游戏实例真题解决思路详解

目录变式题—跳跃游戏 I一、题目描述二、思路三、代码变式题—跳跃游戏 II一、题目描述二、思路三、代码变式题—跳跃游戏 I 一、题目描述给定一个...

99+

2022-11-13

Java跳跃游戏 Java跳跃游戏实例
阿里云传奇服务器负载过高：如何解决？

简介阿里云传奇服务器是一款高性能的云计算产品，但有时候用户可能会遇到负载过高的问题。本文将介绍一些常见的原因和解决方法，帮助您解决阿里云传奇服务器负载过高的问题。解决方法1. 调整服务器配置当服务器负载过高时，首先可以考虑调整服务器的配置...

99+

2024-01-30

阿里过高负载
浅谈Java高并发解决方案以及高负载优化方法

目录1、HTML静态化2、图片服务器分离3、数据库集群和库表散列4、缓存5、镜像6、负载均衡1）硬件四层交换2）软件四层交换一、高并发高负载类网站关注点之数据库需要注意的是：二、高并...

99+

2024-04-02