博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
RDS for MySQL数据库CPU被打满解决过程
阅读量:6097 次
发布时间:2019-06-20

本文共 752 字,大约阅读时间需要 2 分钟。

RDS实例CPU一直被打满

1、问题描述

版本:阿里云专有云V2版本

客户反馈,通过drds执行SQL比较慢,之前很快就能执行完的SQL,需要三四秒才可以执行成功。

2、问题排查

首先排查drds的状况,通过drds manager发现该drds下面有两个docker节点,并且都是正常的。

检查drds下面挂的rds的实例状态,一共有四个rds,其中一个rds的CPU一直被打满,并且卡顿时间跟客户描述的一致。
image
问题已经基本定位到时其中一个RDS实例的CPU被打满,导致查询缓慢,拖慢了整个drds实例。
*

实例的cpu被打满,一般是由两种情况:

1、慢SQL,全表扫描等。此时qps不高,但是查询占用了大量的逻辑IO,需要扫描大量的数据行,导致CPU资源被大量消耗
2、qps高,业务量高峰。此时慢SQL不是问题所在。那就需要考虑从实际的规格和架构方面入手,可以提高rds的规格配置,增加只读实例等。

*

回到问题,登录到该rds。show processlit发现有很多慢查询,如图:

image
可以明显看到这种SQL执行时间特别长,达到了21秒,并且占用的逻辑读也特别高。问题还是在慢SQL方面。
那它的备库现在什么情况呢,通过show slave status发现。主备已经停止同步。
image
image
此时已经不能登录到备库,查看mysql进程,已经挂掉。
image
手动拉起mysql进程。后可以登录了。可以看到刚拉起主备延迟很高
image
image
image

3、问题解决

慢SQL已经反馈给客户进行处理,并且通知研发注意这种SQL,应用设计和开发过程中,要考虑查询的优化,遵守 MySQL 优化的一般优化原则,降低查询的逻辑 IO,提高应用可扩展性。

客户将SQL kill处理后,该rds的cpu恢复正常,并且从drds查询速度也恢复正常,问题解决。

转载地址:http://tbbza.baihongyu.com/

你可能感兴趣的文章
20172303 2017-2018-2 《程序设计与数据结构》第5周学习总结
查看>>
(转)HTML的代码(从朋友那转的,看着觉得会有用就转了)
查看>>
eclipse中将一个项目作为library导入另一个项目中
查看>>
Go语言学习(五)----- 数组
查看>>
Android源码学习之观察者模式应用
查看>>
Content Provider的权限
查看>>
416. Partition Equal Subset Sum
查看>>
centos7.0 64位系统安装 nginx
查看>>
数据库运维平台~自动化上线审核需求
查看>>
注解开发
查看>>
如何用 Robotframework 来编写优秀的测试用例
查看>>
Django之FBV与CBV
查看>>
Vue之项目搭建
查看>>
app内部H5测试点总结
查看>>
Docker - 创建支持SSH服务的容器镜像
查看>>
[TC13761]Mutalisk
查看>>
三级菜单
查看>>
Data Wrangling文摘:Non-tidy-data
查看>>
加解密算法、消息摘要、消息认证技术、数字签名与公钥证书
查看>>
while()
查看>>