运维开发网

Redis读超时排查

运维开发网 https://www.qedev.com 2020-05-21 14:52 出处:网络 作者:运维开发网整理
现象:STORM UI中发现bolt中有failed,异常日志抛异常read time out       业务场景:storm读写redis。 查看redis日志发现,正常情况下 每隔2小时都会有超时的异常抛出来,抛出异常的 redis机器有多台。 分析慢日志: 1、看命令数和value大小:找到其中一台redis,看命令数,只要在10W tps以下都不算大,看慢的命令是否有大value,发现并

现象:STORM UI中发现bolt中有failed,异常日志抛异常read time out  

Redis读超时排查

 

Redis读超时排查

 

业务场景:storm读写redis。

查看redis日志发现,正常情况下 每隔2小时都会有超时的异常抛出来,抛出异常的 redis机器有多台。

分析慢日志:

1、看命令数和value大小:找到其中一台redis,看命令数,只要在10W tps以下都不算大,看慢的命令是否有大value,发现并不大(只看了其中一个,其他没看)

2、看连接数在3K以下 并不高

3、看网卡流量,平均比较高

Redis读超时排查

Redis读超时排查

分享图片分享图片

问题定位:多个项目共用一个redis集群,导致redis网卡流量居高不下,而redis是多线程接收命令,单线程处理命令,即使一个命令的value并不大,可能因为等待执行的命令较多,导致当前的命令处理变慢!

正常的redis网卡流量应该像下面这样好看

Redis读超时排查

扫码领视频副本.gif

0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号