扫码阅读

手机扫码阅读

TiDB丨一次TiDB GC阻塞引发的大排查......

998 2023-09-08

GC 排查 SQL 日志 kill

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：TiDB丨一次TiDB GC阻塞引发的大排查......

文章来源：

神州数码云基地

扫码关注公众号

TiDB神州数码云基地案例分析摘要

本文介绍了针对TiDB在某集群中duration异常升高问题的排查过程和预防方案。通过五个步骤，作者成功定位并解决了TiDB GC（垃圾收集）阻塞问题。

分析过程

在发现duration异常升高后，作者首先通过查看集群心电图发现所有分位线均升高，意味着集群内部问题。监控数据显示，在问题发生时，TPS/QPS正常，而TiKV节点负载上升，提示查询压力增大。由此，作者初步判断为GC运行异常造成的问题。

排查步骤

监控还原SQL流程：排除TiDB Server问题，发现TiKV节点资源使用率上升。
确认非预期的操作：通过慢查询日志分析，发现Coprocessor Task中Total_keys与Process_keys值相差甚远，说明数据旧版本过多。
日志分析：发现GC safepoint被长时间未提交的事务阻塞。
还原真相：确认因频繁的delete操作和未提交的事务导致历史版本堆积，进而影响系统性能。

预防方案

为避免类似问题，建议应用端避免大事务操作，及时提交或回滚事务。同时，建议对TiDB GC进行限流，并利用v5.1版本以上的GC in Compaction Filter特性减少性能波动。

总结

保留充足的事故现场信息对排查问题至关重要。TiDB DBA应关注GC性能指标，确保参数设置正确和GC正常运行，避免性能问题。

关于案例分享

作者希望通过分享这一案例，能够帮助遇到类似问题的人。文末强调了神州数码云基地在IT技术领域的实力。

想要了解更多内容？

查看原文：TiDB丨一次TiDB GC阻塞引发的大排查......

文章来源：

神州数码云基地

扫码关注公众号

相关推荐

TiDB 数据库开发规范很重要！

1155

数据删除 key TiDB

从一个简单的 Delete 删数据场景，谈 TiDB 数据库开发规范的重要性

面试中经常提出的有关操作系统和网络的故障排除问题

220

故障检查常用命令排查

作为实施工程师或者运维工程师，无论在面试过程中还是工作过程中，都遇到过有关操作系统和网络的故障排除问题。

SQL面试 100 问

5042

查询员工 SQL 答案

本文介绍并分析了 100 道常见 SQL 面试题，

TiDB丨从MySQL迁移至TiDB的常见问题及解决方案

953

SQL id region MySQL

数据迁移的问题解答干货！

数云融合丨一文让你弄懂多租户数据库设计⽅案

2011

租户方案数据库数据源

超详实设计方案。

MySQL 存储过程案例实战

506

存储过程 SQL 语句

MySQL 存储过程案例实战概述MySQL5.0 版本开始支持存储过程。在MySQL中存储过程主要分为两类，

神州数码云基地

我们致力于用数字技术重构企业价值，助力企业实现数字化转型升级。

187 篇文章

浏览 188.5K

神州数码云基地的其他文章

云原生｜速来！5分钟秒懂云原生容灾备份实践

有备份，心不慌~

数云融合 | 数字化时代回望云计算，聊云别再不知所“云”啦~

什么是云计算？

Odoo｜当我在Odoo用画布创建流程图

在小小的Odoo花园里面挖呀挖呀挖

AIGC｜人人都在说的向量数据库究竟是什么？小白也能读懂！

人工智能时代你必须掌握的基本知识【建议收藏】

数据库｜TiDB故障处理之让人迷惑的Region is Unavailable

一次有趣的故障排除☝

随机阅读

公司级项目管理例会的汇报内容

10-02

采用Minitab进行logistic回归分析

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

TiDB丨一次TiDB GC阻塞引发的大排查......

TiDB神州数码云基地案例分析摘要

分析过程

排查步骤

预防方案

总结

关于案例分享

联系我们

融实践库

微信公众号

微信视频号

社区微信群

TiDB丨一次TiDB GC阻塞引发的大排查......

TiDB神州数码云基地案例分析摘要

分析过程

排查步骤

预防方案

总结

关于案例分享

测试开发之系统篇-按需创建测试虚拟机

联系我们

融实践库

微信公众号

微信视频号

社区微信群