扫码阅读

手机扫码阅读

TiDB | 导入文档繁琐耗时？那我要说两句了

662 2023-09-07

导入数据 TiDB 集群 Lightning

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：TiDB | 导入文档繁琐耗时？那我要说两句了

文章来源：

神州数码云基地

扫码关注公众号

TiDB数据导入实践摘要

TiDB神州数码云基地：在 TiDB 上的尝试、调研与分享

本文主要分享了如何高效地将数据导入到TiDB集群中，涉及到TiDB集群的准备工作，以及使用不同工具进行数据导入的测试与分析。

TiDB集群准备

为了防止在数据导入时出现写热点和大事务导致的OOM，需要进行一些配置。通过增加SHARD_ROW_ID_BITS和pre_split_regions参数以及手动切分region来避免写热点问题。同时，通过启用enable-batch-dml配置，并设置tidb_dml_batch_size和tidb_batch_insert参数来避免大事务导致的OOM。

文档导入测试

对比了Navicat、LOAD DATA命令和Lightning工具的优缺点。Navicat拥有良好的交互界面但仅限Windows系统；LOAD DATA是MySQL中的传统批量导入方式，兼容性好；而Lightning虽然导入速度最快，但使用上有限制，如需频繁修改配置，不支持txt文件，且失败后需要手动调整TiKV集群状态。

数据准备

测试了不同数据量（100MB至11GB）的csv文件导入到TiDB集群中，集群配置为每台机器8 vCore，32G内存，千兆带宽。

测试结果与总结

Lightning在local模式下导入速度最快，但限制较多；LOAD DATA虽然速度稍慢，但支持txt文件且易于自定义，适合基于业务需求开发脚本；Lightning的tidb模式适合增量数据导入；而Navicat则适合初学者导入少量数据。本文旨在帮助读者更有效地导入数据到TiDB，同时欢迎大家加入社群讨论。

了解云基地，就现在！

神州数码专注于IT技术，虽然历史不长，但实力雄厚。

想要了解更多内容？

查看原文：TiDB | 导入文档繁琐耗时？那我要说两句了

文章来源：

神州数码云基地

扫码关注公众号

相关推荐

TiDB | TiDB Lightning导入超大型txt文件实践

702

文件 txt Lightning 导入

TiDB Lightning 还能导入txt文件？

系统设计 | 导入和导出

516

服务方案导出导入

在项目上我们经常会遇到一些导入导出的场景，常见的有 Excel 的导入导出，以及 PDF 的导出。这一期的技术方案总结一下相关的技术方案和实现。

导入功能，有时是“猥琐”的最优解

91

导入规则校验起止时间

相对于玉树临风的功能界面，导入，显得猥琐又懒散。但对于Web系统而言，导入，有时恰是当时境况下的最优解。1、

如何更好地导入Scrum？

519

Scrum 团队导入估算

Scrum是最小管理框架，只能对其进行补充完善，不要尝试对其进行裁剪。

6个案例：分享产品中容易忽略的问题或现象

129

用户导入模板 ES

产品经理工作中的小案例6个

后端产品容易忽视的坑（二）

101

门店商品导入异步

本文结合案例，聊两个小话题：\x0d\x0a\x0d\x0a1、异步处理机制，会给脏数据带来可乘之机？\x0d\x0a\x0d\x0a2、取‘全部’，是否等同于遍历所有枚举值？

神州数码云基地

我们致力于用数字技术重构企业价值，助力企业实现数字化转型升级。

187 篇文章

浏览 184.1K

神州数码云基地的其他文章

最前端丨如何在 Antd Pro 框架上实现样式自定义？

前端开发必修课。

PM说丨项目快结束了，甲方爸爸却说“我还有一个想法......”

当然是继续满足客户啦

Odoo｜Odoo客户端如何延伸至小程序？

点进来就知道了~

云原生｜Rancher和OpenShift，究竟该怎么选？

一文教你弄懂OpenShift与Rancher

数据库丨开启TiDB集群的TLS 加密后，工具“失灵”怎么办？

项目总结干货，建议收藏。

随机阅读

解读微信团队的七个价值观

案例：工时数据分析

项目级目标与组织级目标的差别

采用Minitab进行logistic回归分析

对需求签字画押，有用吗？

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线