| title | 使用 PingCAP Clinic Diag 采集 SQL 查询计划信息 |
|---|---|
| summary | 了解如何使用 PingCAP Clinic Diag 采集 TiUP 部署集群的 SQL 查询计划信息。 |
TiDB 在 v5.3.0 中引入了 PLAN REPLAYER 命令,能够快速保存和恢复查询计划相关的信息,简化了排查优化器相关问题时提取排查信息的步骤。Clinic Diag 诊断客户端(下称 Diag)集成了 PLAN REPLAYER 功能,你可以使用 Diag 方便快捷地保存查询计划相关的数据。
在排查 TiDB v4.0 及以上版本的集群问题时,你可以使用 Diag 将排查现场的相关数据以 ZIP 格式导出,并将导出的数据快速上传到 PingCAP Clinic 供技术支持人员查看。在使用 Diag 采集数据前,你需要提供需要采集的 SQL 语句文件。Diag 采集的数据相较于 TiDB 中 PLAN REPLAYER 功能采集的数据多了日志信息和集群信息,具体见全量数据采集的输出结果。
警告:
- 当前该功能为实验特性,不建议在生产环境中使用。
- 暂时不支持采集使用 TiDB Operator 部署的 TiDB 集群的数据。
本部分介绍如何使用 Diag 采集 SQL 查询计划信息。你需要先安装 Diag,再使用 Diag 采集数据。
-
通过 TiUP 安装 Diag,默认安装最新版本:
tiup install diag
-
若已安装 Diag,请确保 Diag 版本 >= 0.7.3。
你可以通过如下命令检查 Diag 版本:
tiup diag --version
如果 Diag 版本不满足要求,可以通过如下命令升级到最新版本:
tiup update diag
使用如下 diag collect 命令进行数据采集。你需要将 <cluster-name> 和 <statement-filepath> 占位符替换为实际的值:
diag collect <cluster-name> --profile=tidb-plan-replayer --explain-sql=<statement-filepath>注意:
通过
diag采集数据前,你需要通过--explain-sql指定sql-statement文件:
- 以上命令中
<statement-filepath>是指sql-statement文件的路径。- 该文件包含了需要采集的 SQL 语句。
- 如果有多条 SQL 语句需要分析,可以使用分号
;分隔。- 因为以上
diag命令会新建会话进行查询,所以 SQL 文件里的 SQL 语句必须显示指明所使用的数据库,如SELECT * FROM test.t1。
PLAN REPLAYER不会导出表中数据。采集数据时只会执行
EXPLAIN,不会真正执行查询。因此采集时对数据库性能影响较小。
sql-statement 的文件内容示例:
SELECT * FROM test.t1;SELECT * FROM test.t2;--explain-sql 指定的 sql-statement 文件内容说明:
- 如果有多条 SQL 语句需要分析,可以使用分号
;分隔。 - 因为以上
diag命令会新建会话进行查询,所以 SQL 文件里的 SQL 语句必须显示指明所使用的数据库,如SELECT * FROM test.t1。
全量数据采集的输出结果包含以下集群现场信息:
| 序号 | 采集内容 | 调用的 Diag collector | 输出文件 |
|---|---|---|---|
| 1 | TiDB 配置信息 | config |
tidb.toml |
| 2 | TiDB Session 系统变量 | plan_replayer |
plan_replayer.zip/variables.toml |
| 3 | TiDB 执行计划绑定信息 (SQL Binding) | sql_bind |
sql_bind/global_bind.csv |
| 4 | sql-statement 中所包含的表结构 |
plan_replayer |
plan_replayer.zip/schema/<db.table>.schema.txt |
| 5 | sql-statement 中所包含表的统计信息 |
plan_replayer |
plan_replayer.zip/stats/<db.table>.json |
| 6 | EXPLAIN sql-statement 的结果 |
explain |
explain/sql0 |
| 7 | 默认采集的集群信息
|
default | cluster.json,meta.yaml,$collectid_diag_audit.log |
你可以自定义配置文件使 Diag 采集上述输出结果中的部分数据。下面为一个示例的配置文件 tidb-plan-replayer.toml:
name = "tidb-plan-replayer"
version = "0.0.1"
maintainers = [
"pingcap"
]
# 要采集的数据类型
collectors = [
"config",
"sql_bind",
"plan_replayer"
]
# 要采集的组件
roles = [
"tidb"
]通过 --profile 参数指定配置文件的路径来进行自定义采集。你需要将 <cluster-name>、<profile-filepath> 和 <statement-filepath> 替换为实际的值:
diag collect <cluster-name> --profile=<profile-filepath> --explain-sql=<statement-filepath>采集结果中的 plan_replayer.zip 可以通过 PLAN REPLAYER LOAD 语句直接导入到 TiDB 集群中进行信息查看,具体方法可参考使用 PLAN REPLAYER 导入集群信息