| title |
PingCAP Clinic 数据采集说明 |
| summary |
详细说明 PingCAP Clinic 诊断服务在使用 TiUP 部署的 TiDB 集群和 DM 集群中能够采集哪些诊断数据。 |
本文提供了 PingCAP Clinic 诊断服务(以下简称为 PingCAP Clinic)在使用 TiUP 部署的 TiDB 集群和 DM 集群中能够采集的诊断数据类型,并列出了各个采集项对应的采集参数。当执行 Clinic Diag 诊断客户端(以下简称为 Diag)数据采集命令时,你可以依据需要采集的数据类型,在命令中添加所需的采集参数。
通过 PingCAP Clinic 在使用 TiUP 部署的集群中采集的数据仅用于诊断和分析集群问题。
Clinic Server 是部署在云端的云服务,位于 PingCAP 内网(中国境内)。如果你把采集的数据上传到了 Clinic Server 供 PingCAP 技术人员远程定位集群问题,这些数据将存储于 PingCAP 设立在 AWS S3 中国区(北京)的服务器。PingCAP 对数据访问权限进行了严格的访问控制,只有经授权的内部技术人员可以访问该数据。
在对应的技术支持 Case 关闭后,PingCAP 会在 90 天内对相关数据进行永久删除或匿名化处理。
本节列出了 Diag 在使用 TiUP 部署的 TiDB 集群中能够采集的诊断数据类型。
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 集群基础信息,包括集群 ID |
cluster.json |
每次收集默认采集 |
| 集群详细信息 |
meta.yaml |
每次收集默认采集 |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
tidb.log |
--include=log |
| Error 日志 |
tidb_stderr.log |
--include=log |
| 慢日志 |
tidb_slow_query.log |
--include=log |
| 配置文件 |
tidb.toml |
--include=config |
| 实时配置 |
config.json |
--include=config |
| 性能数据 |
cpu_profile.proto,mem_heap.proto,goroutine.txt,mutex.txt |
--include=perf |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
tikv.log |
--include=log |
| Error 日志 |
tikv_stderr.log |
--include=log |
| 配置文件 |
tikv.toml |
--include=config |
| 实时配置 |
config.json |
--include=config |
| 性能数据 |
cpu_profile.proto |
--include=perf |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
pd.log |
--include=log |
| Error 日志 |
pd_stderr.log |
--include=log |
| 配置文件 |
pd.toml |
--include=config |
| 实时配置 |
config.json |
--include=config |
tiup ctl pd -u http://${pd IP}:${PORT} store 的输出结果 |
store.json |
--include=config |
tiup ctl pd -u http://${pd IP}:${PORT} config placement-rules show 的输出结果 |
placement-rule.json |
--include=config |
| 性能数据 |
cpu_profile.proto,mem_heap.proto,goroutine.txt,mutex.txt |
--include=perf |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
tiflash.log |
--include=log |
| Error 日志 |
tiflash_stderr.log |
--include=log |
| 配置文件 |
tiflash-learner.toml,tiflash-preprocessed.toml,tiflash.toml |
--include=config |
| 实时配置 |
config.json |
--include=config |
| 性能数据 |
cpu_profile.proto |
--include=perf |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
ticdc.log |
--include=log |
| Error 日志 |
ticdc_stderr.log |
--include=log |
| 配置文件 |
ticdc.toml |
--include=config |
| 性能数据 |
cpu_profile.proto,mem_heap.proto,goroutine.txt,mutex.txt |
--include=perf |
| Debug 数据 |
info.txt,status.txt,changefeeds.txt,captures.txt,processors.txt |
--include=debug |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 所有的 Metrics 数据 |
{metric_name}.json |
--include=monitor |
| Alert 列表 |
alerts.json |
--include=monitor |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 获取 TiDB 系统变量(默认不采集,采集需要额外提供数据库帐号) |
mysql.tidb.csv |
--include=db_vars |
|
global_variables.csv |
--include=db_vars |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 内核日志 |
dmesg.log |
--include=system |
| 系统和硬件的基础信息 |
insight.json |
--include=system |
系统 /etc/security/limits.conf 中的内容 |
limits.conf |
--include=system |
| 内核参数列表 |
sysctl.conf |
--include=system |
| socket 统计信息(即 ss 的命令结果) |
ss.txt |
--include=system |
本节列出了 Diag 在使用 TiUP 部署的 DM 集群中能够采集的诊断数据类型。
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 集群基础信息,包括集群 ID |
cluster.json |
每次收集默认采集 |
| 集群详细信息 |
meta.yaml |
每次收集默认采集 |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
m-master.log |
--include=log |
| Error 日志 |
dm-master_stderr.log |
--include=log |
| 配置文件 |
dm-master.toml |
--include=config |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 日志 |
dm-worker.log |
--include=log |
| Error 日志 |
dm-worker_stderr.log |
--include=log |
| 配置文件 |
dm-work.toml |
--include=config |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 所有的 Metrics 数据 |
{metric_name}.json |
--include=monitor |
| Alert 列表 |
alerts.json |
--include=monitor |
| 诊断数据类型 |
输出文件 |
PingCAP Clinic 采集参数 |
| 内核日志 |
dmesg.log |
--include=system |
| 系统和硬件基础信息 |
insight.json |
--include=system |
系统 /etc/security/limits.conf 中的内容 |
limits.conf |
--include=system |
| 内核参数列表 |
sysctl.conf |
--include=system |
| socket 统计信息(即 ss 的命令结果) |
ss.txt |
--include=system |