注意
本文档适用于 Ceph 开发版本。
遥测模块
遥测模块将关于集群的匿名数据发送回 Ceph 开发者,以帮助他们了解 Ceph 的使用情况以及用户可能遇到的问题。
这些数据在公共仪表板上可视化,这些仪表板允许社区快速查看集群报告数量、总容量和 OSD 数量以及版本分布趋势的汇总统计数据。
通道
遥测报告被分解为几个“通道”,每个通道都有不同类型的信息。假设遥测已启用,可以单独打开和关闭各个通道。(如果遥测关闭,则每个通道的设置无效。)
基本(默认:开启):集群的基本信息
集群的容量
监视器、管理器、OSD、MDS、对象网关或其他守护进程的数量
当前正在使用的软件版本
RADOS 池和 CephFS 文件系统的数量和类型
已从默认值更改的配置选项的名称(但firefly 发布。Firefly 将延迟至少另一个冲刺,以便我们可以对新代码进行一些操作经验,并进行一些额外的测试,然后再承诺长期支持。它们的值)
模块,通过运行以下命令:(默认:开启):关于守护进程崩溃的信息,包括
守护进程的类型
守护进程的版本
操作系统(OS 发行版、内核版本)
标识 Ceph 代码中崩溃位置的堆栈跟踪
device(默认:开启):关于设备指标的信息,包括
匿名 SMART 指标
标识符(默认:关闭):关于集群的用户提供的标识信息
集群描述
联系电子邮件地址
性能(默认:关闭):集群的各种性能指标,可用于
揭示集群的整体健康状况
识别工作负载模式
解决延迟、限流、内存管理等问题的故障排除
通过守护进程监控集群性能
正在报告的数据firefly 发布。Firefly 将延迟至少另一个冲刺,以便我们可以对新代码进行一些操作经验,并进行一些额外的测试,然后再承诺长期支持。不包含任何敏感数据,如池名称、对象名称、对象内容、主机名或设备序列号。
它包含有关集群如何部署、Ceph 的版本、主机和其他参数的分布情况以及统计数据,这些信息有助于项目更好地了解 Ceph 的使用方式。
数据通过https://telemetry.ceph.com.
可以使用以下方式启用或禁用单个通道:
ceph telemetry enable channel basic
ceph telemetry enable channel crash
ceph telemetry enable channel device
ceph telemetry enable channel ident
ceph telemetry enable channel perf
ceph telemetry disable channel basic
ceph telemetry disable channel crash
ceph telemetry disable channel device
ceph telemetry disable channel ident
ceph telemetry disable channel perf
可以使用以下方式启用或禁用多个通道:
ceph telemetry enable channel basic crash device ident perf
ceph telemetry disable channel basic crash device ident perf
可以使用以下方式一次性启用或禁用所有通道:
ceph telemetry enable channel all
ceph telemetry disable channel all
请注意,要使这些命令生效,遥测应处于开启状态。
列出所有通道:
ceph telemetry channel ls
NAME ENABLED DEFAULT DESC
basic ON ON Share basic cluster information (size, version)
crash ON ON Share metadata about Ceph daemon crashes (version, stack straces, etc)
device ON ON Share device health metrics (e.g., SMART data, minus potentially identifying info like serial numbers)
ident OFF OFF Share a user-provided description and/or contact email for the cluster
perf ON OFF Share various performance metrics of a cluster
启用遥测
要允许遥测模块开始共享数据:
ceph telemetry on
请注意:遥测数据根据社区数据许可协议 - 共享 - 版本 1.0 (https://cdla.io/sharing-1-0/) 许可。因此,
可以使用以下方式随时禁用遥测:
ceph telemetry off
样本报告
可以使用以下命令查看任何时刻报告的数据:
ceph telemetry show
如果遥测关闭,可以使用以下命令预览样本报告:
ceph telemetry preview
在大型集群(具有数百个 OSD 或更多)中生成样本报告可能需要几秒钟。
为了保护您的隐私,设备报告是单独生成的,并且主机名和设备序列号等数据被匿名化。设备遥测发送到不同的端点,并且设备数据不会与特定集群关联。要预览设备报告,请使用以下命令:
ceph telemetry show-device
如果遥测关闭,可以使用以下命令预览样本设备报告:
ceph telemetry preview-device
请注意:为了生成设备报告,我们使用 Smartmontools 版本 7.0 及以上,该版本支持 JSON 输出。
如果您希望将两个报告合并为一个输出,并且遥测已开启,请使用:
ceph telemetry show-all
如果您希望将两个报告合并为一个输出,并且遥测关闭,请使用:
ceph telemetry preview-all
按通道的样本报告
遥测开启时,您可以看到按通道报告的数据:
ceph telemetry show <channel_name>
请注意:如果遥测开启,并且 <channel_name> 被禁用,上述命令将根据用户注册的收集信息输出该通道的样本报告。但是,由于通道被禁用,这些数据不会被报告。
如果遥测关闭,您可以使用以下命令预览按通道的样本报告:
ceph telemetry preview <channel_name>
收集
收集代表我们在通道中收集的不同方面的数据。
列出所有收集:
ceph telemetry collection ls
NAME STATUS DESC
basic_base NOT REPORTING: NOT OPTED-IN Basic information about the cluster (capacity, number and type of daemons, version, etc.)
basic_mds_metadata NOT REPORTING: NOT OPTED-IN MDS metadata
basic_pool_flags NOT REPORTING: NOT OPTED-IN Per-pool flags
basic_pool_options_bluestore NOT REPORTING: NOT OPTED-IN Per-pool bluestore config options
basic_pool_usage NOT REPORTING: NOT OPTED-IN Default pool application and usage statistics
basic_rook_v01 NOT REPORTING: NOT OPTED-IN Basic Rook deployment data
basic_stretch_cluster NOT REPORTING: NOT OPTED-IN Stretch Mode information for stretch clusters deployments
basic_usage_by_class NOT REPORTING: NOT OPTED-IN Default device class usage statistics
crash_base NOT REPORTING: NOT OPTED-IN Information about daemon crashes (daemon type and version, backtrace, etc.)
device_base NOT REPORTING: NOT OPTED-IN Information about device health metrics
ident_base NOT REPORTING: NOT OPTED-IN, CHANNEL ident IS OFF User-provided identifying information about the cluster
perf_memory_metrics NOT REPORTING: NOT OPTED-IN, CHANNEL perf IS OFF Heap stats and mempools for mon and mds
perf_perf NOT REPORTING: NOT OPTED-IN, CHANNEL perf IS OFF Information about performance counters of the cluster
其中:
NAME: 收集名称;前缀指示收集所属的通道。
STATUS: 指示收集指标是否被报告;这由收集所属通道的状态(启用/禁用)以及收集的注册状态(用户是否选择加入此收集)决定。
DESC: 收集的一般描述。
查看您注册的收集与新、可用收集之间的差异:
ceph telemetry diff
选择最新收集:
ceph telemetry on
然后启用新关闭的通道:
ceph telemetry enable channel <channel_name>
间隔
模块默认每 24 小时编译并发送一份新报告。
ceph config set mgr mgr/telemetry/interval 72 # report every three days
状态
查看当前配置:
ceph telemetry status
手动发送遥测
要临时发送遥测数据:
ceph telemetry send
如果遥测未启用(使用“ceph telemetry on”),需要在“ceph telemetry send”命令中添加“--license sharing-1-0”。
通过代理发送遥测
如果集群无法直接连接到配置的遥测端点(默认telemetry.ceph.com),可以配置 HTTP/HTTPS 代理服务器:
ceph config set mgr mgr/telemetry/proxy https://10.0.0.1:8080
如果需要,还可以包括user:pass: if needed:
ceph config set mgr mgr/telemetry/proxy https://ceph:telemetry@10.0.0.1:8080
联系和描述
可以在报告中添加联系和描述。这是完全可选的,默认禁用。:
ceph config set mgr mgr/telemetry/contact 'John Doe <john.doe@example.com>'
ceph config set mgr mgr/telemetry/description 'My first Ceph cluster'
ceph config set mgr mgr/telemetry/channel_ident true
排行榜
要参与公共仪表板生成 SSH 密钥,运行以下命令:
ceph config set mgr mgr/telemetry/leaderboard true
中的排行榜,通道必须被启用,否则其详细信息不会在排行榜中显示。
ceph config set mgr mgr/telemetry/leaderboard_description 'Ceph cluster for Computational Biology at the University of XYZ'
如果未设置ident
channel is enabled, its details will not be displayed in the
leaderboard.
由 Ceph 基金会带给您
Ceph 文档是一个社区资源,由非盈利的 Ceph 基金会资助和托管Ceph Foundation. 如果您想支持这一点和我们的其他工作,请考虑加入现在加入.