管理服务器

管理服务器不可达

当 Envoy 实例失去与管理服务器的连接时,Envoy 将锁定在之前的配置上,同时在后台积极重试以重新建立与管理服务器的连接。

重要的是 Envoy 检测到何时与管理服务器的连接不健康,以便它可以尝试建立新的连接。建议在连接到管理服务器的集群中配置 TCP 保持活动HTTP/2 保持活动

Envoy 调试日志记录了它无法建立与管理服务器的连接的事实,每次它尝试连接时都会记录。

connected_state 统计信息提供了一个信号来监控这种行为。

统计信息

管理服务器有一个以 control_plane. 为根的统计信息树,其中包含以下统计信息

名称

类型

描述

connected_state

仪表

一个布尔值(连接为 1,断开连接为 0),指示与管理服务器的当前连接状态

rate_limit_enforced

计数器

管理服务器请求强制执行速率限制的总次数

pending_requests

仪表

强制执行速率限制时待处理请求的总数

identifier

文本读出

发送最后一个发现响应的控制平面实例的标识符

xDS 订阅统计信息

Envoy 通过称为 xDS 的发现服务来发现其各种动态资源。资源通过 订阅 请求,通过指定要观察的文件系统路径、启动 gRPC 流或轮询 REST-JSON URL 来实现。

为所有订阅生成以下统计信息。

名称

类型

描述

config_reload

计数器

由于不同配置导致配置重新加载的 API 获取总数

config_reload_time_ms

仪表

自纪元以来的最后一次配置重新加载的时间戳,以毫秒为单位

init_fetch_timeout

计数器

总计 初始获取超时

update_attempt

计数器

尝试的 API 获取总数

update_success

计数器

成功完成的 API 获取总数

update_failure

计数器

由于网络错误而失败的 API 获取总数

update_rejected

计数器

由于模式/验证错误而失败的 API 获取总数

update_time

仪表

自纪元以来的最后一次成功的 API 获取尝试的时间戳,以毫秒为单位。即使在没有配置更改的微不足道的配置重新加载后也会刷新。

version

仪表

最后一次成功的 API 获取的内容的哈希值

version_text

文本读出

来自最后一次成功的 API 获取的版本文本

control_plane.connected_state

仪表

一个布尔值(连接为 1,断开连接为 0),指示与管理服务器的当前连接状态