管理服务器
管理服务器不可达
当 Envoy 实例失去与管理服务器的连接时,Envoy 将锁定在之前的配置上,同时在后台积极重试以重新建立与管理服务器的连接。
重要的是 Envoy 检测到何时与管理服务器的连接不健康,以便它可以尝试建立新的连接。建议在连接到管理服务器的集群中配置 TCP 保持活动 或 HTTP/2 保持活动。
Envoy 调试日志记录了它无法建立与管理服务器的连接的事实,每次它尝试连接时都会记录。
connected_state 统计信息提供了一个信号来监控这种行为。
统计信息
管理服务器有一个以 control_plane. 为根的统计信息树,其中包含以下统计信息
名称 |
类型 |
描述 |
---|---|---|
connected_state |
仪表 |
一个布尔值(连接为 1,断开连接为 0),指示与管理服务器的当前连接状态 |
rate_limit_enforced |
计数器 |
管理服务器请求强制执行速率限制的总次数 |
pending_requests |
仪表 |
强制执行速率限制时待处理请求的总数 |
identifier |
文本读出 |
发送最后一个发现响应的控制平面实例的标识符 |
xDS 订阅统计信息
Envoy 通过称为 xDS 的发现服务来发现其各种动态资源。资源通过 订阅 请求,通过指定要观察的文件系统路径、启动 gRPC 流或轮询 REST-JSON URL 来实现。
为所有订阅生成以下统计信息。
名称 |
类型 |
描述 |
---|---|---|
config_reload |
计数器 |
由于不同配置导致配置重新加载的 API 获取总数 |
config_reload_time_ms |
仪表 |
自纪元以来的最后一次配置重新加载的时间戳,以毫秒为单位 |
init_fetch_timeout |
计数器 |
总计 初始获取超时 |
update_attempt |
计数器 |
尝试的 API 获取总数 |
update_success |
计数器 |
成功完成的 API 获取总数 |
update_failure |
计数器 |
由于网络错误而失败的 API 获取总数 |
update_rejected |
计数器 |
由于模式/验证错误而失败的 API 获取总数 |
update_time |
仪表 |
自纪元以来的最后一次成功的 API 获取尝试的时间戳,以毫秒为单位。即使在没有配置更改的微不足道的配置重新加载后也会刷新。 |
version |
仪表 |
最后一次成功的 API 获取的内容的哈希值 |
version_text |
文本读出 |
来自最后一次成功的 API 获取的版本文本 |
control_plane.connected_state |
仪表 |
一个布尔值(连接为 1,断开连接为 0),指示与管理服务器的当前连接状态 |