异常检测日志事件 (proto)
data.cluster.v3.OutlierDetectionEvent
[data.cluster.v3.OutlierDetectionEvent proto]
{
"type": ...,
"timestamp": {...},
"secs_since_last_action": {...},
"cluster_name": ...,
"upstream_url": ...,
"action": ...,
"num_ejections": ...,
"enforced": ...,
"eject_success_rate_event": {...},
"eject_consecutive_event": {...},
"eject_failure_percentage_event": {...}
}
- type
(data.cluster.v3.OutlierEjectionType) 在发生排除的情况下,表示所发生的排除类型。
- timestamp
(Timestamp) 事件的时间戳。
- secs_since_last_action
(UInt64Value) 自上次操作(排除或取消排除)发生以来的秒数。
- upstream_url
(string, REQUIRED) 被排除主机的 URL。例如,
tcp://1.2.3.4:80
。
- action
(data.cluster.v3.Action) 所执行的操作。
- num_ejections
(uint32) 如果
action
为eject
,则指定主机被排除的次数(特定于该 Envoy,如果主机因任何原因从上游集群中删除然后重新添加,则会重置)。
- enforced
(bool) 如果
action
为eject
,则指定是否强制排除。true
表示主机已被排除。false
表示已记录事件,但主机实际上并未被排除。
- eject_success_rate_event
(data.cluster.v3.OutlierEjectSuccessRate)
必须设置eject_success_rate_event、eject_consecutive_event 或 eject_failure_percentage_event 中的其中一个。
- eject_consecutive_event
(data.cluster.v3.OutlierEjectConsecutive)
必须设置eject_success_rate_event、eject_consecutive_event 或 eject_failure_percentage_event 中的其中一个。
- eject_failure_percentage_event
(data.cluster.v3.OutlierEjectFailurePercentage)
必须设置eject_success_rate_event、eject_consecutive_event 或 eject_failure_percentage_event 中的其中一个。
data.cluster.v3.OutlierEjectSuccessRate
[data.cluster.v3.OutlierEjectSuccessRate proto]
{
"host_success_rate": ...,
"cluster_average_success_rate": ...,
"cluster_success_rate_ejection_threshold": ...
}
- host_success_rate
(uint32) 在排除事件发生时,主机的成功率,范围为 0-100。
- cluster_average_success_rate
(uint32) 在排除事件发生时,集群中主机的平均成功率,范围为 0-100。
- cluster_success_rate_ejection_threshold
(uint32) 在排除事件发生时,成功率排除阈值。
data.cluster.v3.OutlierEjectConsecutive
data.cluster.v3.OutlierEjectFailurePercentage
[data.cluster.v3.OutlierEjectFailurePercentage proto]
{
"host_success_rate": ...
}
- host_success_rate
(uint32) 在排除事件发生时,主机的成功率,范围为 0-100。
Enum data.cluster.v3.OutlierEjectionType
[data.cluster.v3.OutlierEjectionType proto]
所发生的排除类型
- CONSECUTIVE_5XX
(DEFAULT) 如果上游主机返回一定数量的连续 5xx。如果outlier_detection.split_external_local_origin_errors 为
false
,则所有类型的错误都将视为 HTTP 5xx 错误。有关详细信息,请参见集群异常检测 文档。
- CONSECUTIVE_GATEWAY_FAILURE
如果上游主机返回一定数量的连续网关错误
- SUCCESS_RATE
在来自集群中每个主机的聚合成功率统计数据上运行,并选择成功回复比率偏离集群中其他主机的主机。如果outlier_detection.split_external_local_origin_errors 为
false
,则所有错误(外部和本地生成的错误)都用于计算成功率统计数据。有关详细信息,请参见集群异常检测 文档。
- CONSECUTIVE_LOCAL_ORIGIN_FAILURE
连续本地来源故障:连接故障、重置、超时等 只有当outlier_detection.split_external_local_origin_errors 设置为
true
时,才会发生此类型的排除。有关详细信息,请参见集群异常检测 文档。
- SUCCESS_RATE_LOCAL_ORIGIN
在集群中所有主机的本地来源故障的聚合成功率统计数据上运行,并选择成功率偏离集群中其他主机的主机。只有当outlier_detection.split_external_local_origin_errors 设置为
true
时,才会发生此类型的排除。有关详细信息,请参见集群异常检测 文档。
- FAILURE_PERCENTAGE
在来自集群中每个主机的聚合成功率统计数据上运行,并选择失败回复比率高于配置值的那些主机。
- FAILURE_PERCENTAGE_LOCAL_ORIGIN
在来自集群中每个主机的本地来源故障的聚合成功率统计数据上运行,并选择失败回复比率高于配置值的那些主机。
Enum data.cluster.v3.Action
[data.cluster.v3.Action proto]
表示应用于上游主机的可能操作
- EJECT
(DEFAULT) 如果主机已被排除在服务之外
- UNEJECT
如果主机已被带回服务中