Replies: 2 comments
-
|
夜莺目前的告警逻辑是承袭自 Prometheus 生态。在 Prometheus 生态里,不同的机器有不同的告警阈值是通过 promql 来过滤,比如你所有的机器的 cpu_usage_idle 小于 20 告警,但是唯独有一台机器(假设是 hosta)要求小于 30 告警,应该设置两个告警规则,比如: 当然,未必一定使用 ident 标签过滤,具体可以使用什么标签过滤,取决于 cpu_usage_idle 这个指标有哪些标签。 之所以出现和 zabbix 这样的不同设计,是因为 zabbix 更侧重机器设备监控,偏资产管理的视角,Prometheus 生态的设计更偏应用监控,倾向于一次配置一批 series,通过标签做过滤。后面夜莺也有计划提供类似 zabbix 这样的能力,不过人力问题,目前还没有排期。 |
Beta Was this translation helpful? Give feedback.
0 replies
-
|
谢谢回复,明白原因了 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
夜莺的告警规则配置方法和zabbix是有很大区别的。
zabbix是将模版配置给单个机器,比如有个机器用zabbix监控,可以单独给这个机器绑定linux监控模版,mysql监控模版等。这样的好处是,如果我想单独调整一下这个机器的告警阈值,比如模版是大于80%内存使用就告警,那我可以单独对这个机器禁用这个80%内存告警,然后再对这个机器单独新建一个大于90%的内存告警。
再看夜莺的告警规则,它是针对业务组生效的,业务组下有好多机器。这么做的缺点就是单独调整某个机器的告警策略,就没有zabbix那样灵活。
对于夜莺的这个问题困扰我很多年了,不知道是不是我的使用方法有问题。
Beta Was this translation helpful? Give feedback.
All reactions