飞书集成平台 x Grafana:打造监控告警系统全攻略

飞书集成平台 x Grafana:打造监控告警系统全攻略
Photo by Sigmund / Unsplash

Grafana告警内容设置

告警内容分为:告警标题告警说明告警详情。告警标题和告警说明用来描述告警的规则。告警详情,描述告警的规则和具体的值。

告警详情 Description 设置

  1. 打印所有的标签
{{ $labels }}

alertname=High CPU usage, grafana_folder=CPU alerts, instance=server1
  1. 自定义格式化打印所有的标签
{{ range $k, $v := $labels -}}
{{ $k }}={{ $v }}
{{ end }}

alertname=High CPU usage
grafana_folder=CPU alerts
instance=server1
  1. 打印单个标签
The host {{ index $labels "instance" }} has exceeded 80% CPU usage for the last 5 minutes

The host server1 has exceeded 80% CPU usage for the last 5 minutes
  1. 打印具体的值
{{ index $values "A"· }}

81.2345
  1. if - else 的使用
{{ if (gt $values.A.Value 80.0) -}}
high
{{ else if (gt $values.A.Value 50.0) -}}
medium
{{ else -}}
low
{{- end }}
  1. 其他格式化函数
函数
函数名
示例
输出
args

{{define "x"}}{{.arg0}} {{.arg1}}{{end}}{{template "x" (args 1 "2")}}
1 2
externalURL

{{ externalURL }}
https://example.com/grafana
graphLink

{{ graphLink "{\"expr\": \"up\", \"datasource\": \"gdev-prometheus\"}" }}
/explore?left=["now-1h","now","gdev-prometheus",{"datasource":"gdev-prometheus","expr":"up","instant":false,"range":true}]
humanize
易读
{{ humanize 1000.0 }}
1k
humanize1024
易读 1024
{{ humanize1024 1024.0 }}
1ki
humanizeDuration
易读 时长
{{ humanizeDuration 60.0 }}
1m 0s
humanizePercentage
易读 百分比
{{ humanizePercentage 0.2 }}
20%
humanizeTimestamp
易读 1024
{{ humanizeTimestamp 1577836800.0 }}
2020-01-01 00:00:00 +0000 UTC
match

{{ match "a.*" "abc" }}
true
pathPrefix

{{ pathPrefix }}
/grafana
tableLink

{{ tableLink "{\"expr\": \"up\", \"datasource\": \"gdev-prometheus\"}" }}
/explore?left=["now-1h","now","gdev-prometheus",{"datasource":"gdev-prometheus","expr":"up","instant":true,"range":false}]
title

{{ title "hello, world!" }}
Hello, World!
toLower

{{ toLower "Hello, world!" }}
hello, world!
toUpper

{{ toUpper "Hello, world!" }}
HELLO, WORLD!
reReplaceAll

{{ reReplaceAll "localhost:(.*)" "example.com:$1" "localhost:8080" }}
example.com:8080

详见文档:

https://grafana.com/docs/grafana/latest/alerting/fundamentals/annotation-label/variables-label-annotation/#functions

飞书集成平台

可以认为是一套开发可用的“低代码平台”,在本案例中,做了以下几个步骤:

  1. 触发器接受 grafana 的告警
  2. 从“值班”多维表格中获取今天值班人员信息
  3. 使用 javascript 预处理告警信息,包括:标题、内容、runbook、值班人员等
  4. 根据告警类型信息选择不同的飞书消息卡片模板
  5. 结合模板和数据,发送到告警群(可在集成平台中配置)

飞书集成平台的触发器提供一个回调地址,将地址填写到 grafana 联络点,选择 webhook 完成设置。

参考链接

Read more

golang proto api 校验国际化 protovalidate

golang proto api 校验国际化 protovalidate

众所周知,protobuf 原型文件扩展很多功能,比如生成 http 接口层代码,顺势就有了生成接口参数校验代码的需求。 早期可以使用https://github.com/bufbuild/protoc-gen-validate 来实现,通过生成特定的 go 代码的方式来实现校验。 github 中也提到目前趋于稳定,不会有更多新特性的支持,推荐大家使用新的版本 protovalidate,https://github.com/bufbuild/protovalidate 。该版本是protoc-gen-validate 的“精神继承者”。它不需要任何代码生成并支持自定义约束。 现在我们尝试新版本,并且增加国际化支持。 go get github.com/bufbuild/protovalidate-go import "github.com/bufbuild/protovalidate-go" syntax = "proto3"; package

By brian
git clone 复制一个整个仓库并推送到新地址

git clone 复制一个整个仓库并推送到新地址

要使用 git clone --bare 复制一个新的仓库并推送到远程仓库,可以按照以下步骤操作: 1. 克隆一个裸仓库 首先,使用 git clone --bare 命令克隆源仓库。假设源仓库的 URL 是 https://github.com/user/source-repo.git,你可以执行以下命令: bash复制 git clone --bare https://github.com/user/source-repo.git 这将创建一个新的裸仓库(没有工作区),通常会创建一个名为 source-repo.git 的目录。 2. 进入裸仓库目录 进入刚刚克隆的裸仓库目录: bash复制 cd source-repo.git 3. 添加新的远程仓库 接下来,

By brian
搜索引擎技巧不用多,学会 3 个加速 100% 找到目标

搜索引擎技巧不用多,学会 3 个加速 100% 找到目标

在搜索时使用英文关键词,提高结果质量。尽量使用 google.com 以下搜索引擎技巧在 google.com 进行测试,效果都很好,前三个非常常用且强烈推荐。 使用精确搜索 * 建议: 使用双引号 "" 搜索完全匹配的短语,避免无关结果。 * 示例: * "Java NullPointerException" fix * 场景: 找到错误信息的精确解决方案。 利用站内搜索 * 建议: 使用 site: 限制搜索范围到特定网站。 * 示例: * site:stackoverflow.com "TypeError: undefined is not a function" * 场景: 搜索 Stack Overflow、官方文档或技术博客的特定内容。 一些关键词 * 建议:

By brian
沪ICP备2022013452号-1