Wavefront云监控工具使用教程:从零搭建服务器监控
Wavefront云监控工具适合哪些场景?
Wavefront 是 VMware 旗下的一款实时监控分析平台,擅长处理海量时间序列数据。
如果你需要统一监控云上实例、本地服务器或容器化环境的性能指标,并且希望用灵活的查询语言快速定位异常,Wavefront云监控工具 是个不错的选择。
它自带仪表盘、告警和异常检测功能,尤其适合微服务和容器场景。
用前准备:账号与本地环境
- 注册 Wavefront 账号:访问
https://www.wavefront.com/创建免费试用账号(无需信用卡),登录后进入控制台。 - 准备一台 Linux 服务器(CentOS 7+ 或 Ubuntu 18.04+),用于安装数据采集组件。
- 获取 API Token:在 Wavefront 控制台右上角齿轮图标 →
API Tokens→ 生成一个新 Token 并保存——这个 Token 会用于后续认证。 - 确认时间同步:运行
timedatectl检查服务器时间是否与 UTC 偏差小于 5 秒,NTP 未同步会导致数据无法正确展示。
通过 Telegraf 向 Wavefront 发送监控数据
Telegraf 是 InfluxData 团队开源的指标采集器,内置 Wavefront 输出插件,无需额外安装代理。
下面是完整步骤:
1. 安装 Telegraf
以 CentOS 为例,执行以下命令添加仓库并安装:
cat <
Ubuntu 用户可参考官方文档用 apt 安装。
2. 配置 Telegraf 输出到 Wavefront
编辑 Telegraf 主配置 /etc/telegraf/telegraf.conf,在 [[outputs.wavefront]] 节中填入以下内容(若不存在则手动添加):
[[outputs.wavefront]]
## Wavefront 实例地址(从控制台 Overview 页获取)
host = "your-instance.wavefront.com"
token = "你的API Token"
## 可选:为指标增加前缀便于区分
metric_separator = "."
source_override = ["host", "hostname"]
convert_path = true
请将host和token替换为实际值。如果你不知道实例地址,可以在控制台顶部地址栏看到类似https://your-instance.wavefront.com。
3. 启动 Telegraf 并验证运行
sudo systemctl enable telegraf
sudo systemctl start telegraf
sudo systemctl status telegraf # 确认状态为 active (running)
查看日志确认无错误:sudo journalctl -u telegraf -n 50 --no-pager。
常见踩坑点与解决办法
- 数据未到达 Wavefront:检查网络能否访问
your-instance.wavefront.com:443。可以用curl -v https://your-instance.wavefront.com测试连通性。如果被防火墙拦截,请放行出站流量。 - 时间戳错误:Telegraf 默认使用当前系统时间上报。如果服务器时间误差过大,Wavefront 会拒绝数据。务必开启 NTP 服务:
sudo timedatectl set-ntp true。 - Token 权限不足:在 API Tokens 页面确认 Token 未被禁用,且具有
Ingest权限。 - 指标名称带特殊字符:Wavefront 指标名只支持数字、字母、点、下划线和反斜杠。如果 Telegraf 插件输出的指标名包含空格或
-,可在telegraf.conf中使用fieldpass或metric_filter清洗。
验证数据与后续使用
登录 Wavefront 控制台,在左侧搜索栏输入 telegraf 或 cpu,你应该能看到来自服务器的指标。
点击 Chart 可以创建折线图,例如选择 cpu.usage_user 查看 CPU 使用率。
如果你希望收到异常告警,可以进入 Alerts → New Alert,设置阈值条件(如 CPU 连续 5 分钟超过 90%),并选择邮件、Slack 等通知方式。
至此,你已经完成了 Wavefront云监控工具使用 的入门部署。
现在你可以基于这套架构,继续添加更多采集插件(如内存、磁盘、Docker 容器),搭建属于自己的统一监控平台。