WGCLOUD作为轻量级的运维监控系统,监测服务器应用运行状态主要通过以下几个核心功能实现,以下是具体操作指南:
安装Agent
start.sh
或start.bat
启动(默认端口9999)application.yml
可修改IP白名单)Server端配置
server/config/application.yml
中的数据库配置server/start.sh
启动服务(默认端口8080)config/application.yml
processes:
- name: "nginx" # 自定义进程名
cmd: "nginx: master" # 进程标识(支持ps命令检索的关键字)
alarm: true # 启用告警
ports:
- port: 3306 # 监控端口
name: "MySQL"
alarm: true
script
目录放置监测脚本(如check_tomcat.sh
){"alarmCode":0, "msg":"OK", "data":{"load":0.5}}
mail:
enabled: true
host: smtp.163.com
username: sender@163.com
password: xxxxxx
receiver: admin@company.com
/actuator/health
接口检测:http:
- url: "http://127.0.0.1:8080/actuator/health"
method: GET
timeout: 3000
keyword: '"status":"UP"' # 健康检查关键字
#!/bin/bash
if mysqladmin ping -h127.0.0.1 -uroot -pxxxx; then
echo '{"alarmCode":0, "msg":"MySQL OK"}'
else
echo '{"alarmCode":1, "msg":"MySQL Down"}'
fi
Agent离线检测:
agent/logs/wgcloud-agent.log
日志telnet server_ip 8080
数据采集异常:
/etc/hosts
是否配置了正确的主机名解析性能数据不准:
agent/config/application.yml
修改cron
参数)双关键字检测
:processes:
- name: "Redis"
cmd: "redis-server *:6379" # 更精确的进程匹配
建议对SSH(22)、数据库(3306/5432)等关键端口启用监控
生产环境建议部署二级监控节点
,避免单点故障
通过上述配置,WGCLOUD可实现:
✅ 实时进程存活监控
✅ 资源阈值告警
✅ 自定义业务健康检查
✅ 历史数据可视化(通过内置仪表盘)
如需监控K8s/Docker环境,需额外部署对应的采集模块(WGCLOUD支持容器监控扩展)。