插件窝 干货文章 WGCLOUD运维监控:如何监测服务器应用运行状态?

WGCLOUD运维监控:如何监测服务器应用运行状态?

告警 监控 配置 进程 995    来源:    2025-03-30

WGCLOUD作为轻量级的运维监控系统,监测服务器应用运行状态主要通过以下几个核心功能实现,以下是具体操作指南:


一、基础环境部署

  1. 安装Agent

    • 在被监控服务器下载对应版本的agent(支持Linux/Windows)
    • 解压后执行start.shstart.bat启动(默认端口9999)
    • 自动注册到server端(server端配置文件application.yml可修改IP白名单)
  2. Server端配置

    • 修改server/config/application.yml中的数据库配置
    • 通过server/start.sh启动服务(默认端口8080)

二、应用状态监测方案

▶ 1. 进程监控(核心功能)

  • 配置位置:Agent端config/application.yml
processes:
  - name: "nginx"          # 自定义进程名
    cmd: "nginx: master"  # 进程标识(支持ps命令检索的关键字)
    alarm: true           # 启用告警
  • 效果
    • 实时显示进程CPU/MEM占用
    • 进程异常退出时触发告警(邮件/钉钉/企业微信)

▶ 2. 端口监控

ports:
  - port: 3306            # 监控端口
    name: "MySQL"
    alarm: true
  • 支持TCP/UDP端口检测,连接失败时告警

▶ 3. 自定义脚本监控

  • 在agent的script目录放置监测脚本(如check_tomcat.sh
  • 脚本返回JSON格式:
{"alarmCode":0, "msg":"OK", "data":{"load":0.5}}
  • 通过WEB界面配置脚本执行周期

三、告警配置

  1. 修改server端配置
mail:
  enabled: true
  host: smtp.163.com
  username: sender@163.com
  password: xxxxxx
  receiver: admin@company.com
  1. 告警阈值设置
    • CPU连续5分钟>90%触发告警
    • 内存使用超过95%触发告警
    • 磁盘inode<10%触发告警

四、高级监控场景

1. SpringBoot应用监控

  • 通过/actuator/health接口检测:
http:
  - url: "http://127.0.0.1:8080/actuator/health"
    method: GET
    timeout: 3000
    keyword: '"status":"UP"'  # 健康检查关键字

2. 数据库连接监控

  • 示例MySQL检测脚本:
#!/bin/bash
if mysqladmin ping -h127.0.0.1 -uroot -pxxxx; then
  echo '{"alarmCode":0, "msg":"MySQL OK"}'
else
  echo '{"alarmCode":1, "msg":"MySQL Down"}'
fi

五、故障排查技巧

  1. Agent离线检测

    • 检查agent/logs/wgcloud-agent.log日志
    • 验证网络连通性:telnet server_ip 8080
  2. 数据采集异常

    • 确认采集项配置无语法错误
    • 检查/etc/hosts是否配置了正确的主机名解析
  3. 性能数据不准

    • 调整采集频率(默认60秒,可在agent/config/application.yml修改cron参数)

六、最佳实践建议

  1. 对关键业务进程配置双关键字检测
processes:
  - name: "Redis"
    cmd: "redis-server *:6379"  # 更精确的进程匹配
  1. 建议对SSH(22)、数据库(3306/5432)等关键端口启用监控

  2. 生产环境建议部署二级监控节点,避免单点故障


通过上述配置,WGCLOUD可实现: ✅ 实时进程存活监控
✅ 资源阈值告警
✅ 自定义业务健康检查
✅ 历史数据可视化(通过内置仪表盘)

如需监控K8s/Docker环境,需额外部署对应的采集模块(WGCLOUD支持容器监控扩展)。