插件窝 干货文章 如何使用 WGCLOUD 监控服务器上业务应用的运行状态?

如何使用 WGCLOUD 监控服务器上业务应用的运行状态?

监控 WGCLOUD 配置 Server 258    来源:    2025-03-30

WGCLOUD 是一款轻量级的开源服务器监控工具,可以方便地监控服务器硬件、业务应用和服务的运行状态。以下是使用 WGCLOUD 监控业务应用运行状态的详细步骤:

一、安装部署 WGCLOUD

  1. 下载安装包 从官网或 GitHub 下载最新版本的 WGCLOUD Agent 和 Server 安装包。

  2. 部署 Server 端

    # 解压安装包
    unzip wgcloud-server.zip -d /opt/wgcloud
    
    # 修改配置文件
    vim /opt/wgcloud/server/config/application.yml
    # 配置数据库、邮件报警等信息
    
    # 启动服务
    cd /opt/wgcloud/server
    ./start.sh
    
  3. 部署 Agent 端 在需要监控的服务器上:

    unzip wgcloud-agent.zip -d /opt/wgcloud
    vim /opt/wgcloud/agent/config/application.yml
    # 配置server地址:server.url=http://[server-ip]:9999
    ./start.sh
    

二、监控业务应用的关键配置

  1. 进程监控配置 在 agent 的配置文件中添加要监控的进程:

    # 监控nginx
    process:
     - name: nginx
       cmdline: nginx
    
    # 监控Java应用
     - name: myapp
       cmdline: java -jar myapp.jar
    
  2. 端口监控配置

    port:
     - name: web_port
       port: 8080
       type: tcp
     - name: mysql_port
       port: 3306
       type: tcp
    
  3. 自定义脚本监控 创建监控脚本:

    #!/bin/bash
    # 检查应用健康状态
    curl -s http://localhost:8080/health | grep -q '"status":"UP"'
    echo $?
    

    在配置中引用:

    script:
     - name: app_health
       path: /opt/scripts/check_health.sh
       timeout: 10
    

三、报警配置

  1. 邮件报警配置 在 server 端配置:

    mail:
     host: smtp.163.com
     port: 465
     username: yourmail@163.com
     password: xxxxxx
     from: yourmail@163.com
     ssl: true
    
  2. 设置报警规则

    • 进程不存在时报警
    • 端口不可达时报警
    • CPU连续5分钟>90%报警
    • 自定义脚本返回非0时报警

四、查看监控数据

  1. 通过Web界面访问

    http://[server-ip]:9999/wgcloud
    默认账号:admin/wgcloud
    
  2. 主要监控视图

    • 主机列表:查看所有服务器状态
    • 进程监控:显示进程存活状态
    • 端口监控:显示端口连通性
    • 自定义监控:显示脚本执行结果
    • 历史数据:查看各项指标趋势图

五、高级功能

  1. 自定义指标采集 通过编写采集脚本,将结果输出到指定文件:

    #!/bin/bash
    echo "custom.metric.value $(ps aux | grep myapp | wc -l)" > /opt/wgcloud/agent/custom_metrics.txt
    
  2. API集成 使用 REST API 获取监控数据:

    GET /api/host/list
    GET /api/metrics?hostId=xxx
    

六、常见问题解决

  1. Agent无法连接Server

    • 检查防火墙是否开放9999端口
    • 确认agent配置中的server地址正确
  2. 进程监控不生效

    • 确保进程名匹配准确(使用ps aux确认实际进程名)
    • 检查agent用户是否有权限查看进程
  3. 自定义脚本超时

    • 优化脚本执行效率
    • 适当增加timeout值

通过以上配置,WGCLOUD 可以实现对业务应用的全方位监控,包括进程存活状态、服务端口、自定义健康检查等关键指标,并通过邮件、微信等方式及时发送报警通知。