监控 Nginx 服务状态是确保 Web 服务高可用的关键步骤。以下是全面的监控方案,涵盖基础检查、状态模块、日志分析和主流监控工具集成:
# 检查Nginx主进程
ps aux | grep nginx
# 使用systemctl(系统服务)
systemctl status nginx
# 使用init.d(旧系统)
service nginx status
ss -tulnp | grep nginx # 推荐
或
netstat -tulnp | grep nginx
在 nginx.conf
中添加:
server {
listen 80;
server_name localhost;
location /nginx_status {
stub_status on;
allow 127.0.0.1; # 限制访问IP
deny all;
}
}
重启后访问 http://server_ip/nginx_status
将看到:
Active connections: 3
server accepts handled requests
100 100 200
Reading: 0 Writing: 1 Waiting: 2
1) 安装 nginx-prometheus-exporter
:
docker run -d -p 9113:9113 nginx/nginx-prometheus-exporter \
-nginx.scrape-uri=http://nginx_server/nginx_status
2) Prometheus 配置示例:
scrape_configs:
- job_name: 'nginx'
static_configs:
- targets: ['exporter_ip:9113']
3) Grafana 仪表板导入 ID:12708(官方Nginx看板)
使用 nginx_status
模板:
1. 导入 Zabbix Nginx 模板
2. 配置自动发现规则监控多实例
# 监控5xx错误
tail -f /var/log/nginx/error.log | grep "HTTP/1.1\" 5"
# 统计请求TOP 10
awk '{print $7}' access.log | sort | uniq -c | sort -nr | head -10
# 当活跃连接 > 500时触发(示例)
if [ $(curl -s http://localhost/nginx_status | awk '/Active/ {print $3}') -gt 500 ]; then
echo "High connections!" | mail -s "Nginx Alert" admin@example.com
fi
# 自动重启服务(谨慎使用)
if ! pgrep nginx > /dev/null; then
systemctl restart nginx
echo "Nginx restarted at $(date)" >> /var/log/nginx_monitor.log
fi
指标类别 | 具体指标 | 告警阈值建议 |
---|---|---|
可用性 | 服务进程状态 | 进程不存在时 |
连接数 | Active connections | > 80%最大worker_connections |
错误率 | 5xx状态码比例 | > 1%请求量 |
响应时间 | upstream_response_time | p95 > 500ms |
流量 | request_rate | 突增300% |
监控端点无法访问
nginx_status
的IP白名单firewall-cmd --list-all
)指标数值异常
数据采集间隔
通过以上方案组合实施,可以实现从基础可用性监控到性能瓶颈分析的全方位覆盖。建议根据业务规模选择适合的工具组合,生产环境推荐使用 Prometheus + Grafana + ELK 的完整监控栈。