Monitor các metric chính bằng Prometheus + Grafana:
- Queue depth — tăng liên tục báo hiệu consumer lag;
- Consumer count — bằng 0 là vấn đề;
- Unacked messages — message bị stuck;
- Publish/consume rate — throughput;
- Memory usage — backpressure ở 40% mặc định;
- Connection/channel count — phát hiện leak;
- Node health — disk space, GC pauses
Alert: queue depth tăng > 1000/phút, zero consumer > 5 phút, memory > 70%, connection churn > 100/giây.
Dùng plugin rabbitmq_prometheus tích hợp sẵn.