728x90
교환기(Exchange) 관련 중요 메트릭
- rabbitmq.exchange.messages.publish.count
- 설명: 교환기에 게시된 총 메시지 수
- 중요성: 메시지 흐름의 정상 여부를 확인하는데 유용합니다.
갑작스러운 급증 또는 감소는 애플리케이션 문제를 의미할 수 있습니다.
- rabbitmq.exchange.messages.publish_out.rate
- 설명: 교환기에서 큐로 전달되는 메시지 속도(초당)
- 중요성: 교환기의 라우팅 성능을 평가하며, 라우팅 병목 현상을 파악할 수 있습니다.
- rabbitmq.exchange.messages.unroutable.returned.count
- 설명: 라우팅되지 못한 메시지 수(반환된 메시지)
- 중요성: 라우팅 오류를 조기에 감지하고 잘못된 설정을 빠르게 수정할 수 있습니다.
노드(Node) 관련 중요 메트릭
- rabbitmq.node.mem_used
- 설명: 노드가 사용하는 메모리(byte)
- 중요성: 메모리 사용량이 높아질 경우 메모리 경고가 발생하며, RabbitMQ는 메시지 게시를 차단할 수 있습니다.
- rabbitmq.node.disk_free
- 설명: 사용 가능한 디스크 공간
- 중요성: 디스크 공간이 부족할 경우 RabbitMQ가 디스크 경고를 발생시키고 메시지 게시를 차단합니다.
- rabbitmq.node.fd_used
- 설명: 사용 중인 파일 디스크립터 수
- 중요성: 파일 디스크립터가 부족하면 연결 차단이 발생할 수 있습니다.
연결(Connection) 관련 중요 메트릭
- rabbitmq.connections
- 설명: 현재 열려 있는 연결 수
- 중요성: 비정상적으로 많은 연결은 네트워크 또는 애플리케이션 문제를 나타낼 수 있습니다.
- rabbitmq.connection.incoming_bytes.count
- 설명: 연결을 통해 수신된 바이트 수
- 중요성: 높은 데이터 수신률은 애플리케이션의 트래픽 패턴과 네트워크 성능을 분석하는 데 유용합니다.
- rabbitmq.connection.channels
- 설명: 연결에서 사용 중인 채널 수
- 중요성: 채널 수가 너무 많을 경우 성능에 영향을 줄 수 있습니다.
큐(Queue) 관련 중요 메트릭
- rabbitmq.queue.messages_ready
- 설명: 즉시 처리 가능한 대기 메시지 수
- 중요성: 대기 메시지가 너무 많으면 소비자 처리 지연 또는 애플리케이션 병목을 의미할 수 있습니다.
- rabbitmq.queue.messages_unacknowledged
- 설명: 전달되었으나 아직 확인되지 않은 메시지 수
- 중요성: 미확인 메시지가 많으면 소비자 장애나 처리 문제를 의미합니다.
- rabbitmq.queue.memory
- 설명: 큐가 사용하는 메모리(byte)
- 중요성: 메모리 사용량이 많아질 경우 RabbitMQ가 메시지를 디스크로 페이지 아웃하여 성능이 저하될 수 있습니다.
참고 :
https://docs.datadoghq.com/integrations/rabbitmq/?tab=host
728x90
반응형
'DevOps > Observability' 카테고리의 다른 글
[Datadog] RabbitMQ Integration (3) | 2024.11.10 |
---|---|
Rabbit MQ on Datadog (2) | 2024.11.08 |
CoreDNS 모니터링으로 Kubernetes 네트워크 안정성 확보하기 (11) | 2024.11.07 |