문제 해결

1) Agent가 기동되지 않습니다

  • 설정 파일 문법 오류 여부를 확인합니다.
  • Java 실행 환경 및 권한을 점검합니다.
  • 로그 파일 생성 경로 권한을 확인합니다.

2) 발송이 지연됩니다

  • Queue 적체, TPS/session 설정을 확인합니다.
  • DB 응답 지연과 네트워크 지연을 점검합니다.
  • 외부 API 응답 시간과 오류율을 확인합니다.

3) 결과 반영이 누락됩니다

  • Receiver 및 스케줄러 동작 상태를 확인합니다.
  • 리포트 수신 경로와 방화벽 정책을 점검합니다.
  • 상태 전이 조건(msg_status 등) 로직을 점검합니다.

4) 중복 발송이 발생합니다

  • 키 설계(idempotencyKey, ref, 내부 PK)를 점검합니다.
  • 장애 복구 시 재처리 기준을 재검토합니다.
  • HA 전환 시 중복 실행 방지(lock) 정책을 확인합니다.

장애 대응 권장 순서

  1. 증상 구간(수집/발송/수신/이관)을 먼저 분리합니다.
  2. 최근 변경 이력(설정/배포)을 확인합니다.
  3. 로그와 지표를 기반으로 원인을 좁힙니다.
  4. 임시 조치 후 근본 원인 재발 방지 항목을 반영합니다.