문제 해결
1) Agent가 기동되지 않습니다
- 설정 파일 문법 오류 여부를 확인합니다.
- Java 실행 환경 및 권한을 점검합니다.
- 로그 파일 생성 경로 권한을 확인합니다.
2) 발송이 지연됩니다
- Queue 적체, TPS/session 설정을 확인합니다.
- DB 응답 지연과 네트워크 지연을 점검합니다.
- 외부 API 응답 시간과 오류율을 확인합니다.
3) 결과 반영이 누락됩니다
- Receiver 및 스케줄러 동작 상태를 확인합니다.
- 리포트 수신 경로와 방화벽 정책을 점검합니다.
- 상태 전이 조건(msg_status 등) 로직을 점검합니다.
4) 중복 발송이 발생합니다
- 키 설계(
idempotencyKey,ref, 내부 PK)를 점검합니다. - 장애 복구 시 재처리 기준을 재검토합니다.
- HA 전환 시 중복 실행 방지(lock) 정책을 확인합니다.
장애 대응 권장 순서
- 증상 구간(수집/발송/수신/이관)을 먼저 분리합니다.
- 최근 변경 이력(설정/배포)을 확인합니다.
- 로그와 지표를 기반으로 원인을 좁힙니다.
- 임시 조치 후 근본 원인 재발 방지 항목을 반영합니다.