경보

경보

지표를 감시해 알림을 보내는 경보를 생성할 수 있습니다. 예를 들면, Virtual Server 서버의 CPU 사용량과 디스크 읽기 및 쓰기를 모니터링한 다음에 증가한 로드를 처리하기 위해 사용자에게 알림을 보냅니다.

경보 정책

경보 정책은 동일한 Account의 지표를 감시할 수 있으며, 하나의 지표에 대해 경보 평가합니다. 이러한 경보 정책은 지정된 임곗값과 지표 조건을 비교하여 조건에 충족하는 경우 알림을 발송합니다.

경보 정책을 비활성화하면 경보 정책에 대한 평가는 지속되지만, 지정된 알림 수신자에게 알림 발송은 제한할 수 있습니다. 경보 정책이 설정된 자원에 대해 일시적으로 알림 발송을 중단하고자 하는 경우, 경보 정책 비활성화를 활용할 수 있습니다.

경보 정책을 활성화하면 경보 정책에 대한 평가가 시작되고, 설정된 조건에 따라 경보 상태가 Alert으로 변경되고 경보 상태가 변경될 때마다 알림을 발송합니다.

경보 정책 상태는 경보 정책에 대한 활성화/비활성화 여부를 확인할 수 있습니다.

경보 정책 상태설명
Active경보 정책이 활성화된 상태로 설정한 조건에 따라 알림 발송이 가능한 상태
  • 설정에 맞게 경보 평가를 하여 지정한 알림 수신자에게 알림을 발송함
Inactive경보 정책이 비활성화된 상태로 알림 발송이 제한된 상태
  • 경보 정책에 대한 경보 평가는 중단되지 않고, 알림 발송만 제한됨.
표. 경보 정책 상태

경보 정책에 대해서 경보 단계를 설정할 수 있습니다. 경보 단계에 따라 경보에 대한 색(빨간색/분홍색/보라색)을 다르게 표현하여 색깔로 단계를 시각적으로 구분할 수 있도록 합니다. 경보 정책의 경보 단계에 맞게 필터링하여 경보 단계별로 경보 정책을 조회할 수 있습니다.

경보 단계설명
High경보 정책 조건에 대한 단계를 High로 설정하면, 경보 단계는 빨간색으로 표현
Midle경보 정책 조건에 단계를 Middel로 설정하면, 경보 단계는 분홍색으로 표현
Low경보 정책 조건에 단계를 Middel로 설정하면, 경보 단계는 보라색으로 표현
표. 경보 정책 단계

경보 상태

경보 상태는 경보 정책의 경보 평가에 따라 상태가 변경됩니다. 경보 상태는 Normal(정상), Insufficient data(데이터 부족), Alert(경보) 세 가지 상태로 나뉩니다.

경보 상태설명
Normal경보 정책에 설정된 조건에 충족하지 않은 상태로 정상적인 상태를 의미
  • Normal 상태는 초록색으로 표현
Insufficient data경보 정책이 방금 생성되었거나 지표를 사용할 수 없거나 지표에서 경보 상태를 결정하는 데 사용할 수 있는 데이터가 충분하지 않은 상태
  • Insufficient data 상태는 회색으로 표현
Alert경보 정책에 설정된 조건에 충족한 상태
  • Alert 상태는 빨간색으로 표현
  • Alert 상태로 변경될 때, 사용자에게 알림을 발송
표. 경보 상태
참고
경보 정책이 처음 생성되면, 경보 상태는 Insufficient data 상태로 초기화됩니다. 이후 지표 데이터가 수집되면 경보 상태는 Normal 또는 Alert 상태로 변경됩니다.

경보 평가

용어설명
지표 데이터 포인트지표 데이터로부터 계산한 통계 데이터. 데이터 포인트는 타임스탬프와 수집된 통계 데이터, 데이터의 단위로 구성
  • 데이터 포인트의 통계는 합계, 평균, 최소, 최대로 각각 계산
지표 수집 주기서비스 별로 지표 데이터를 수집해오는 시간 간격
  • 네임스페이스의 지표별로 지정되어 있음
  • 예시: 1분 또는 5분
경보 평가 주기경보가 조건을 만족하는지 평가하는 시간 간격
  • 지표 수집 주기가 1분 이상인 경우 경보 평가 주기1분 단위로 고정
  • 경보 평가 범위 x 지표 수집 주기24시간을 넘기는 경우 경보 평가 주기1시간 단위로 고정
경보 평가 범위경보 평가를 위한 평가 시간 범위
  • 지표 수집 주기 또는 수집 주기의 배수로 설정하는 것을 권장
경보 평가 횟수/경보 위반 횟수경보 평가 간격동안 평가 횟수 중에서 위반 횟수 만큼 조건에 만족하면 경보 상태를 Alert으로 전환
  • 위반 횟수평가 횟수작거나 같게 설정 가능
  • 기본값은 1로 설정
경보 평가 간격경보 평가 범위(초) X 경보 평가 횟수
표. 경보 평가 용어

예를 들어, 1분 수집 주기를 가진 지표에 대해 1분 평가 범위로 5번의 평가 횟수 중 위반 횟수 4번으로 설정하는 경우 평가 간격은 5분입니다. 5분 수집 주기를 가진 지표에 대해 10분의 평가 범위로 3번의 평가 횟수 중 3번으로 위반 횟수를 설정하는 경우 평가 간격은 30분입니다.

구분예시 1예시 2
지표 수집 주기1분5분
경보 평가 주기(고정)1분1분
경보 평가 범위1분10분
경보 평가 횟수5회3회
경보 위반 횟수4회3회
경보 평가 간격 (초)5분(300초)30분(1,800초)
조건5분동안 5회 평가하여 4회 조건에 만족하는 경우, 경보 상태를 Alert으로 변경30분 동안 3회 평가하여 3회 조건에 만족하는 경우, 경보 상태를 Alert으로 변경
표. 경보 평가 예시

평가 범위

경보 정책의 평가 범위는 경보 평가를 위한 평가 시간 범위입니다.

  • 지표의 수집 주기 또는 수집 주기의 배수로 설정하는 것을 권장합니다.
  • 최대 604,800(7일)초 까지 입력할 수 있습니다.
주의
평가 범위를 수집 주기보다 작거나 수집 주기의 배수에 맞지 않게 설정한 경우, 경보 평가가 정상적으로 되지 않을 수 있습니다.
평가 범위설정 가능한 평가 횟수
7일(604,800초)1
1일(86,400초)7 이하
6시간(21,600초)28 이하
1시간(3,600초)168 이하
15분(900초)96 이하
5분(300초)288 이하
1분(60초)1,440 이하
표. 평가 범위에 따른 설정 가능한 평가 횟수
안내

평가 범위 및 평가 횟수는 다음과 같은 제한이 있습니다:

  • 평가 범위가 1시간(3,600초) 이상일 때, 평가 간격(평가 횟수 X 평가 범위)는 최대 7일(604,800초)까지 가능
  • 평가 범위가 1시간(3,600초) 미만일 때, 평가 간격(평가 횟수 X 평가 범위)는 최대 1일(86,400초)까지 가능

조건

경보 평가를 하기 위한 조건은 조건 연산자와 임곗값 설정이 필요합니다.

용어설명
통계경보 평가를 위해 평가 범위 동안 지표 데이터를 계산하는 방식
조건 연산자경보 평가를 위해 평가 범위 동안 지표 데이터를 계산한 후, 해당 값과 임곗값을 비교할 조건 연산자를 선택.
임곗값경보 평가를 위해 평가 범위 동안 지표 데이터를 계산한 후, 해당 값과 조건 연산자로 비교할 임곗값을 정의
표. 조건 용어

네임스페이스가 Virtual Server이고, 지표가 CPU Usage(단위: %)인 경우, 아래와 같이 경보 평가 조건이 완성됩니다.

구분예시 1예시 2
지표 수집 주기1분5분
경보 평가 주기(고정)1분1분
경보 평가 범위1분10분
경보 평가 횟수5회3회
경보 위반 횟수4회3회
경보 평가 간격 (초)5분(300초)30분(1,800초)
통계평균합계
조건 연산자>=<
임곗값8020
조건5분 동안 4번 평균 CPU Usage >= 80% 이면, 경보 상태를 Alert으로 변경30분 동안 3번 평균 CPU Usage < 20% 이면, 경보 상태를 Alert으로 변경
표. 경보 평가 예시 - 조건 연산자, 임곗값, 통계 추가

경보 알림

경보 평가 조건에 만족하는 경우 경보 상태를 Alert로 변경하고, 경보 정책에 설정된 알림 수신자에게 알림을 발송합니다.

참고
  • 로그인 이력이 있는 사용자(이메일, 휴대전화 번호 등록 사용자)만 경보의 알림 수신자로 추가할 수 있습니다.
  • 알림 수신 방식(E-mail 또는 SMS)은 알림 설정 페이지에서 알림 대상을 서비스 > 경보로 선택하여 설정할 수 있습니다.
  • 알림 수신자는 최대 100명까지 추가할 수 있습니다.
안내
  • 로그인 이력이 없는 사용자는 알림 수신자로 지정할 수 없습니다.
  • 알림 설정 페이지에서 알림 대상을 서비스 > 경보로 선택하여 알림 수신 방식을 설정하지 않은 경우, 알림을 수신할 수 없습니다.

경보 평가 시, 누락 데이터 처리 방법

일부 자원은 특정 조건에서 지표 데이터를 ServiceWatch로 전송하지 못할 수 있습니다. 예를 들어, 특정 자원이 비활성 상태이거나, 자원이 존재하지 않는 경우 ServiceWatch로 전송하지 않습니다. 일정 기간 동안 지표가 수집되지 않으면 경보 평가에 의해 경보 상태는 Insufficient data로 변경됩니다.

ServiceWatch에서는 경보 평가 시 누락 데이터를 처리하는 방법을 제공합니다. 누락 데이터 처리 방법은 다음과 같습니다:

  • Ignore: 현재의 경보 상태를 유지합니다. (기본값)
  • Missing: 누락 데이터 포인트를 누락으로 처리합니다. 평가 범위 내의 모든 데이터 포인트가 누락이면, 경보 상태는 Insufficient data 상태로 전환합니다.
  • Breaching: 누락 데이터 포인트에 대해 임곗값 조건에 만족하는 것으로 처리합니다.
  • Not breaching: 누락 데이터 포인트에 대해 임곗값 조건에 만족하지 않는 정상으로 처리합니다.
참고
  • 2025년 12월 릴리즈 이전에 생성한 경보 정책의 경우 기본값인 Ignore 로 누락 데이터를 처리하며, 2025년 12월 릴리즈 이후 부터 누락 데이터 처리 방법을 직접 선택할 수 있습니다.
  • 경보 정책에서 누락 데이터 처리 방법 수정 가능하며, 수정한 시점부터 변경된 방법으로 누락 데이터를 처리합니다.

경보 이력

경보 상태에 대한 변경 이력은 경보 이력에 기록됩니다. 경보 이력은 30일 동안 조회 가능합니다.

지표
로그