지표

지표

지표는 시스템 성능에 대한 데이터입니다. 기본적으로 많은 서비스에서 자원(예시: Virtual Server, File Storage 등)에 대한 무료 지표를 제공하며 이는 ServiceWatch를 통해 기본 모니터링으로 제공됩니다. Virtual Server와 같은 일부 자원에 대한 세부 모니터링을 사용할 수 있습니다.

지표 데이터는 15개월(455일) 동안 보관되기 때문에 최신 데이터와 이력 데이터를 모두 볼 수 있습니다.

용어예시설명
네임스페이스Virtual Server지표를 구분하고 그룹화하기 위한 논리적인 구분
지표(메트릭)CPU 사용률수집하려는 특정 데이터의 이름
차원(Dimensions)resource_id지표에 대한 고유 식별자 역할
수집 주기5분지표를 제공하는 각 서비스로부터 지표 데이터의 수집 주기
통계평균지정된 기간 동안의 지표 데이터 집계하는 방법
단위%통계의 측정 단위
집계 기간5분수집된 지표 데이터를 집계하는 기간
경보CPU 사용률 >= 80% | 5분 동안 발생CPU 사용률이 80% 이상인 상태가 5분 동안 지속되는 경우 Alert 상태로 변경
표. ServiceWatch 지표 용어

네임스페이스

네임스페이스는 ServiceWatch의 지표를 구분하고 그룹화하기 위한 논리적인 구분입니다. Samsung Cloud Platform 서비스의 네임스페이스는 대부분 서비스 이름과 동일하게 사용하며, ServiceWatch 연계 서비스 목록에서 확인 가능합니다.

사용자 정의 지표의 경우 ServiceWatch에서 다른 지표들과 구분할 수 있는 네임스페이스를 사용자가 정의할 수 있으며 ServiceWatch Agent 설정 또는 OpenAPI를 통해 정의할 수 있습니다. 사용자 정의 지표와 로그에 대한 자세한 내용은 사용자 정의 지표 및 로그에서 확인할 수 있습니다.

지표(메트릭)

지표는 ServiceWatch에 수집되는 시간순으로 정렬된 데이터 포인트 집합을 나타냅니다. 데이터 포인트는 타임스탬프와 수집된 데이터, 데이터의 단위로 구성되어 있습니다.

예를 들어, 특정 Virtual Server 서버의 CPU 사용률은 Virtual Server에서 제공하는 기본 모니터링 지표 중 하나입니다. 데이터 포인트 자체는 데이터를 수집하는 모든 애플리케이션이나 활동에서 발생할 수 있습니다.

기본적으로 ServiceWatch와 연계된 Samsung Cloud Platform 서비스는 자원에 대한 지표를 무료로 제공합니다. 일부 자원에 대한 상세 모니터링을 유료로 제공하며 각 서비스에서 활성화할 수 있습니다.

지표는 생성된 리전에서만 조회 가능합니다. 지표는 임의로 사용자가 삭제할 수 없습니다. 다만, 새로운 데이터가 ServiceWatch로 게시되지 않으면 15개월 후 자동으로 만료됩니다. 15개월(455일)이 지난 데이터 포인트는 순차적으로 만료되며, 새로운 데이터 포인트가 추가되면 15개월(455일)이 지난 데이터는 삭제됩니다.

타임 스탬프

데이터 포인트의 타임 스탬프는 데이터 포인트가 기록된 시간을 나타내는 시간 정보입니다. 각 지표 데이터 포인트는 시간인 타임스탬프와 데이터로 구성되어있습니다.

타임스탬프는 시간, 분, 초와 날짜로 구성되어 있습니다.

지표 보존 기간

ServiceWatch 지표 데이터를 다음과 같이 유지합니다.

  • 수집 주기가 60초(1분)로 설정된 데이터 포인트는 15일까지 사용 가능
  • 수집 주기가 300초(5분)로 설정된 데이터 포인트는 63일까지 사용 가능
  • 수집 주기가 3600초(1시간)로 설정된 데이터 포인트는 455일(15개월)까지 사용 가능

처음 짧은 수집 주기로 수집되었던 데이터 포인트는 장기 보관을 위해 다운샘플링하여 저장합니다.

예를 들어 1분 주기로 데이터를 수집한 경우, 1분 단위로 15일 동안 유지됩니다. 15일이 지난 후에도 이 데이터는 계속 유지되지만, 5분 단위로만 검색할 수 있습니다. 63일이 지난 후에는 이 데이터가 다시 집계되어 1시간 단위로 제공됩니다. 지표 보존 기간보다 더 오랫동안 지표의 데이터 포인트를 보관해야 하는 경우 파일 다운로드 또는 Object Storage 내보내기 기능을 통해 별도 보관할 수 있습니다.

차원(Dimensions)

지표에 대한 고유 식별자 역할을 하는 키-값 쌍으로, 이를 통해 데이터 포인트를 분류하고 필터링할 수 있습니다.

예를 들어 Virtual Server의 지표의 resource_id 차원을 이용하여 특정 서버에 대한 지표들을 식별할 수 있습니다.

수집 주기

각 서비스의 지표에 대한 데이터 포인트를 수집하는 주기를 의미하며, 각 서비스에서 사전 정의한 수집 주기로 제공됩니다.

각 서비스의 지표 수집 주기는 각 서비스의 ServiceWatch 지표 페이지를 참고하세요.

참고
ServiceWatch 연계 서비스의 지표 페이지는 지표와 로그 모니터링를 참고하세요.

예를 들어 Virtual Server는 기본 모니터링일때 수집 주기를 5분으로 제공하며, 세부 모니터링을 활성화하면 1분으로 제공합니다.

통계

통계는 지정된 기간 동안의 지표 데이터 집계하는 방법입니다. ServiceWatch는 각 서비스에서 ServiceWatch에 제공한 지표 데이터 포인트를 기반으로 통계로 집계한 데이터 제공합니다. 집계는 지정된 집계 기간 내에 네임스페이스, 지표 이름, 차원 및 데이터 포인트 단위를 사용하여 수행됩니다.

제공되는 통계는 합계, 평균, 최소, 최대입니다.

  • 합계: 해당 기간 동안 수집된 모든 데이터 포인트 값의 합계
  • 평균: 지정된 기간 동안 (해당 기간 동안 모든 데이터 포인터 값의 합)/(해당 기간 동안 데이터 포인터 수) 값
  • 최소: 지정된 기간 동안 관찰된 가장 낮은 값
  • 최대: 지정된 기간 동안 관찰된 가장 높은 값

단위

각 통계에는 측정 단위가 있습니다. 단위의 예로는 Bytes, Second, Count, Percent 등 이 있습니다.

집계 기간

각 통계는 선택한 집계 기간동안 수집된 지표의 데이터 포인터를 계산합니다. 집계 기간은 1분, 5분, 15분, 30분, 1시간, 3시간, 6시간, 12시간, 1일 중에 선택할 수 있으며, 기본값은 5분입니다. 집계 기간은 지표 데이터 포인트의 수집 주기와 밀접한 관련이 있으며, 정상적인 집계 결과를 얻으려면 집계 기간이 수집 주기보다 길거나 같아야 합니다.

예를 들어 통계는 평균, 집계 기간은 5분을 선택하고, 수집 주기가 1분인 지표를 선택한 경우, 1분 간격으로 데이터 포인트를 수집하여 5분 동안 수집된 데이터 포인트에 대해 평균을 계산하여 나타냅니다. 반대로 수집 주기보다 집계 기간이 더 짧으면 정상적인 집계 결과를 얻을 수 없음을 의미합니다.

지표 데이터의 장기 보관을 위해 다운샘플링이 적용됩니다. 예를 들어 1분 주기로 데이터를 수집한 경우, 15일이 지나면 이 데이터는 5분 단위로만 검색할 수 있습니다. 이런 지표에 대해 집계 기간을 5분에서 30분으로 설정하면 다운 샘플링한 데이터를 정상적으로 조회하기 위해서 최대 5분의 시간이 소요될 수 있습니다. 이후 63일이 지난 후에는 이 데이터가 다시 집계되어 1시간 단위로 제공됩니다. 이때 1시간부터 1일까지의 집계 기간을 선택하면 정상적인 데이터 조회를 위해 최대 1시간의 시간이 소요될 수 있습니다. 이는 지표 데이터를 다운 샘플링하여 집계하는 시간이 소요되어 집계 지연이 발생할 수 있습니다.

참고
지표 데이터 조회 시, 집계 지연으로 인해 가장 최신 데이터 포인트가 표시되지 않을 수 있는데, 이 경우 집계 기간을 설정한 것보다 작게 변경하거나 일정 시간(5분 또는 1시간) 이후에 조회하면 정상적으로 확인이 가능합니다.
집계 기간집계 지연
1분-
5분최대 5분
15분최대 5분
30분최대 5분
1시간최대 1시간
3시간최대 1시간
6시간최대 1시간
12시간최대 1시간
1일최대 1시간
표. ServiceWatch 집계 기간에 따른 집계 지연

경보

경보 정책을 생성할 때 입력한 평가 범위 동안 하나의 지표에 대해 평가하여 임곗값을 기준으로 설정한 조건에 충족될 경우 사용자에게 경보 알림으로 안내할 수 있습니다.

경보 상태는 Alert(경보), Normal(정상), Insufficient data(데이터 없음)로 구분됩니다.

  • Alert(경보): 지표가 설정된 조건에 충족하는 경우
  • Normal(정상): 지표가 설정된 조건에 충족하지 않은 경우
  • Insufficient data(데이터 없음): 지표 데이터가 존재하지 않거나, 지표 데이터가 누락되었거나, 지표 데이터가 아직 도착하지 않은 경우

경보 상태가 Alert일때, 경보 평가하여 조건에서 벗어나는 경우 다시 경보 상태가 Normal로 변경됩니다.

경보에 대한 자세한 내용은 경보 항목을 참조하세요.

기본 모니터링과 세부 모니터링

ServiceWatch는 기본 모니터링과 세부 모니터링, 두 종류의 모니터링을 제공합니다.

ServiceWatch와 연계된 Samsung Cloud Platform 서비스는 ServiceWatch에 기본 지표 세트를 무료로 게시하여 기본 모니터링을 제공합니다. 기본적으로 해당 서비스를 하나라도 사용하면 기본 모니터링을 자동으로 활성화되어 ServiceWatch에서 확인 가능합니다.

참고
기본 모니터링을 제공하는 서비스는 ServiceWatch 연계 서비스 목록에서 확인 가능하며, 점차 확대될 예정입니다.

세부 모니터링은 일부 서비스에서만 제공되며 요금이 부과됩니다. 세부 모니터링을 사용하려면 해당 서비스 상세에서 활성화해야합니다.

세부 모니터링 옵션은 제공하는 서비스에 따라 다릅니다.

  • Virtual Server의 기본 모니터링은 수집 주기가 5분입니다. 세부 모니터링을 활성화하면 기본 모니터링으로 제공되는 지표에 대해서 5분 → 1분 주기로 수집합니다.
안내
2025년 10월 ServiceWatch 세부 모니터링은 Virtual Server만 제공됩니다. 추후 세부 모니터링 대상 서비스는 확대될 예정입니다.

다음은 세부 모니터링을 제공하는 서비스와 가이드가 포함되어 있습니다.

서비스가이드
Virtual Server/GPU ServerVirtual Server 세부 모니터링 활성화하기
표. ServiceWatch 세부 모니터링 서비스
Overview
경보