Overview
서비스 개요
ServiceWatch는 Samsung Cloud Platform에서 생성한 자원의 지표, 로그, 이벤트 등을 수집하여 모니터링하고 성능, 운영 상태 등 자원 전반에 대한 관찰성을 제공하는 여러 가지 도구를 제공하는 서비스입니다.
특장점
다음과 같은 특장점을 제공하고 있습니다.
- 자원 모니터링: 자원의 성능 지표(CPU Usage 등)를 수집하고 시각화합니다. 또한 여러 지표를 한 곳에서 시각적으로 확인할 수 있는 대시보드를 생성하여 한눈에 파악할 수 있습니다.
- 경보 정책 설정 및 자동 알림: 사전에 설정한 조건과 임곗값을 설정하여 경보 정책을 생성할 수 있고, 임곗값을 초과하게 되면 알림을 수신할 수 있어 자원의 상태에 대해 빠르게 확인하고 대응할 수 있습니다.
- 로그 분석 및 저장: 자원에서 발생한 로그를 수집하여 손쉽게 조회하고 검색할 수 있습니다. 수집한 로그는 로그 그룹에 보관하여 관리하며, 로그 그룹은 5GB까지 무료로 저장할 수 있습니다. 또한, 로그 보관 정책을 설정하여 로그 보관 기간을 지정할 수 있으며, 보관 기간이 지난 로그는 별도로 관리하지 않아도 됩니다.
- 비용 효율성: ServiceWatch는 사용한 만큼 비용을 지불하는 유연한 요금제를 제공하여 비용 효율적으로 사용할 수 있습니다. 또한 무료 이용 범위를 제공함으로써 무료로 사용해 본 후, 필요한 만큼 유료로 확장할 수 있습니다.
제공 기능
다음과 같은 기능을 제공하고 있습니다.
- 지표 모니터링
- 지표: ServiceWatch는 Samsung Cloud Platform의 서비스들이 ServiceWatch에 지표 데이터를 제공하고, ServiceWatch는 지표 데이터를 수집 및 저장하여 사용자에게 제공합니다.
- 대시보드: 단일 리전의 지표를 시각화하여 자원에 대한 통합된 뷰를 제공합니다.
- 경보: 사용자가 정의한 임곗값에 따라 지표의 변화를 확인할 수 있는 경보 기능을 제공하고 임곗값을 넘어갈 경우 알림을 제공합니다.
- 로그 모니터링
- ServiceWatch는 로그 관리 기능을 제공합니다. Samsung Cloud Platform 서비스로부터 수집된 로그는 로그 그룹에 저장되어 관리할 수 있습니다. 로그 보관 정책을 설정하여 로그 보관 기간을 관리할 수 있습니다. 또한 콘솔을 통해 로그 데이터를 조회 및 검색할 수 있고 로그 그룹을 Object Storage로 저장할 수 있는 기능을 제공합니다.
- ServiceWatch Agent
- ServiceWatch Agent를 통해 Virtual Server, GPU Server, Bare Metal Server 등에서 프로세스, CPU, 메모리, 디스크 사용량 및 네트워크 성능에 대한 자세한 지표를 수집할 수 있습니다. 또한 GPU 성능 지표도 수집할 수 있습니다. 그리고 Agent를 통해 자원에서 발생한 로그도 수집할 수 있습니다. (25년 12월 예정)
- 이벤트 모니터링
- ServiceWatch는 Samsung Cloud Platform에서 생성된 자원의 변경 사항에 대한 시스템 이벤트로부터 이벤트 규칙을 생성하여 특정 조건에 알림을 수신할 수 있습니다.
구성 요소
지표
지표란 시스템의 성능 데이터를 말합니다. 기본적으로 ServiceWatch와 연계된 서비스의 자원에 대해서는 무료 지표 기반으로 기본 모니터링을 제공합니다. 추가로 Virtual Server와 같은 서비스는 세부 모니터링을 활성화하여 유료 지표를 제공할 수 있습니다.
지표 데이터는 최대 15개월(455일) 동안 확인할 수 있습니다.
지표와 관련된 자세한 내용은 지표를 참고하세요.
로그
Virtual Server의 자원, Kubernetes Engine 등 Samsung Cloud Platform의 서비스에서 사용하는 시스템, 애플리케이션 및 서비스의 로그를 수집하고 저장하고 조회할 수 있습니다.
로그와 관련된 자세한 내용은 로그를 참고하세요.
이벤트
이벤트는 Samsung Cloud Platform 서비스에서 환경의 변화를 나타냅니다. 다음은 이벤트의 예제입니다.
- Virtual Server의 상태가 Stopped에서 Running으로 변경될 때 이벤트를 생성합니다.
- Object Storage에 새로운 버킷이 생성되었을 때 이벤트를 생성합니다.
- IAM 사용자를 사용자 그룹에서 제외하였을 때 이벤트를 생성합니다.
이벤트와 관련된 자세한 내용은 이벤트를 참고하세요.
대시보드
ServiceWatch에는 서비스별로 자동으로 사전 구축된 대시보드가 제공 예정이며, 직접 대시보드를 생성할 수도 있습니다.
안내
서비스별 사전 구축된 대시보드는 2026년 상반기 제공 예정입니다.
ServiceWatch Agent
ServiceWatch Agent는 Virtual Server, GPU Server 및 On-Prem. 서버 등 에서 지표, 로그를 수집하는 소프트웨어 구성 요소입니다. 이를 통해 기본적으로 제공되는 기본 모니터링보다 더 세밀한 인프라와 애플리케이션을 모니터링할 수 있습니다.
참고
ServiceWatch Agent를 통한 사용자 정의 지표/로그 수집은 현재 Samsung Cloud Platform For Enterprise에서만 사용 가능합니다. 이외 오퍼링에서도 향후 제공 예정입니다.
제약 사항
ServiceWatch의 제약 사항은 다음과 같습니다.
| 구분 | 설명 |
|---|
| 지표 조회 기간 | 지표 조회는 조회하는 시점부터 최대 455일까지 설정 가능 |
| 지표 조회 개수 | 최대 500개까지 지표를 선택하여 그래프로 확인 가능 |
| 지표 이미지 파일 다운로드 | 최대 지표 100개에 대한 지표 데이터에 대해 이미지 다운로드 가능 |
| 지표 Object Storage 내보내기 | 최대 지표 10개, 최대 조회 기간은 2개월(63일) 이내의 지표 데이터에 대해 Obect Storage 내보내기 가능 |
| 대시보드별 위젯/지표 개수 | - 하나의 대시보드에 포함된 전체 위젯에 최대 2,500 지표까지 추가 가능
|
| 경보 정책 개수 | Account/리전별 5,000개 이하 |
| 경보 이력 | 경보 이력은 30일 동안 조회 가능 |
| 경보 정책별 알림 수신자 수 | 100명 이하 |
| 로그 그룹 수 | Account/리전별 10,000개 이하 |
| 로그 다운로드 | 엑셀 다운로드 시, 로그 이벤트별 1MB, 최대 10,000개의 로그 이벤트 다운로드 가능- 로그 이벤트별 1MB 이상이거나 로그 이벤트 10,000개를 넘을 경우 로그 그룹 내보내기를 활용 권고
|
| 로그 그룹 내보내기 작업 수 | - Account 별 한번에 1개씩 내보내기 작업 실행 가능
|
| 로그 이벤트 크기 | 1MB 이하 |
| 이벤트 규칙 수 | Account/리전별 300개 이하 |
| 이벤트 패턴 크키 | 2MB 이하 |
| 이벤트 규칙별 알림 수신자 수 | 100명 이하 |
표. ServiceWatch 제약 사항
다음은 ServiceWatch의 월별 무료 제공 내역입니다.
| 구분 | 무료 제공 |
|---|
| 로그 | 매월 5GB 이하 저장 |
| 지표 | - 세부 모니터링 지표/사용자 정의 지표 매월 10개
|
| 대시보드 | 50개 이하 지표를 참조하는 대시보드에 대해 매월 3개- 51개 이상 지표를 참조하는 경우 월 1개의 대시보드 요금 과금
|
| 경보 정책 | 매월 10개 |
표. ServiceWatch 무료 제공 범위
리전별 제공 현황
ServiceWatch은 아래의 환경에서 제공 가능합니다.
| 리전 | 제공 여부 |
|---|
| 한국 서부(kr-west1) | 제공 |
| 한국 동부(kr-east1) | 제공 |
| 한국 남부1(kr-south1) | 제공 |
| 한국 남부2(kr-south2) | 제공 |
| 한국 남부3(kr-south3) | 제공 |
표. ServiceWatch 리전별 제공 현황
선행 서비스
ServiceWatch의 선행 서비스는 없습니다.
1 - 지표
지표
지표는 시스템 성능에 대한 데이터입니다. 기본적으로 많은 서비스에서 자원(예시: Virtual Server, File Storage 등)에 대한 무료 지표를 제공하며 이는 ServiceWatch를 통해 기본 모니터링으로 제공됩니다. Virtual Server와 같은 일부 자원에 대한 세부 모니터링을 사용할 수 있습니다.
지표 데이터는 15개월(455일) 동안 보관되기 때문에 최신 데이터와 이력 데이터를 모두 볼 수 있습니다.
| 용어 | 예시 | 설명 | |
|---|
| 네임스페이스 | Virtual Server | 지표를 구분하고 그룹화하기 위한 논리적인 구분 | |
| 지표(메트릭) | CPU 사용률 | 수집하려는 특정 데이터의 이름 | |
| 차원(Dimensions) | resource_id | 지표에 대한 고유 식별자 역할 | |
| 수집 주기 | 5분 | 지표를 제공하는 각 서비스로부터 지표 데이터의 수집 주기 | |
| 통계 | 평균 | 지정된 기간 동안의 지표 데이터 집계하는 방법 | |
| 단위 | % | 통계의 측정 단위 | |
| 집계 기간 | 5분 | 수집된 지표 데이터를 집계하는 기간 | |
| 경보 | CPU 사용률 >= 80% | 5분 동안 발생 | CPU 사용률이 80% 이상인 상태가 5분 동안 지속되는 경우 Alert 상태로 변경 | |
표. ServiceWatch 지표 용어
네임스페이스
네임스페이스는 ServiceWatch의 지표를 구분하고 그룹화하기 위한 논리적인 구분입니다. Samsung Cloud Platform 서비스의 네임스페이스는 대부분 서비스 이름과 동일하게 사용하며, ServiceWatch 연계 서비스 목록에서 확인 가능합니다.
사용자 정의 지표의 경우 ServiceWatch에서 다른 지표들과 구분할 수 있는 네임스페이스를 사용자가 정의할 수 있으며 ServiceWatch Agent 설정 또는 OpenAPI를 통해 정의할 수 있습니다. 사용자 정의 지표와 로그에 대한 자세한 내용은 사용자 정의 지표 및 로그에서 확인할 수 있습니다.
지표(메트릭)
지표는 ServiceWatch에 수집되는 시간순으로 정렬된 데이터 포인트 집합을 나타냅니다. 데이터 포인트는 타임스탬프와 수집된 데이터, 데이터의 단위로 구성되어 있습니다.
예를 들어, 특정 Virtual Server 서버의 CPU 사용률은 Virtual Server에서 제공하는 기본 모니터링 지표 중 하나입니다. 데이터 포인트 자체는 데이터를 수집하는 모든 애플리케이션이나 활동에서 발생할 수 있습니다.
기본적으로 ServiceWatch와 연계된 Samsung Cloud Platform 서비스는 자원에 대한 지표를 무료로 제공합니다. 일부 자원에 대한 상세 모니터링을 유료로 제공하며 각 서비스에서 활성화할 수 있습니다.
지표는 생성된 리전에서만 조회 가능합니다. 지표는 임의로 사용자가 삭제할 수 없습니다. 다만, 새로운 데이터가 ServiceWatch로 게시되지 않으면 15개월 후 자동으로 만료됩니다. 15개월(455일)이 지난 데이터 포인트는 순차적으로 만료되며, 새로운 데이터 포인트가 추가되면 15개월(455일)이 지난 데이터는 삭제됩니다.
타임 스탬프
데이터 포인트의 타임 스탬프는 데이터 포인트가 기록된 시간을 나타내는 시간 정보입니다. 각 지표 데이터 포인트는 시간인 타임스탬프와 데이터로 구성되어있습니다.
타임스탬프는 시간, 분, 초와 날짜로 구성되어 있습니다.
지표 보존 기간
ServiceWatch 지표 데이터를 다음과 같이 유지합니다.
- 수집 주기가 60초(1분)로 설정된 데이터 포인트는 15일까지 사용 가능
- 수집 주기가 300초(5분)로 설정된 데이터 포인트는 63일까지 사용 가능
- 수집 주기가 3600초(1시간)로 설정된 데이터 포인트는 455일(15개월)까지 사용 가능
처음 짧은 수집 주기로 수집되었던 데이터 포인트는 장기 보관을 위해 다운샘플링하여 저장합니다.
예를 들어 1분 주기로 데이터를 수집한 경우, 1분 단위로 15일 동안 유지됩니다. 15일이 지난 후에도 이 데이터는 계속 유지되지만, 5분 단위로만 검색할 수 있습니다. 63일이 지난 후에는 이 데이터가 다시 집계되어 1시간 단위로 제공됩니다. 지표 보존 기간보다 더 오랫동안 지표의 데이터 포인트를 보관해야 하는 경우 파일 다운로드 또는 Object Storage 내보내기 기능을 통해 별도 보관할 수 있습니다.
차원(Dimensions)
지표에 대한 고유 식별자 역할을 하는 키-값 쌍으로, 이를 통해 데이터 포인트를 분류하고 필터링할 수 있습니다.
예를 들어 Virtual Server의 지표의 resource_id 차원을 이용하여 특정 서버에 대한 지표들을 식별할 수 있습니다.
수집 주기
각 서비스의 지표에 대한 데이터 포인트를 수집하는 주기를 의미하며, 각 서비스에서 사전 정의한 수집 주기로 제공됩니다.
각 서비스의 지표 수집 주기는 각 서비스의 ServiceWatch 지표 페이지를 참고하세요.
참고
ServiceWatch 연계 서비스의 지표 페이지는
지표와 로그 모니터링를 참고하세요.
예를 들어 Virtual Server는 기본 모니터링일때 수집 주기를 5분으로 제공하며, 세부 모니터링을 활성화하면 1분으로 제공합니다.
통계
통계는 지정된 기간 동안의 지표 데이터 집계하는 방법입니다. ServiceWatch는 각 서비스에서 ServiceWatch에 제공한 지표 데이터 포인트를 기반으로 통계로 집계한 데이터 제공합니다. 집계는 지정된 집계 기간 내에 네임스페이스, 지표 이름, 차원 및 데이터 포인트 단위를 사용하여 수행됩니다.
제공되는 통계는 합계, 평균, 최소, 최대입니다.
- 합계: 해당 기간 동안 수집된 모든 데이터 포인트 값의 합계
- 평균: 지정된 기간 동안 (해당 기간 동안 모든 데이터 포인터 값의 합)/(해당 기간 동안 데이터 포인터 수) 값
- 최소: 지정된 기간 동안 관찰된 가장 낮은 값
- 최대: 지정된 기간 동안 관찰된 가장 높은 값
단위
각 통계에는 측정 단위가 있습니다. 단위의 예로는 Bytes, Second, Count, Percent 등 이 있습니다.
집계 기간
각 통계는 선택한 집계 기간동안 수집된 지표의 데이터 포인터를 계산합니다. 집계 기간은 1분, 5분, 15분, 30분, 1시간, 3시간, 6시간, 12시간, 1일 중에 선택할 수 있으며, 기본값은 5분입니다. 집계 기간은 지표 데이터 포인트의 수집 주기와 밀접한 관련이 있으며, 정상적인 집계 결과를 얻으려면 집계 기간이 수집 주기보다 길거나 같아야 합니다.
예를 들어 통계는 평균, 집계 기간은 5분을 선택하고, 수집 주기가 1분인 지표를 선택한 경우, 1분 간격으로 데이터 포인트를 수집하여 5분 동안 수집된 데이터 포인트에 대해 평균을 계산하여 나타냅니다. 반대로 수집 주기보다 집계 기간이 더 짧으면 정상적인 집계 결과를 얻을 수 없음을 의미합니다.
지표 데이터의 장기 보관을 위해 다운샘플링이 적용됩니다. 예를 들어 1분 주기로 데이터를 수집한 경우, 15일이 지나면 이 데이터는 5분 단위로만 검색할 수 있습니다. 이런 지표에 대해 집계 기간을 5분에서 30분으로 설정하면 다운 샘플링한 데이터를 정상적으로 조회하기 위해서 최대 5분의 시간이 소요될 수 있습니다. 이후 63일이 지난 후에는 이 데이터가 다시 집계되어 1시간 단위로 제공됩니다. 이때 1시간부터 1일까지의 집계 기간을 선택하면 정상적인 데이터 조회를 위해 최대 1시간의 시간이 소요될 수 있습니다. 이는 지표 데이터를 다운 샘플링하여 집계하는 시간이 소요되어 집계 지연이 발생할 수 있습니다.
참고
지표 데이터 조회 시, 집계 지연으로 인해 가장 최신 데이터 포인트가 표시되지 않을 수 있는데, 이 경우 집계 기간을 설정한 것보다 작게 변경하거나 일정 시간(5분 또는 1시간) 이후에 조회하면 정상적으로 확인이 가능합니다.
| 집계 기간 | 집계 지연 |
|---|
| 1분 | - |
| 5분 | 최대 5분 |
| 15분 | 최대 5분 |
| 30분 | 최대 5분 |
| 1시간 | 최대 1시간 |
| 3시간 | 최대 1시간 |
| 6시간 | 최대 1시간 |
| 12시간 | 최대 1시간 |
| 1일 | 최대 1시간 |
표. ServiceWatch 집계 기간에 따른 집계 지연
경보
경보 정책을 생성할 때 입력한 평가 범위 동안 하나의 지표에 대해 평가하여 임곗값을 기준으로 설정한 조건에 충족될 경우 사용자에게 경보 알림으로 안내할 수 있습니다.
경보 상태는 Alert(경보), Normal(정상), Insufficient data(데이터 없음)로 구분됩니다.
- Alert(경보): 지표가 설정된 조건에 충족하는 경우
- Normal(정상): 지표가 설정된 조건에 충족하지 않은 경우
- Insufficient data(데이터 없음): 지표 데이터가 존재하지 않거나, 지표 데이터가 누락되었거나, 지표 데이터가 아직 도착하지 않은 경우
경보 상태가 Alert일때, 경보 평가하여 조건에서 벗어나는 경우 다시 경보 상태가 Normal로 변경됩니다.
경보에 대한 자세한 내용은 경보 항목을 참조하세요.
기본 모니터링과 세부 모니터링
ServiceWatch는 기본 모니터링과 세부 모니터링, 두 종류의 모니터링을 제공합니다.
ServiceWatch와 연계된 Samsung Cloud Platform 서비스는 ServiceWatch에 기본 지표 세트를 무료로 게시하여 기본 모니터링을 제공합니다. 기본적으로 해당 서비스를 하나라도 사용하면 기본 모니터링을 자동으로 활성화되어 ServiceWatch에서 확인 가능합니다.
참고
기본 모니터링을 제공하는 서비스는
ServiceWatch 연계 서비스 목록에서 확인 가능하며, 점차 확대될 예정입니다.
세부 모니터링은 일부 서비스에서만 제공되며 요금이 부과됩니다. 세부 모니터링을 사용하려면 해당 서비스 상세에서 활성화해야합니다.
세부 모니터링 옵션은 제공하는 서비스에 따라 다릅니다.
- Virtual Server의 기본 모니터링은 수집 주기가 5분입니다. 세부 모니터링을 활성화하면 기본 모니터링으로 제공되는 지표에 대해서 5분 → 1분 주기로 수집합니다.
안내
2025년 10월 ServiceWatch 세부 모니터링은 Virtual Server만 제공됩니다. 추후 세부 모니터링 대상 서비스는 확대될 예정입니다.
다음은 세부 모니터링을 제공하는 서비스와 가이드가 포함되어 있습니다.
표. ServiceWatch 세부 모니터링 서비스
2 - 경보
경보
지표를 감시해 알림을 보내는 경보를 생성할 수 있습니다. 예를 들면, Virtual Server 서버의 CPU 사용량과 디스크 읽기 및 쓰기를 모니터링한 다음에 증가한 로드를 처리하기 위해 사용자에게 알림을 보냅니다.
경보 정책
경보 정책은 동일한 Account의 지표를 감시할 수 있으며, 하나의 지표에 대해 경보 평가합니다. 이러한 경보 정책은 지정된 임곗값과 지표 조건을 비교하여 조건에 충족하는 경우 알림을 발송합니다.
경보 정책을 비활성화하면 경보 정책에 대한 평가는 지속되지만, 지정된 알림 수신자에게 알림 발송은 제한할 수 있습니다.
경보 정책이 설정된 자원에 대해 일시적으로 알림 발송을 중단하고자 하는 경우, 경보 정책 비활성화를 활용할 수 있습니다.
경보 정책을 활성화하면 경보 정책에 대한 평가가 시작되고, 설정된 조건에 따라 경보 상태가 Alert으로 변경되고 경보 상태가 변경될 때마다 알림을 발송합니다.
경보 정책 상태는 경보 정책에 대한 활성화/비활성화 여부를 확인할 수 있습니다.
| 경보 정책 상태 | 설명 |
|---|
| ● Active | 경보 정책이 활성화된 상태로 설정한 조건에 따라 알림 발송이 가능한 상태- 설정에 맞게 경보 평가를 하여 지정한 알림 수신자에게 알림을 발송함
|
| ● Inactive | 경보 정책이 비활성화된 상태로 알림 발송이 제한된 상태- 경보 정책에 대한 경보 평가는 중단되지 않고, 알림 발송만 제한됨.
|
표. 경보 정책 상태
경보 정책에 대해서 경보 단계를 설정할 수 있습니다. 경보 단계에 따라 경보에 대한 색(빨간색/분홍색/보라색)을 다르게 표현하여 색깔로 단계를 시각적으로 구분할 수 있도록 합니다.
경보 정책의 경보 단계에 맞게 필터링하여 경보 단계별로 경보 정책을 조회할 수 있습니다.
| 경보 단계 | 설명 |
|---|
| High | 경보 정책 조건에 대한 단계를 High로 설정하면, 경보 단계는 빨간색으로 표현 |
| Midle | 경보 정책 조건에 단계를 Middel로 설정하면, 경보 단계는 분홍색으로 표현 |
| Low | 경보 정책 조건에 단계를 Middel로 설정하면, 경보 단계는 보라색으로 표현 |
표. 경보 정책 단계
경보 상태
경보 상태는 경보 정책의 경보 평가에 따라 상태가 변경됩니다. 경보 상태는 Normal(정상), Insufficient data(데이터 부족), Alert(경보) 세 가지 상태로 나뉩니다.
| 경보 상태 | 설명 |
|---|
| ● Normal | 경보 정책에 설정된 조건에 충족하지 않은 상태로 정상적인 상태를 의미 |
| ● Insufficient data | 경보 정책이 방금 생성되었거나 지표를 사용할 수 없거나 지표에서 경보 상태를 결정하는 데 사용할 수 있는 데이터가 충분하지 않은 상태- Insufficient data 상태는 회색으로 표현
|
| ● Alert | 경보 정책에 설정된 조건에 충족한 상태- Alert 상태로 변경될 때, 사용자에게 알림을 발송
|
표. 경보 상태
참고
경보 정책이 처음 생성되면, 경보 상태는 Insufficient data 상태로 초기화됩니다. 이후 지표 데이터가 수집되면 경보 상태는 Normal 또는 Alert 상태로 변경됩니다.
경보 평가
| 용어 | 설명 |
|---|
| 지표 데이터 포인트 | 지표 데이터로부터 계산한 통계 데이터. 데이터 포인트는 타임스탬프와 수집된 통계 데이터, 데이터의 단위로 구성- 데이터 포인트의 통계는 합계, 평균, 최소, 최대로 각각 계산
|
| 지표 수집 주기 | 서비스 별로 지표 데이터를 수집해오는 시간 간격 |
| 경보 평가 주기 | 경보가 조건을 만족하는지 평가하는 시간 간격- 지표 수집 주기가 1분 이상인 경우 경보 평가 주기를 1분 단위로 고정
- 경보 평가 범위 x 지표 수집 주기가 24시간을 넘기는 경우 경보 평가 주기를 1시간 단위로 고정
|
| 경보 평가 범위 | 경보 평가를 위한 평가 시간 범위- 지표 수집 주기 또는 수집 주기의 배수로 설정하는 것을 권장
|
| 경보 평가 횟수/경보 위반 횟수 | 경보 평가 간격동안 평가 횟수 중에서 위반 횟수 만큼 조건에 만족하면 경보 상태를 Alert으로 전환- 위반 횟수는 평가 횟수와 작거나 같게 설정 가능
|
| 경보 평가 간격 | 경보 평가 범위(초) X 경보 평가 횟수 |
표. 경보 평가 용어
예를 들어, 1분 수집 주기를 가진 지표에 대해 1분 평가 범위로 5번의 평가 횟수 중 위반 횟수 4번으로 설정하는 경우 평가 간격은 5분입니다. 5분 수집 주기를 가진 지표에 대해 10분의 평가 범위로 3번의 평가 횟수 중 3번으로 위반 횟수를 설정하는 경우 평가 간격은 30분입니다.
| 구분 | 예시 1 | 예시 2 |
|---|
| 지표 수집 주기 | 1분 | 5분 |
| 경보 평가 주기(고정) | 1분 | 1분 |
| 경보 평가 범위 | 1분 | 10분 |
| 경보 평가 횟수 | 5회 | 3회 |
| 경보 위반 횟수 | 4회 | 3회 |
| 경보 평가 간격 (초) | 5분(300초) | 30분(1,800초) |
| 조건 | 5분동안 5회 평가하여 4회 조건에 만족하는 경우, 경보 상태를 Alert으로 변경 | 30분 동안 3회 평가하여 3회 조건에 만족하는 경우, 경보 상태를 Alert으로 변경 |
표. 경보 평가 예시
평가 범위
경보 정책의 평가 범위는 경보 평가를 위한 평가 시간 범위입니다.
- 지표의 수집 주기 또는 수집 주기의 배수로 설정하는 것을 권장합니다.
- 최대 604,800(7일)초 까지 입력할 수 있습니다.
주의
평가 범위를 수집 주기보다 작거나 수집 주기의 배수에 맞지 않게 설정한 경우, 경보 평가가 정상적으로 되지 않을 수 있습니다.
| 평가 범위 | 설정 가능한 평가 횟수 |
|---|
| 7일(604,800초) | 1 |
| 1일(86,400초) | 7 이하 |
| 6시간(21,600초) | 28 이하 |
| 1시간(3,600초) | 168 이하 |
| 15분(900초) | 96 이하 |
| 5분(300초) | 288 이하 |
| 1분(60초) | 1,440 이하 |
표. 평가 범위에 따른 설정 가능한 평가 횟수
안내
평가 범위 및 평가 횟수는 다음과 같은 제한이 있습니다:
- 평가 범위가 1시간(3,600초) 이상일 때, 평가 간격(평가 횟수 X 평가 범위)는 최대 7일(604,800초)까지 가능
- 평가 범위가 1시간(3,600초) 미만일 때, 평가 간격(평가 횟수 X 평가 범위)는 최대 1일(86,400초)까지 가능
조건
경보 평가를 하기 위한 조건은 조건 연산자와 임곗값 설정이 필요합니다.
| 용어 | 설명 |
|---|
| 통계 | 경보 평가를 위해 평가 범위 동안 지표 데이터를 계산하는 방식 |
| 조건 연산자 | 경보 평가를 위해 평가 범위 동안 지표 데이터를 계산한 후, 해당 값과 임곗값을 비교할 조건 연산자를 선택. |
| 임곗값 | 경보 평가를 위해 평가 범위 동안 지표 데이터를 계산한 후, 해당 값과 조건 연산자로 비교할 임곗값을 정의 |
표. 조건 용어
네임스페이스가 Virtual Server이고, 지표가 CPU Usage(단위: %)인 경우, 아래와 같이 경보 평가 조건이 완성됩니다.
| 구분 | 예시 1 | 예시 2 |
|---|
| 지표 수집 주기 | 1분 | 5분 |
| 경보 평가 주기(고정) | 1분 | 1분 |
| 경보 평가 범위 | 1분 | 10분 |
| 경보 평가 횟수 | 5회 | 3회 |
| 경보 위반 횟수 | 4회 | 3회 |
| 경보 평가 간격 (초) | 5분(300초) | 30분(1,800초) |
| 통계 | 평균 | 합계 |
| 조건 연산자 | >= | < |
| 임곗값 | 80 | 20 |
| 조건 | 5분 동안 4번 평균 CPU Usage >= 80% 이면, 경보 상태를 Alert으로 변경 | 30분 동안 3번 평균 CPU Usage < 20% 이면, 경보 상태를 Alert으로 변경 |
표. 경보 평가 예시 - 조건 연산자, 임곗값, 통계 추가
경보 알림
경보 평가 조건에 만족하는 경우 경보 상태를 Alert로 변경하고, 경보 정책에 설정된 알림 수신자에게 알림을 발송합니다.
참고
- 로그인 이력이 있는 사용자(이메일, 휴대전화 번호 등록 사용자)만 경보의 알림 수신자로 추가할 수 있습니다.
- 알림 수신 방식(E-mail 또는 SMS)은 알림 설정 페이지에서 알림 대상을 서비스 > 경보로 선택하여 설정할 수 있습니다.
- 알림 수신자는 최대 100명까지 추가할 수 있습니다.
안내
- 로그인 이력이 없는 사용자는 알림 수신자로 지정할 수 없습니다.
- 알림 설정 페이지에서 알림 대상을 서비스 > 경보로 선택하여 알림 수신 방식을 설정하지 않은 경우, 알림을 수신할 수 없습니다.
경보 평가 시, 누락 데이터 처리 방법
일부 자원은 특정 조건에서 지표 데이터를 ServiceWatch로 전송하지 못할 수 있습니다. 예를 들어, 특정 자원이 비활성 상태이거나, 자원이 존재하지 않는 경우 ServiceWatch로 전송하지 않습니다. 일정 기간 동안 지표가 수집되지 않으면 경보 평가에 의해 경보 상태는 Insufficient data로 변경됩니다.
ServiceWatch에서는 경보 평가 시 누락 데이터를 처리하는 방법을 제공합니다. 누락 데이터 처리 방법은 다음과 같습니다:
- Ignore: 현재의 경보 상태를 유지합니다. (기본값)
- Missing: 누락 데이터 포인트를 누락으로 처리합니다. 평가 범위 내의 모든 데이터 포인트가 누락이면, 경보 상태는
Insufficient data 상태로 전환합니다. - Breaching: 누락 데이터 포인트에 대해 임곗값 조건에 만족하는 것으로 처리합니다.
- Not breaching: 누락 데이터 포인트에 대해 임곗값 조건에 만족하지 않는 정상으로 처리합니다.
참고
- 2025년 12월 릴리즈 이전에 생성한 경보 정책의 경우 기본값인 Ignore 로 누락 데이터를 처리하며, 2025년 12월 릴리즈 이후 부터 누락 데이터 처리 방법을 직접 선택할 수 있습니다.
- 경보 정책에서 누락 데이터 처리 방법 수정 가능하며, 수정한 시점부터 변경된 방법으로 누락 데이터를 처리합니다.
경보 이력
경보 상태에 대한 변경 이력은 경보 이력에 기록됩니다. 경보 이력은 30일 동안 조회 가능합니다.
3 - 로그
로그
ServiceWatch의 로그를 사용하면 로그를 제공하는 서비스의 자원으로부터 수집된 로그 파일을 모니터링, 저장하고 액세스할 수 있습니다.
| 로그 그룹1 | 로그 그룹1 | 로그 그룹1 | 로그 그룹2 | 로그 그룹2 | 로그 그룹2 |
|---|
| 로그 스트림1 | 로그 스트림2 | 로그 스트림3 | 로그 스트림A | 로그 스트림B | 로그 스트림C |
| 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | 로그 이벤트 |
| 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | 로그 이벤트 | … |
표. 로그 구성 - 로그 그룹, 로그 스트림, 로그 이벤트
참고
로그 구성의 예시로 아래와 같습니다.
- 📂 로그 그룹: “WebApp-Logs”
- 📄 로그 스트림 1: “Server-1”
- 📝 로그 이벤트 1: “[2025-03-20 10:00:01] User logged in”
- 📝 로그 이벤트 2: “[2025-03-20 10:05:34] Database connection error”
로그 그룹
로그 그룹은 동일한 보존 정책 설정을 공유하는 로그 스트림들의 컨테이너입니다. 각 로그 스트림은 하나의 로그 그룹에 속해야 합니다. 예를 들어, Kubernetes Engine의 각 클러스터의 로그에 대해 별도의 로그 스트림이 있으면 로그 스트림을 /scp/ske/{클러스터 이름} 라는 하나의 로그 그룹으로 묶을 수 있습니다.
로그 보관 정책
로그 보존 정책은 ServiceWatch에 로그 이벤트를 보관하는 기간을 설정할 수 있습니다. 기간이 만료된 로그 이벤트는 자동으로 삭제됩니다. 로그
그룹에 할당된 보존 기간은 로그 그룹에 속한 로그 스트림과 로그 이벤트에 적용됩니다.
보존 기간은 다음 중에서 선택할 수 있으며, 일 단위로 설정됩니다.
로그 스트림
로그 스트림은 동일한 소스에서 발생한 순서대로 정렬된 로그 이벤트들의 모음입니다. 예를 들어, 특정 Kubernetes Engine 클러스터에서 발생하는 모든 로그 이벤트는 하나의 로그 스트림을 구성할 수 있습니다.
로그 이벤트
로그 이벤트는 자원에서 발생하는 로그의 기록한 개별 레코드입니다. 로그 이벤트 레코드에는 이벤트가 발생한 시점에 대한 타임스탬프와 로그 메시지, 두 개의 속성이 포함되어 있습니다. 각 메시지는 UTF-8로 인코딩되어야 합니다.
로그 그룹 내보내기
로그 그룹에서 Object Storage로 로그 데이터를 내보내서 로그 보관 및 로그 분석에 사용할 수 있습니다. 동일한 Account에 있는 로그 데이터에 대해 로그 그룹 내보낼 수 있습니다.
로그 그룹 내보내기를 시작하려면 Object Storage 버킷을 생성해서 로그 데이터를 저장해야 합니다.
로그 그룹 내보내기 작업은 로그 양에 따라 시간이 오래 걸릴 수 있습니다. 로그 그룹 내보내기할 때 로그 그룹 내에 특정 스트림을 지정하거나, 시간 범위를 지정하여 로그 그룹 내보내기 작업 시간을 줄일 수 있습니다.
로그 그룹 내보내기는 동일한 Account에 한 번에 1건만 실행할 수 있습니다. 다른 로그 그룹 내보내기를 실행하려면 현재 진행중인 내보내기 작업이 완료되어야 합니다.
| 로그 그룹 내보내기 상태 | 설명 |
|---|
| ● Success | 로그 그룹 내보내기 작업이 성공적으로 완료되었습니다. |
| ● Pending | 로그 그룹 내보내기 작업 대기 중입니다. |
| ● In progress | 로그 그룹 내보내기 작업이 진행 중입니다. |
| ● File transferring | 로그 그룹 내보내기 파일 전송 중입니다. |
| ● Failed | 로그 그룹 내보내기 작업이 실패했습니다. |
표. 로그 그룹 내보내기 상태
로그 그룹 내보내기 이력 유지 기간 확인 필요
4 - 이벤트
이벤트는 Samsung Cloud Platform 서비스에서 환경의 변화를 나타냅니다.
대부분의 Samsung Cloud Platform 서비스에서 생성된 이벤트를 ServiceWatch가 수신합니다. 각 서비스의 이벤트는 동일한 Account의 ServiceWatch에서 확인하고 처리할 수 있습니다.
ServiceWatch로 이벤트를 전송하는 서비스 목록과 해당 서비스가 전송하는 이벤트는 ServiceWatch Event Reference를 참조하세요.
각 서비스는 Best Effort 전달을 기반으로 ServiceWatch에 이벤트를 전송합니다. Best Effort 전달이란 서비스가 모든 이벤트를 ServiceWatch로 보내려고 시도하지만 드물게 이벤트가 전달되지 않는 경우가 있음을 의미합니다.
유효한 이벤트가 ServiceWatch에 전달되면 ServiceWatch는 해당 이벤트를 규칙과 비교한 후 이벤트 규칙에 설정된 알림 수신자에게 알림을 전송합니다.
이벤트 규칙
각 서비스로부터 ServiceWatch로 전달된 이벤트에 대해 ServiceWatch가 수행하는 작업을 지정할 수 있습니다. 이를 위해 이벤트 규칙을 생성합니다. 이벤트 규칙은 어떤 이벤트를 어떤 대상으로 전달할지를 지정합니다.
이벤트 규칙은 이벤트가 도착하면 이벤트를 평가합니다. 각 이벤트 규칙은 이벤트가 규칙의 패턴과 일치하는지 확인합니다. 이벤트가 일치하면 ServiceWatch는 이벤트를 처리합니다.
이벤트 데이터 기준(이벤트 패턴이라고 함)을 기반으로 들어오는 이벤트에 대해 일치하는 규칙을 생성할 수 있습니다. 이벤트가 이벤트 패턴에 정의된 기준과 일치하는 경우는 규칙에 지정된 대상에 이벤트를 전달합니다.
- 이벤트 규칙은 기본적으로 이벤트가 발생하였을 때 알림을 수신할 알림 수신자를 지정할 수 있습니다.
- 이벤트 규칙은 추가로 이벤트 발생 시 이벤트를 수신할 대상을 Samsung Cloud Platform의 여러 서비스들로 확대 예정입니다. (26년 예정)
이벤트 규칙을 생성하기 위해서는 How-to Guides > 이벤트 규칙 생성하기을 참조하세요.
이벤트 소스
ServiceWatch에서 이벤트 소스는 Samsung Cloud Platform 서비스명으로 선택 가능합니다. 수신하고자 하는 이벤트의 서비스명을 이벤트 소스로 선택할 수 있습니다.
| 서비스 카테고리 | 서비스 |
|---|
| Compute | Virtual Server |
| Compute | GPU Server |
| Compute | Bare Metal Server |
| Compute | Multi-node GPU Cluster |
| Compute | Cloud Functions |
| Storage | Block Storage(BM) |
| Storage | File Storage |
| Storage | Object Storage |
| Storage | Archive Storage |
| Storage | Backup |
| Container | Kubernetes Engine |
| Container | Container Registry |
| Networking | VPC |
| Networking | Security Group |
| Networking | Load Balancer |
| Networking | DNS |
| Networking | VPN |
| Networking | Firewall |
| Networking | Direct Connect |
| Networking | Cloud LAN-Campus |
| Networking | Cloud LAN-Datacenter |
| Networking | Cloud WAN |
| Networking | Global CDN |
| Networking | GSLB |
| Database | EPAS(DBaaS) |
| Database | PostreSQL(DBaaS) |
| Database | MariaDB(DBaaS) |
| Database | MySQL(DBaaS) |
| Database | Microsoft SQL Server(DBaaS) |
| Database | CacheStore(DBaaS) |
| Data Analytics | Event Streams |
| Data Analytics | Search Engine |
| Data Analytics | Vertica(DBaaS) |
| Data Analytics | Data Flow |
| Data Analytics | Data Ops |
| Data Analytics | Quick Query |
| Application Service | API Gateway |
| Security | Key Management Service |
| Security | Config Inspection |
| Security | Certificate Manager |
| Security | Secret Vault |
| Management | Cloud Control |
| Management | Identity and Access Management(IAM) |
| Management | ID Center |
| Management | Logging&Audit |
| Management | Organization |
| Management | Resource Groups |
| Management | ServiceWatch |
| Management | Support Center |
| AI-ML | CloudML |
| AI-ML | AI&MLOps Platform |
표. ServiceWatch 이벤트 소스
이벤트 유형
Samsung Cloud Platform 서비스는 각각 자원 유형을 가지고 있습니다. 이벤트 유형은 자원 유형과 동일하게 분류되며 이벤트 규칙에 사용할 이벤트 소스의 이벤트의 유형을 선택합니다.
다음은 Virtual Server의 이벤트 유형입니다.
| 서비스 카테고리 | 서비스 | 하위 서비스 | 이벤트 유형 |
|---|
| Compute | Virtual Server | Virtual Server | Server |
| Compute | Virtual Server | Image | Image |
| Compute | Virtual Server | Keypair | Keypair |
| Compute | Vitual Server | Server Group | Server Group |
| Compute | Virtual Server | Launch Configuration | Launch Configuration |
| Compute | Virtual Server | Auto-Scaling Group | Auto-Scaling Group |
| Compute | Virtual Server | Block Storage | Volume |
| Compute | Virtual Server | Block Storage | Snapshot |
표. ServiceWatch - Virtual Server 이벤트 유형
그 외 ServiceWatch에서 사용 가능한 이벤트 유형은 ServiceWatch Event를 참고하세요.
이벤트
이벤트는 이벤트 소스의 이벤트 유형에서 발생하는 전체 이벤트를 선택할 수 있고, 특정 이벤트를 선택할 수 있습니다.
다음은 Virtual Server의 Server 이벤트 유형의 이벤트의 일부입니다.
| 서비스 카테고리 | 서비스 | 하위 서비스 | 이벤트 유형 | 이벤트 |
|---|
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Create Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Create End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Create Error |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Delete Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Delete End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Delete Error |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Lock End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Unlock End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Stop Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Stop Success |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Start Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Start Success |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Reboot Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Reboot End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Reboot Error |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Power On Start |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Power On End |
| Compute | Virtual Server | Virtual Server | Server | Compute Virtual Server Power On Error |
표. ServiceWatch - Virtual Server Server의 이벤트 일부
그 외 ServiceWatch에서 사용 가능한 이벤트는 ServiceWatch Event를 참고하세요.
적용 자원
모든 자원 또는 특정 자원에서 선택한 이벤트에 대해 이벤트 패턴을 설정합니다.
이벤트 패턴
이벤트 소스, 이벤트 유형, 이벤트, 적용 자원을 모두 선택하면 이벤트 규칙을 위한 이벤트 패턴 설정 완료됩니다.
다음은 ServiceWatch의 이벤트 규칙에 설정된 이벤트 패턴의 예시입니다.
{
"source": [ // 네임스페이스
"Virtual Server"
],
"detail-type": [ // 이벤트 유형
"Server"
],
"detail": {
"event": [ // 개별 이벤트
"Compute Virtual Server Create End"
]
},
"resources": [ // 개별 자원
"srn:{offerring}::{account_id}:{region}::virtualserver:server/{resource_id}"
]
}
{
"source": [ // 네임스페이스
"Virtual Server"
],
"detail-type": [ // 이벤트 유형
"Server"
],
"detail": {
"event": [ // 개별 이벤트
"Compute Virtual Server Create End"
]
},
"resources": [ // 개별 자원
"srn:{offerring}::{account_id}:{region}::virtualserver:server/{resource_id}"
]
}
코드블록. ServiceWatch - Virtual Server 이벤트 패턴 예시이벤트 규칙을 생성하기 위해서는 How-to Guides > 이벤트 규칙 생성하기을 참조하세요.
이벤트 알림
이벤트 패턴에 만족하는 경우 이벤트 규칙에 설정된 알림 수신자에게 알림을 발송합니다.
참고
- 로그인 이력이 있는 사용자(이메일, 휴대전화 번호 등록 사용자)에게 알림 발송이 가능합니다.
- 알림 수신자는 최대 100명까지 추가할 수 있습니다.
- 알림 수신 방식(E-mail 또는 SMS)은 알림 설정 페이지에서 알림 대상을 서비스 > ServiceWatch로 선택한 후, 변경할 수 있습니다.
안내
- 로그인 이력이 없는 사용자는 알림 수신자로 지정할 수 없습니다.
- 알림 설정 페이지에서 알림 대상을 서비스 > ServiceWatch로 선택하여 알림 수신 방식을 설정하지 않은 경우, 알림을 수신할 수 없습니다.
5 - ServiceWatch 연계 서비스
ServiceWatch와 연계하는 서비스를 확인할 수 있습니다.
지표와 로그 모니터링
아래는 ServiceWatch와 지표와 로그 모니터링을 연계하는 서비스를 확인할 수 있습니다.
참고
기본 모니터링과 세부 모니터링 관련된 내용은
ServiceWatch 기본 모니터링과 세부 모니터링을 참고하세요.
| 서비스 카테고리 | 서비스 | 네임스페이스 | 지표 기본 모니터링 | 지표 세부 모니터링 | 로그 모니터링 | 가이드 |
|---|
| Compute | Virtual Server | Virtual Server | ○ | ○ | - | |
| Compute | GPU Server | Virtual Server | ○ | ○ | - | |
| Storage | File Storage | File Storage | ○ | ○ | - | |
| Container | Kubernetes Engine | Kubernetes Engine | ○ | - | ○ | |
| Container | Container Registry | Container Registry | ○ | - | - | |
| Networking | VPC - Internet Gateway | Internet Gateway | ○ | - | - | |
| Networking | Direct Connect | Direct Connect | ○ | - | - | |
| Database | Scalable DB(DBaaS) | Scalable DB | ○ | - | - | |
표. ServiceWatch 지표 및 로그 연계 서비스 및 가이드
이벤트
아래는 ServiceWatch와 이벤트를 연계하는 서비스를 확인할 수 있습니다.
참고
이벤트 규칙과 관련된 내용은
이벤트를 참고하세요.
이벤트를 생성하는 Samsung Cloud Platform 서비스 목록과 이벤트는
ServiceWatch Event을 참조하세요.
| 서비스 카테고리 | 서비스 | 하위 서비스 | 이벤트 소스 | 자원 유형(이벤트 유형) |
|---|
| Compute | Virtual Server | Virtual Server | Virtual Server | Server |
| Compute | Virtual Server | Image | Virtual Server | Image |
| Compute | Virtual Server | Keypair | Virtual Server | Keypair |
| Compute | Vitual Server | Server Group | Virtual Server | Server Group |
| Compute | Virtual Server | Launch Configuration | Virtual Server | Launch Configuration |
| Compute | Virtual Server | Auto-Scaling Group | Virtual Server | Auto-Scaling Group |
| Compute | Virtual Server | Block Storage | Virtual Server | Volume |
| Compute | Virtual Server | Block Storage | Virtual Server | Snapshot |
| Compute | GPU Server | GPU Server | GPU Server | Server |
| Compute | GPU Server | GPU Server | GPU Server | Image |
| Compute | Bare Metal Server | Bare Metal Server | Bare Metal Server | Bare Metal Server |
| Compute | Multi-node GPU Cluster | GPU Node | Multi-node GPU Cluster | GPU Node |
| Compute | Multi-node GPU Cluster | Cluster Fabric | Multi-node GPU Cluster | Cluster Fabric |
| Compute | Cloud Functions | Function | Cloud Functions | Cloud Functions |
| Storage | Block Storage(BM) | Block Storage(BM) | Block Storage(BM) | Volume |
| Storage | Block Storage(BM) | Volume Group(BM) | Block Storage(BM) | Volume Group |
| Storage | File Storage | File Storage | File Storage | Volume |
| Storage | Object Storage | Object Storage | Object Storage | Bucket |
| Storage | Archive Storage | Archive Storage | Archive Storage | Bucket |
| Storage | Backup | Backup | Backup | Backup |
| Container | Kubernetes Engine | 클러스터 | Kubernetes Engine | Cluster |
| Container | Kubernetes Engine | 노드 | Kubernetes Engine | Nodepool |
| Container | Container Registry | Registry | Container Registry | Container Registry |
| Container | Container Registry | Repository | Container Registry | Repository |
| Networking | VPC | VPC | VPC | VPC |
| Networking | VPC | Subnet | VPC | Subnet |
| Networking | VPC | Port | VPC | Port |
| Networking | VPC | Internet Gateway | VPC | Internet Gateway |
| Networking | VPC | NAT Gateway | VPC | NAT Gateway |
| Networking | VPC | Public IP | VPC | Public IP |
| Networking | VPC | Private NAT | VPC | Private NAT |
| Networking | VPC | VPC Endpoint | VPC | VPC Endpoint |
| Networking | VPC | VPC Peering | VPC | VPC Peering |
| Networking | VPC | Private Link Service | VPC | Private Link Service |
| Networking | VPC | Private Link Endpoint | VPC | Private Link Endpoint |
| Networking | VPC | Transit Gateway | VPC | Transit Gateway |
| Networking | Security Group | Security Group | Security Group | Security Group |
| Networking | Load Balancer | Load Balancer | Load Balancer | Load Balancer |
| Networking | Load Balancer | Load Balancer | Load Balancer | LB Listener |
| Networking | Load Balancer | LB 서버 그룹 | Load Balancer | LB Server Group |
| Networking | Load Balancer | LB 헬스 체크 | Load Balancer | LB Health Check |
| Networking | DNS | Private DNS | Private DNS | Private DNS |
| Networking | DNS | Hosted Zone | Hosted Zone | Hosted Zone |
| Networking | DNS | Public Domain Name | Public Domain Name | Public Domain Name |
| Networking | VPN | VPN | VPN | VPN Gateway |
| Networking | VPN | VPN Tunnel | VPN | VPN Tunnel |
| Networking | Firewall | Firewall | Firewall | Firewall |
| Networking | Direct Connect | Direct Connect | Direct Connect | Direct Connect |
| Networking | Cloud LAN-Campus | Campus Network | Cloud LAN - Campus (Network) | Cloud LAN - Campus (Network) |
| Networking | Cloud LAN-Datacenter | Cloud LAN Network | Cloud LAN Network | Cloud LAN Network |
| Networking | Cloud LAN-Datacenter | vDevice | Cloud LAN Network | vDevice |
| Networking | Cloud LAN-Datacenter | Interface | Cloud LAN Network | Interface |
| Networking | Cloud LAN-Datacenter | vCable | Cloud LAN Network | vCable |
| Networking | Cloud WAN | Cloud WAN Network | Cloud WAN | Network(WAN) |
| Networking | Cloud WAN | Segment | Cloud WAN | Segment |
| Networking | Cloud WAN | Segment | Cloud WAN | Segment Location |
| Networking | Cloud WAN | Segment | Cloud WAN | Segment Sharing |
| Networking | Cloud WAN | Attachment | Cloud WAN | Attachment |
| Networking | Global CDN | Global CDN | Global CDN | Global CDN |
| Networking | GSLB | GSLB | GSLB | GSLB |
| Database | EPAS(DBaaS) | EPAS(DBaaS) | EPAS | EPAS |
| Database | PostreSQL(DBaaS) | PostreSQL(DBaaS) | PostreSQL | PostreSQL |
| Database | MariaDB(DBaaS) | MariaDB(DBaaS) | MariaDB | MariaDB |
| Database | MySQL(DBaaS) | MySQL(DBaaS) | MySQL | MySQL |
| Database | Microsoft SQL Server(DBaaS) | Microsoft SQL Server(DBaaS) | Microsoft SQL Server | Microsoft SQL Server |
| Database | CacheStore(DBaaS) | CacheStore(DBaaS) | CacheStore | CacheStore |
| Database | Scalable DB(DBaaS) | Scalable DB(DBaaS) | Scalable DB | Scalable DB |
| Data Analytics | Event Streams | Event Streams | Event Streams | Event Streams |
| Data Analytics | Search Engine | Search Engine | Search Engine | Search Engine |
| Data Analytics | Vertica(DBaaS) | Vertica(DBaaS) | Vertica | Vertica |
| Data Analytics | Data Flow | Data Flow | Data Flow | Data Flow |
| Data Analytics | Data Flow | Data Flow Services | Data Flow | Data Flow Service |
| Data Analytics | Data Ops | Data Ops | Data Ops | Data Ops |
| Data Analytics | Data Ops | Data Ops Services | Data Ops | Data Ops Service |
| Data Analytics | Quick Query | Quick Query | Quick Query | Quick Query |
| Application Service | API Gateway | API Gateway | API Gateway | API Gateway |
| Application Service | Queue Service | Queue | Queue | Queue |
| Security | Key Management Service | Key Management Service | Key Management Service | Key |
| Security | Config Inspection | Config Inspection | Config Inspection | Config Inspection |
| Security | Certificate Manager | Certificate Manager | Certificate Manager | Certificate |
| Security | Secrets Manager | Secrets Manager | Secrets Manager | Secret |
| Security | Secret Vault | Secret Vault | Secret Vault | Secret |
| Management | Cloud Control | Cloud Control | Cloud Control | 랜딩 존 |
| Management | Identity and Access Management(IAM) | 사용자 그룹 | Identity and Access Management | 그룹 |
| Management | Identity and Access Management(IAM) | 사용자 | Identity and Access Management | 사용자 |
| Management | Identity and Access Management(IAM) | 정책 | Identity and Access Management | 정책 |
| Management | Identity and Access Management(IAM) | 역할 | Identity and Access Management | 역할 |
| Management | Identity and Access Management(IAM) | 자격 증명 공급자 | Identity and Access Management | 자격 증명 공급자 |
| Management | Identity and Access Management(IAM) | My Info. | Identity and Access Management | Access Key |
| Management | ID Center | ID Center | Identity Center | ID Center |
| Management | ID Center | 권한 세트 | Identity Center | 권한 세트 |
| Management | Logging&Audit | Trail | Logging&Audit | Trail |
| Management | Organization | 조직 구성 | Organization | 조직 |
| Management | Organization | 조직 구성 | Organization | 조직 계정 |
| Management | Organization | 조직 구성 | Organization | 조직 초대 |
| Management | Organization | 조직 구성 | Organization | 조직 단위 |
| Management | Organization | 통제 정책 | Organization | 통제 정책 |
| Management | Organization | 조직 설정 | Organization | 위임 정책 |
| Management | Resource Groups | Resource Groups | Resource Groups | Resource Group |
| Management | ServiceWatch | 대시보드 | ServiceWatch | 대시보드 |
| Management | ServiceWatch | 경보 | ServiceWatch | 경보 |
| Management | ServiceWatch | 로그 | ServiceWatch | 로그 그룹 |
| Management | ServiceWatch | 이벤트 규칙 | ServiceWatch | 이벤트 규칙 |
| Management | Support Center | 서비스 요청 | Support | 서비스 요청 |
| Management | Support Center | 문의하기 | Support | 문의하기 |
| AI-ML | CloudML | CloudML | Cloud ML | Cloud ML |
| AI-ML | AI&MLOps Platform | AI&MLOps Platform | AI&MLOps Platform | AI&MLOps Platform |
표. ServiceWatch 이벤트 서비스
6 - 사용자 정의 지표와 로그
ServiceWatch는 사용자가 직접 정의한 사용자 정의 지표를 수집할 수 있고 사용자가 생성한 자원으로부터 로그 파일을 수집할 수 있습니다.
사용자 정의 지표와 로그를 수집할 수 있는 방법은 2가지로 제공됩니다.
첫번째는 ServiceWatch Agent를 자원에 직접 설치하여 수집할 자원을 설정하여 수집할 수 있습니다.
두번째는 ServiceWatch에서 제공하는 OpenAPI/CLI를 통해 사용자 정의 지표와 로그를 수집할 수 있습니다.
참고
ServiceWatch Agent를 통한 사용자 정의 지표/로그 수집은 현재 Samsung Cloud Platform For Enterprise에서만 사용 가능합니다. 이외 오퍼링에서도 향후 제공 예정입니다.
주의
ServiceWatch의 지표 API는 호출에 대한 비용이 발생합니다. ServiceWatch Agent를 통한 지표 수집 역시 OpenAPI 기반으로 동작하기 때문에 지표 API 호출에 대한 비용이 발생합니다.
지표 및 로그 수집을 위해 과도하게 API 호출하지 않도록 주의가 필요합니다. 과금 대상 지표 API는 아래와 같습니다.
| API | 설명 |
|---|
| ListMetricData | 지표 데이터 목록 조회.- 하나의 API 호출에 여러 지표에 대해 요청할 수 있으므로 API의 요청 지표 1,000건당 요금 부과
|
| DownloadMetricDataImage | 지표 데이터 위젯 이미지 다운로드.- 하나의 API 호출에 여러 지표에 대해 요청할 수 있으므로 API의 요청 지표 1,000건당 요금 부과
|
| ListMetricInfos | 지표 데이터 조회. |
| CreateCustomMetricMetas | 사용자 정의 지표 메타 데이터 생성 |
| CreateCustomMetrics | 사용자 정의 지표 데이터 생성(전송) |
| ShowDashboard | 대시보드 조회 |
| ListDashboards | 대시보드 목록 조회 |
| CreateDashboard | 대시보드 생성 |
| SetDashboard | 대시보드 수정 |
| DeleteBulkDashboards | 대시보드 삭제 |
표. 지표 API 과금 안내
로그는 수집 용량에 따라 요금이 발생하기 때문에 API 호출에 대한 과금은 별도로 추가되지 않습니다.
※ 자세한 요금 정보는 Samsung Cloud Platform Service Portal에서 ServiceWatch 요금 정보를 참고하세요.
ServiceWatch Agent
사용자의 자원인 Virtual Server/GPU Server/Bare Metal Server 등에서 ServiceWatch Agent를 설치하여 사용자 정의 지표와 로그를 수집할 수 있습니다.
ServiceWatch Agent 제약 사항
ServiceWatch Agent 네트워크 환경
ServiceWatch Agent는 기본적으로 OpenAPI를 사용하여 수집하는 구조로 설계되었으며 따라서 서버 자원에 설치하여 사용하기 위해서는 인터넷 통한 외부 통신이 가능해야합니다. 자원이 위치한 VPC에 Internet Gateway를 생성하고 서버 자원에 NAT IP를 설정하여 외부와 통신할 수 있도록 설정하시기 바랍니다.
ServiceWatch Agent 지원 OS Image
ServiceWatch Agent를 사용 가능한 OS Image는 다음과 같습니다.
| OS Image 버전 | EOS Date |
|---|
| Alma Linux 8.10 | 2029-05-31 |
| Alma Linux 9.6 | 2025-11-17 |
| Oracle Linux 8.10 | 2029-07-31 |
| Oracle Linux 9.6 | 2025-11-25 |
| RHEL 8.10 | 2029-05-31 |
| RHEL 9.4 | 2026-04-30 |
| RHEL 9.6 | 2027-05-31 |
| Rocky Linux 8.10 | 2029-05-31 |
| Rocky Linux 9.6 | 2025-11-30 |
| Ubuntu 22.04 | 2027-06-30 |
| Ubuntu 24.04 | 2029-06-30 |
| Windows 2019 | 2029-01-09 |
| Windows 2022 | 2031-10-14 |
표. ServiceWatch Agent 사용 가능 OS Image
Virtual Server 제공 OS Image와 동일하게 제공합니다. Virtual Server > OS Image 제공 버전을 참고하세요.
ServiceWatch Agent 사용을 위한 Quick Guide
아래에서는 Linux 환경에서 Virtual Server의 OS 지표와 로그 수집을 위한 Quick guide를 소개합니다.
Node Exporter 설치 및 설정하기
- Node Exporter 설치를 참고하여 서버에 사용자 정의 지표 수집을 위한 Node Exporter를 설치합니다.
- Node Exporter를 설치하면 ServiceWatch에서 기본 모니터링으로 제공하는 지표 이외에 Node Exporter를 통해 OS 지표를 수집할 수 있습니다.
- ServiceWatch Agent 설정을 참고하여 ServiceWatch_Agent 압축파일을 다운로드 받은 뒤, ServiceWatch Manager 설정 및 실행합니다.
- 압축파일 내의 examples/os-metric-min-examples 폴더를 참고하면 최소(2개) 지표를 설정하여 ServiceWatch Agent를 실행할 수 있습니다.
주의
ServiceWatch Agent를 통한 지표 수집은 사용자 정의 지표로 구분되어 각 서비스로부터 기본으로 수집되는 지표와는 달리 요금이 부과되므로, 불필요한 메트릭 수집 설정을 하지 않도록 주의해야 합니다. 반드시 수집이 필요한 지표만 수집될 수 있도록 설정하세요.
- 무료 제공은 Account/리전별 10개까지 제공됩니다.
참고
ServiceWatch Agent 사용에 대한 자세한 내용은
How-to guides > ServiceWatch Agent 사용하기를 참고하세요.
ServiceWatch 사용자 정의 지표 및 로그 API
ServiceWatch에서 제공하는 OpenAPI/CLI를 통해 사용자 정의 지표와 로그를 수집할 수 있습니다.
사용자 정의 지표 데이터와 사용자 정의 로그를 ServiceWatch OpenAPI/CLI를 통해 ServiceWatch로 전달하여 Console에서 시각화된 정보를 확인할 수 있습니다.
주의
ServiceWatch OpenAPI/CLI를 통한 지표 수집은 사용자 정의 지표로 구분되어 각 서비스로부터 기본으로 수집되는 지표와는 달리 요금이 부과되므로, 불필요한 메트릭 수집 설정을 하지 않도록 주의해야 합니다. 반드시 수집이 필요한 지표만 수집될 수 있도록 설정하세요.
- 무료 제공은 Account/리전별 10개까지 제공됩니다.
사용자 정의 지표 메타 데이터 생성
Samsung Cloud Platform의 서비스(예시: Virtual Server 등)에서 제공하는 지표가 아닌 사용자의 자원이나 애플리케이션에서 발생하는 지표 데이터를 ServiceWatch로 수집하기 위해서 사용자 정의 지표 메타 데이터를 생성해야 합니다.
| Parameter | 설명 |
|---|
| namespace | ServiceWatch에서 다른 지표들과 구분할 수 있는 네임스페이스를 사용자가 정의할 수 있음- 네임 스페이스는 영문, 숫자, 공백, 특수문자(
_-/)를 포함하여 3~128자로 작성해야하며, 영문으로 시작해야 함.
|
| metricMetas > metricName | 수집하고자 하는 지표 이름 설정. 지표명은 영문, 숫자, 특수문자(_)를 포함하여 3~128자로 작성해야하며, 영문으로 시작해야 함.- 예시: custom_cpu_seconds_total
|
| metricMetas > storageResolution | 해당하는 지표의 수집 주기를 설정. 기본값은 60(1분)으로 초단위로 설정 가능 |
| metricMetas > unit | 지표의 단위 설정 가능 |
| metricMetas > dimensions | 사용자 정의 지표 데이터의 식별하기 위해 차원을 설정하여 Console에서 시각화하여 보여줄 수 있음. 수집한 지표를 Console에 시각화하여 보여줄 때, 차원(dimensions) 설정에 따라 조합하여 표시 |
| metricMetas > descriptionKo | 수집하는 지표에 대한 국문 설명 |
| metricMetas > descriptionEn | 수집하는 지표에 대한 영문 설명 |
표. 사용자 정의 지표 메타 데이터 파라미터 설명
사용자 정의 지표 메타 데이터 생성을 위한 자세한 내용은 CreateCustomMetricMetas를 참고하세요.
사용자 정의 지표 생성
사용자 정의 지표 메타 데이터를 생성한 후 발생한 지표 데이터를 CreateCustomMetrics API를 사용하여 ServiceWatch로 전달할 수 있습니다.
전달된 지표 데이터는 설정한 네임스페이스로 구분되어 조회할 수 있습니다.
사용자 정의 지표 데이터 생성을 위한 자세한 내용은 CreateCustomMetrics를 참고하세요.
지표 데이터 조회
사용자 정의 지표를 포함한 지표 데이터 Console과 ListMetricInfos, ListMetricInfos API를 사용하여 조회할 수 있습니다.
지표 데이터 조회를를 위한 자세한 내용은 ListMetricInfos와 ListMetricData를 참고하세요.
로그 스트림 생성
사용자 정의 로그 수집을 위해서는 ServiceWatch 로그 그룹이 필요합니다. 로그 그룹은 Console에서만 생성할 수 있습니다. 미리 로그 그룹을 생성한 후 로그 스트림 생성 API를 사용하여 ServiceWatch로 전달할 로그 스트림을 생성할 수 있습니다.
로그 스트림 생성을 위한 자세한 내용은 CreateCustomLogStream을 참고하세요.
로그 이벤트 생성
사용자 정의 로그 수집을 위해 로그 그룹과 로그 스트림을 생성한 후 개별 로그 메시지(로그 이벤트)를 ServiceWatch로 전달하기 위해서 로그 이벤트 생성 API를 사용합니다.
로그 이벤트 생성을 위한 자세한 내용은 CreateCustomLogEvents을 참고하세요.