이 섹션의 다중 페이지 출력 화면임. 여기를 클릭하여 프린트.
Cloud Monitoring
- 1: Overview
- 2: How-to guides
- 2.1: 모니터링 대시보드 활용하기
- 2.2: 성능 분석하기
- 2.3: 로그 분석하기
- 2.4: 이벤트 관리하기
- 2.5: 사용자 정의 대시보드 활용하기
- 2.6: 에이전트 관리하기
- 2.7: 부록 A. 서비스별 모니터링 대상
- 2.8: 부록 B. 서비스별 성능 항목
- 2.9: 부록 C. 서비스별 상태 체크
- 3: API Reference
- 4: Release Note
1 - Overview
서비스 개요
Cloud Monitoring 서비스는 운영중인 인프라 리소스의 사용 현황과 변경 정보, 로그를 수집하여, 설정된 임계치를 초과할 경우 이벤트를 발생시켜 통보합니다. 이를 통해 사용자는 성능 저하 및 장애에 신속하게 대응할 수 있으며, 안정적인 컴퓨팅 환경 구성을 위해 리소스 용량 확대 계획을 편리하게 수립할 수 있습니다.
제공 기능
Cloud Monitoring은 다음과 같은 기능을 제공하고 있습니다.
- 안정적인 컴퓨팅 자원 관리: CPU 사용률, 디스크 사용률, 메모리 사용률 등의 지표를 간편하게 확인할 수 있습니다. 사용중인 자원에서 이벤트 발생시 지정된 대상자에게 자동으로 알림이 통보되어 신속한 장애 분석과 대응이 가능하기 때문에 컴퓨팅 자원을 안정적으로 운영할 수 있습니다.
- 편리한 모니터링: 자원에 대한 상태 정보는 간편하게 대시보드를 생성해 모니터링 할 수 있습니다. 기본 대시보드 및 사용자 정의 대시보드를 제공하며, 다양한 형태의 위젯을 설정해 쉽고 빠르게 대시보드를 직접 생성할 수 있습니다.
- 이벤트 지표 관리: 웹 기반 Console을 통해 몇 번의 클릭만으로 손쉽게 이벤트 지표를 설정할 수 있습니다. 모니터링 대상의 이벤트 지표 설정 (이벤트 패턴, 발생조건, 발생주기, 성능지표, 운영상태 등)은 사용 환경에 맞게 다양하게 변경할 수 있으며 임계치 설정과 알람 설정을 편리하게 관리할 수 있습니다.
- 리소스 로그 관리: 리소스의 로그 데이터를 수집/저장하고, 필요 시 대상 로그에 대한 검색이 가능합니다. 또한 주요 키워드 대해 이벤트를 지표화하여 사전 설정된 조건 충족 시 지정된 담당자에게 자동 통보하여 보다 안정적인 사용 환경을 제공합니다.
구성 요소
대시보드
모니터링 대시보드에서는 모니터링 대상 서비스 및 자원에 대한 운영 현황과 이벤트 현황, 사용률 상위 항목 등을 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 리전 | 자원의 위치 |
| 데이터 기준 시간 | 대시보드에 표시된 데이터의 기준 시간 |
| 새로고침 | 대시보드를 현재 시간 기준으로 새로고침 |
| 기간 설정 | 데이터의 조회 기간 설정 및 새로고침 주기 변경 |
| 모니터링 현황 | Account 내 사용 중인 서비스별 모니터링 대상의 개수와 상태 |
| 이벤트 히스토리 | 최근 7일간 발생한 이벤트를 위험도별 그래프로 표시 |
| 성능별 사용률 Top 5 | 주요 성능별 사용률이 가장 높은 5개 모니터링 대상 표시 |
| 이벤트 맵 | 각 서비스의 이벤트 발생 개수를 위험도별로 표시 |
| 이벤트 현황 | 발생한 이벤트 중 처리되지 않은 이벤트 목록 표시 |
성능분석
성능 분석에서는 모니터링 대상의 주요 성능 항목을 확인하고 각 성능 항목의 현재 데이터와 기간내 이력을 확인할 수 있습니다. 사용자는 관리하는 모니터링 대상의 성능 현황을 서비스별 또는 기간별로 확인하고, 특정 성능을 비교하여 결과를 분석할 수 있습니다.
로그 분석
로그 분석에서는 모니터링 대상의 로그를 수집해 내용을 확인하고, 정형화 데이터인 지표로 변환해 모니터링할 수 있습니다. 모니터링 대상마다 기본 수집 로그가 제공되며, 사용자는 사용자 정의 로그를 생성하여 원하는 로그를 추가로 수집하고 확인할 수 있습니다.
이벤트 관리
이벤트란 모니터링 대상의 성능 값이 특정한 조건을 충족했을 때 그것을 사용자에게 알리기 위한 설정입니다. 이벤트를 설정하면 사용자가 반드시 알아야 하는 모니터링 정보를 놓치지 않고 파악할 수 있습니다. 예를 들어, 과부하와 관련된 성능값이 일정한 수치를 넘을 때마다 이벤트가 발생하도록 설정하면 해당 자원 운영 중 과부하 위험이 있을 때마다 사용자에게 알림이 전달됩니다. 사용자는 이를 토대로 문제가 발생하기 전에 미리 대응할 수 있습니다. 이벤트 관리에서는 이러한 이벤트를 생성하여 모니터링 중 특정한 값이 발생할 때마다 지정된 사용자에게 알리도록 설정할 수 있습니다.
선행 서비스
Cloud Monitoring은 선행 서비스가 없습니다.
2 - How-to guides
Samsung Cloud Platform Monitoring은 Samsung Cloud Platform Console에서 운영하는 Account 내 자원 운영 현황을 모니터링하고 분석할 수 있는 자원 관리 시스템입니다. 사용자는 대시보드 페이지과 위젯, 차트 기능을 이용하여 자원을 효율적으로 관리할 수 있습니다.
- 사용자는 Samsung Cloud Platform Console에서 권한을 가진 Account에 생성한 자원에 대해 모니터링할 수 있습니다.
- 사용자는 Samsung Cloud Platform Console에 로그인하고 Samsung Cloud Platform Monitoring으로 이동하여 모니터링할 수 있습니다.
Cloud Monitoring 시작하기
Samsung Cloud Platform Monitoring을 시작하려면 다음 절차를 따르세요.
- 모든 서비스 > Management > Cloud Monitoring메뉴를 클릭하세요. Cloud Monitoring의 Service Home 페이지로 이동합니다.
- Service Home 페이지에서 Cloud Monitoring 열기 버튼을 클릭하세요. Cloud Monitoring Console페이지로 이동합니다.
Cloud Monitoring Console 살펴보기
Cloud Monitoring Console의 상단 및 왼쪽 메뉴는 다음과 같이 구성됩니다.
| 구분 | 상세 설명 |
|---|---|
| 사용자 정의 대시보드 관리 | 사용자 정의 대시보드
|
| 서포트 | 서포트
|
| 리전 목록 | 리전 목록
|
| 사용자 정보 | 사용자 정보를 확인하고 Samsung Cloud Platform Monitoring에서 로그아웃할 수 있습니다. |
| 사이드 메뉴 | Samsung Cloud Platform Monitoring의 주요 기능을 표시합니다. 각 메뉴를 클릭하면 해당 페이지로 이동할 수 있습니다.
|
모니터링 종료하기
Cloud Monitoring Console을 종료하려면 오른쪽 상단 사용자 정보 > 로그아웃 버튼을 클릭하세요.
공통 기능 사용하기
Cloud Monitoring Console을 이용할 때 자주 사용하는 기능에 대하여 설명합니다.
모니터링 대상 상세 정보 확인하기
Cloud Monitoring Console > 성능 분석 또는 Cloud Monitoring Console > 로그 분석 > 로그 현황과 같이 접근하면 모니터링 대상 목록을 확인할 수 있습니다. 이때, 모니터링 대상의 상세 정보를 확인하려면 모니터링 대상 목록에서 상세 정보를 확인할 모니터링 대상을 클릭하세요.
- 모니터링 대상의 상세 정보는 서비스 유형에 따라 달라집니다.
- 모니터링 대상의 운영체제(OS 정보)가 RHCOS (Redhat Core OS)일 경우 모니터링 대상에 대한 상세 정보가 제공되지 않습니다.
| 항목 | 설명 |
|---|---|
| 기본 정보 | 모니터링 대상에 대한 기본적인 정보를 표시
|
| 성능 | 모니터링 대상의 주요 성능을 그래프로 표시 |
| 로그 | 모니터링 대상에 설정된 로그의 수집량을 그래프로 표시 |
| 이벤트 | 모니터링 대상에서 발생한 이벤트 목록을 표시 |
| 에이전트 | 에이전트의 설치, 시작, 중지, 삭제, 업데이트 명령어를 제공 |
| 조회 기간 설정 | 날짜/시간 데이터의 조회 기준 일시를 표시
|
| 모니터링 상태 영역 | 성능, 로그, 이벤트 모니터링 상태를 표시합니다. |
- 에이전트 관리 명령어가 제공되는 서비스는 Virtual Server, GPU Server, Bare Metal Server 입니다.
- 에이전트의 설치와 관리에 대한 자세한 내용은 에이전트 관리하기를 참고하세요.
데이터 정렬하기
이벤트 모니터링, 성능 및 로그 분석 결과 등의 정보를 내림차순 또는 오름차순으로 정리하여 확인할 수 있습니다. 데이터를 정렬하려면 다음 절차를 따르세요.
- 확인할 정보를 페이지에 표시하세요.
- 카테고리 이름 옆에 있는 정렬 버튼을 클릭하세요. 클릭할 때마다 정렬 방식이 내림차순, 오름차순 순서로 변경됩니다.
실시간 데이터 확인하기
대시보드 또는 상세 정보 페이지의 데이터를 정해진 주기에 따라 자동으로 새로고침하도록 설정할 수 있습니다.
- Cloud Monitoring Console은 모니터링 페이지를 주기적으로 새로 고침하도록 새로 고침 사용 여부와 주기를 설정할 수 있습니다.
- 새로 고침 버튼을 클릭하면 현재 시각을 기준으로 직접 새로 고침 할 수 있습니다.
데이터의 새로 고침 주기를 설정하려면 다음 절차를 따르세요.
- 데이터 표현 영역 오른쪽 위에 있는 설정 버튼을 클릭하세요.
- 새로 고침 주기를 선택한 후, 확인 버튼을 클릭하세요.
- 새로 고침 기능을 끄거나 켤 수 있습니다.
조회 기간 설정하기
조회 기간을 설정하면 지정된 범위의 성능, 로그, 이벤트로 조회 범위를 제한함으로써 원하는 정보만 쉽게 찾아볼 수 있습니다. 조회 기간을 설정하려면 다음 절차를 따르세요.
- 데이터 표현 영역 오른쪽 위에 있는 설정 버튼을 클릭하세요.
- 조회 기간을 선택하거나 직접 입력하세요.
- 조회 기간을 직접 입력할 경우 기간을 최소 30분 이상으로 설정해야 합니다.
- 각 위젯의 데이터 조회 범위가 고정되어 있을 경우 위젯의 조회 범위가 우선 적용됩니다.
2.1 - 모니터링 대시보드 활용하기
모니터링 대시보드에서는 모니터링 대상 서비스 및 자원에 대한 운영 현황과 이벤트 현황, 사용률 상위 항목 등을 확인할 수 있습니다.
모니터링 대시보드 시작하기
Samsung Cloud Platform Console에서 Cloud Monitoring Console 페이지로 이동하면 모니터링 대시보드가 표시됩니다. 다른 페이지에 있는 경우, Cloud Monitoring Console > 모니터링 대시보드를 클릭하여 모니터링 대시보드 페이지로 이동할 수 있습니다.
모니터링 대시보드는 다음과 같이 구성되어 있습니다.
| 항목 | 설명 |
|---|---|
| 데이터 기준 시간 | 대시보드에 표시된 데이터의 기준 시간 표시 |
| 새로 고침 | 대시보드를 현재 시간을 기준으로 새로고침 |
| 자동 새로 고침 | 대시보드 새로고침 기능을 켜거나 끌 수 있음 |
| 기간 설정 | 데이터의 조회 기간을 설정 또는 새로고침 주기 변경 |
| 모니터링 현황 | 서비스별 모니터링 대상 개수와 모니터링 상태를 표시 |
| 이벤트 히스토리 | 최근 7일간 발생한 이벤트 개수를 위험도별 그래프로 표시 |
| 성능별 사용률 Top 5 | 주요 성능별 사용율이 가장 높은 5개 모니터링 대상을 사용률 그래프로 표시 |
| 이벤트 맵 | 각 서비스의 이벤트 발생 개수를 위험도별로 표시 |
| 이벤트 현황 | 발생한 이벤트 중 처리되지 않은 이벤트 목록을 표시 |
- 모니터링 대시보드는 Samsung Cloud Platform Console에서 Account를 생성할 때 자동으로 생성되며 임의로 삭제할 수 없습니다.
- 모니터링 대시보드의 구성 위젯은 임의로 변경할 수 없습니다.
- 특정 위젯으로 대시보드를 구성하려면 사용자 정의 대시보드를 이용하세요. 사용자 정의 대시보드에 대한 자세한 내용은 사용자 정의 대시보드 활용하기를 참고하세요.
대시보드 공통 기능 알아보기
대시보드에서 사용할 수 있는 기능들에 대하여 설명합니다.
위젯 이미지 다운로드하기
위젯 영역의 오른쪽 상단 다운로드 버튼을 클릭하면 해당 위젯을 이미지 파일(*.png)로 다운받을 수 있습니다.
그래프 상세 정보 보기
그래프 위에 마우스 커서를 위치하면 상세 정보가 팝업으로 나타납니다.
모니터링 현황
사용 중인 서비스별 모니터링 대상 개수와 모니터링 상태를 표시합니다.
| 항목 | 설명 |
|---|---|
| 서비스 카테고리 | 서비스별 모니터링 대상 서비스 카테고리와 서비스 카테고리에 포함된 모니터링 대상의 수량 표시
|
| 서비스 목록 | 모니터링 대상 서비스 카테고리에 포함된 서비스 목록과 수량을 표시
|
| 모니터링 상태 | 모니터링 대상의 수와 현재 상태를 표시
|
| 이벤트 상태 | 현재 발생한 이벤트의 수를 등급별(Fetal, Warning, Inform)로 표시합니다. |
- 모니터링 상태의 성능 수집은 Agent 와 Agentless 방식의 성능 항목 수량을 통합하여 표시합니다.
이벤트 히스토리
최근 7일간 발생한 이벤트 개수를 위험도별 그래프로 표시합니다.
그래프 위에 마우스 커서를 위치하면 선택한 날짜의 이벤트 위험도에 해당하는 이벤트의 발생 횟수와 활성/비활성 정보가 팝업으로 나타납니다.
- 발생: 전체 이벤트 발생 수
- 활성화: 이벤트 발생 조건을 충족하여 발생한 이벤트가 계속 유지되는 상태
- 비활성화: 발생한 이벤트가 이벤트 발생 조건을 더 이상 충족하지 않아 정상으로 돌아간 상태
위험도 범례 영역을 클릭하여 해당 그래프를 숨기거나 숨기기 취소할 수 있습니다.
성능별 사용률 Top5
주요 성능별 사용율이 가장 높은 5개 모니터링 대상을 사용률 그래프로 표시합니다.
- 그래프 위에 마우스 커서를 위치하면 선택한 대상의 전체 이름과 현재 성능 수치가 팝업으로 나타납니다.
- 그래프를 클릭하면 해당하는 대상의 모니터링 대상 상세 팝업창이 열립니다.
항목 설명 CPU Usage/Core [Basic] Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 Memory Used [Basic] 현재 사용중인 메모리의 용량 Disk Read Bytes [Basic] 디스크 읽기 바이트 수 Disk Write Bytes [Basic] 디스크 쓰기 바이트 수
- 모니터링 대시보드에서는 Virtual Server의 성능만을 표현하고 있습니다. 다른 서비스 유형의 Top5 성능을 표시하려면 사용자 정의 대시보드에서 선택하여 구성해야 합니다.
이벤트 맵
각 서비스의 이벤트 발생 개수를 위험도별로 표시합니다.
- 사각형 위에 마우스 커서를 위치하면 모니터링 대상의 이름이 팝업으로 나타납니다.
- 이벤트 맵의 서비스 항목을 클릭하면 해당 서비스의 모니터링 대상 상세 팝업창이 열립니다.
각 항목별 위험도는 다음과 같습니다.
| 항목 | 설명 |
|---|---|
| No Rule | 정상/비정상을 판단할 수 없는 상태입니다. 임계치 설정값이 없어 상태를 판단할 수 없음을 의미 |
| NORMAL | 정상 상태입니다. 임계치가 임계치 설정값을 만족하지 못하여 이벤트가 발생하지 않았음을 의미 |
| INFORM | 가장 낮은 단계의 위험 상태입니다. 단순 알림 수준의 정보도 포함합니다. |
| WARNING | 중간 정도의 위험 상태입니다. |
| FATAL | 가장 위험한 단계의 상태입니다. |
이벤트 현황
발생한 이벤트 중 활성화 상태의 이벤트 목록을 표시합니다.
- 이벤트는 최근 발생한 순서로 표시됩니다.
2.2 - 성능 분석하기
성능 분석에서는 모니터링 대상의 주요 성능 항목을 확인하고 각 성능 항목의 현재 데이터와 기간내 이력을 확인할 수 있습니다. 사용자는 관리하는 모니터링 대상의 성능 현황을 서비스별 또는 기간별로 확인하고, 특정 성능을 비교하여 결과를 분석할 수 있습니다.
성능 분석 시작하기
모니터링 대상을 직접 선택하거나 검색 조건을 입력하여 성능 분석을 시작할 수 있습니다. 모니터링 대상을 검색하여 성능을 분석하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 성능 분석을 클릭하세요. 성능 분석 페이지로 이동합니다.
- 검색 영역에 성능을 분석할 모니터링 대상의 검색 조건을 입력한 후, 검색을 클릭하세요.
항목 설명 검색 영역 서비스 유형에 따라 검색 영역에 표시된 상세 검색 필터가 다르게 표시 - 상세 검색을 하려면 상세 검색 버튼을 클릭하세요.
- 상세 검색 필터별 조건 항목은 1개 이상 선택 가능
모니터링 대상 표시 수 검색 결과 수량과 목록에서 한 번에 볼 수 있는 성능 개수를 표시 - 목록에 표시되는 성능 개수의 기본값은 20개씩 보기입니다.
- 목록 표기 개수는 10개, 20개, 30개, 40개, 50개, 100개씩 보기로 변경
검색 정보 검색 조건 항목에 대한 검색 결과값을 표시 - 모니터링 대상, 서비스 상태, 이벤트 등급
- 이벤트 위험도에 표시된 위험도 아이콘을 클릭하면 해당 위험도에 해당하는 가장 최근 이벤트 상세 팝업창이 열립니다.
성능 지표 정보 모니터링 대상의 서비스 유형에 따른 주요 성능 지표를 표시 - 서비스별 주요 성능 지표 목록은 서비스별 주요 성능지표와 DB 서비스의 인스턴스 유형과 상태별 수집 정보를 참고
상세보기 해당하는 모니터링 대상의 상세 정보를 확인 성능 비교 모니터링 대상을 선택하여 성능을 비교 표. 성능 분석
성능 상세 정보 확인하기
모니터링 대상의 상세 성능 정보를 확인하려면 다음 절차를 따르세요.
- 성능 분석 목록에서 상세 정보를 확인할 모니터링 대상을 클릭하세요. 모니터링 상세 팝업창이 열립니다.
- 성능 탭을 클릭하세요.
- 그래프 위에 마우스 커서를 위치하면 각 성능 항목의 값이 팝업창으로 나타납니다.
- 오른쪽 상단의 아이콘을 클릭하여 조회 기간을 설정하거나 새로고침 주기를 변경할 수 있습니다.
- 성능별 차트의 왼쪽 상단에 있는 상세, 요약 버튼을 클릭하여 그래프 표시 방법을 선택할 수 있습니다.
항목 설명 기본 정보 모니터링 대상에 대한 기본적인 정보를 표시 상세 모니터링 대상의 성능별 차트가 펼쳐져서 표시 - 하나의 차트를 상세하게 확인
요약 모니터링 대상의 성능별 차트가 바둑판 형태로 표시 - 여러 개의 차트를 한눈에 확인
조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시합니다.
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경
성능 비교 모니터링 대상의 성능을 비교하는 차트를 생성하여 각 성능을 비교 가능 성능별 차트 모니터링 대상의 성능별 차트가 그래프로 표시 - 그래프가 하나인 경우, 오른쪽 상단에 마지막 수집값을 단위와 함께 표시합니다.
- 그래프가 여러 개인 경우, 오른쪽 상단에 ⓘ가 표시되며 마우스 커서를 위치하면 각 그래프의 마지막 수집값이 팝업창으로 나타납니다.
- 그래프 위에 마우스 커서를 위치하면 지정 시각의 성능 항목 값이 팝업창으로 나타납니다.
표. 모니터링 대상 상세
- 성능값의 수집 주기는 서비스에 따라 달라질 수 있습니다.
- 차트 내 데이터는 30개 지점으로 표현되며 데이터 조회 범위(시간)에 따른 데이터 수집 간격은 다음과 같습니다.(표현 지점은 수집 시각 오차에 따라 달라질 수 있습니다)
- 30분: 약 1분 간격
- 60분: 약 2분 간격
- 3시간: 약 6분 간격
- 6시간: 약 12분 간격
- 12시간: 약 24분 간격
- 24시간: 약 48분 간격
- 3일: 약 144분 간격 (2시간 24분)
- 7일: 약 336분 간격 (5시간 36분)
- 14일: 약 672분 간격 (11시간 12분)
- 사용자 지정: 사용자 지정 범위(분)을 30으로 나눈 값
- 각 지점의 데이터는 조회 범위(시간)에서 최대값을 표현하며, 상세 차트에서 통계 유형을 변경할 수 있습니다.
성능 비교하기
각 모니터링 대상의 성능 항목을 확인하고 원하는 성능 항목을 선택하여 비교할 수 있습니다.
성능 비교 시작하기
모니터링 대상의 성능을 비교하는 차트를 생성하여 각 성능을 비교할 수 있습니다.
- 동일 서비스 유형의 성능 항목만 비교할 수 있습니다.
- 서비스 유형의 상세 속성에 따라 성능 항목이 추가될 수 있습니다.
- VM의 Windows OS 성능
- Search Engine의 Kibana 관련 성능
성능 비교를 시작하려면 다음 절차를 따르세요.
Cloud Monitoring Console > 성능 분석을 클릭하세요. 성능 분석 페이지로 이동합니다.
검색 영역에 성능을 분석할 모니터링 대상의 검색 조건을 입력한 후, 검색을 클릭하세요.
성능을 비교할 모니터링 대상을 모두 선택한 후 성능 비교를 클릭하세요. 성능을 비교할 수 있는 팝업창이 열립니다.
항목 설명 모니터링 대상 비교할 모니터링 대상의 서비스 종류를 표시 클릭하여 서비스를 변경 - 서비스를 변경하면 현재까지 생성한 차트는 모두 사라집니다.
- 추가를 클릭하여 현재 선택한 서비스의 모니터링 대상을 검색하여 추가
- 선택한 모니터링 대상은 페이지에 표시되며, X 또는 전체삭제를 클릭하여 모니터링 대상을 삭제
성능 항목 현재 선택한 서비스에서 수집하는 모든 성능 항목을 표시 - 성능 비교를 원하는 항목을 체크하면 해당 성능 항목이 차트에 포함됩니다.
차트 표시 방법 성능 비교 차트의 표시 방법 선택 - 상세: 성능 비교 차트가 상세하게 표시됩니다.(기본값)
- 요약: 성능 비교 차트가 간략하게 표시
조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경
차트 영역 선택한 성능 항목을 기준으로 모니터링 대상들의 성능을 비교하여 차트로 표시 추가를 클릭하세요. 모니터링 대상을 추가할 수 있는 팝업창이 열립니다.
성능을 비교할 모니터링 대상을 선택한 후, 확인 버튼을 클릭하세요.
- Kubernetes Engine을 선택한 경우 해당 서비스의 하위 유형도 함께 선택해야 합니다.
비교할 성능 항목을 체크하세요. 해당 성능 항목이 차트에 추가됩니다.
차트 살펴보기
성능 비교 결과는 차트로 표시됩니다. 사용자는 생성한 차트의 형태를 변경하거나 이미지 또는 엑셀 파일로 다운받을 수 있습니다.
- 그래프 위에 마우스 커서를 위치하면 지정 시각의 성능 항목값이 팝업으로 나타납니다.
- 범례 영역의 대상 항목을 클릭하여 해당 그래프를 숨기거나 숨기기 취소할 수 있습니다.
항목 설명 통계 방법 그래프로 표시할 통계 방법을 설정 - 최소 5분에서 최대 6시간 동안의 통계를 그래프로 표시합니다.
- 기본, 최대, 최소, 평균, 합계 중에서 선택할 수 있습니다. 여러 방법을 동시에 선택할 수 있으며, 선택한 항목은 범례 영역에 표시
차트 형태 차트에 표시할 그래프 종류를 선택 - Line: 선형 그래프
- Stacked Area: 영역형 그래프
- Scatter: 산점 그래프
차트 다운로드 차트의 Raw Data를 확인하고 다운로드 - Chart PNG File: 차트를 이미지 파일(PNG)로 다운로드합니다.
- Chart Excel File: 차트에 표현된 성능 항목의 데이터를 엑셀 파일로 다운로드 합니다. 차트 표현 데이터는 조회 범위에 따라 자동으로 수집한 데이터 집합체입니다.
- Raw Excel File: 차트에 표현된 성능 항목의 전체 데이터를 조회 범위 기간 내에서 수집하여 엑셀 파일로 다운로드합니다.
시계열 그래프 위젯 추가 차트를 사용자 정의 대시보드에 시계열 그래프 위젯으로 추가 - 클릭하면 시계열 그래프 위젯 추가 팝업창이 열립니다.
삭제 성능 비교 결과 차트를 삭제 성능 비교 현황 성능 비교 결과를 그래프로 표시 - 그래프 위에 마우스 커서를 위치하면 해당 시간대의 성능 비교 현황을 팝업창으로 표시합니다.
2.3 - 로그 분석하기
로그 분석에서는 모니터링 대상의 로그를 수집해 내용을 확인하고, 정형화 데이터인 지표로 변환해 모니터링할 수 있습니다. 모니터링 대상마다 기본 수집 로그가 제공되며, 사용자는 사용자 정의 로그를 생성하여 원하는 로그를 추가로 수집하고 확인할 수 있습니다.
- 로그 분석을 이용하려면 사전에 로그 수집 에이전트를 설치하고 운영해야 합니다. 로그 에이전트의 설치와 운영에 대한 자세한 내용은 에이전트 관리하기를 참고하세요.
- Kubernetes Engine의 로그를 수집하려면 Samsung Cloud Platform Console에서 로그 수집을 설정해야 합니다.
로그 분석 시작하기
로그 현황 목록을 확인하거나 모니터링 대상 로그를 검색하여 확인할 수 있습니다. 로그 현황 목록을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 로그 분석 > 로그 현황을 클릭하세요. 로그 현황 페이지로 이동합니다.
- 검색 영역에 성능을 분석할 서비스의 검색 조건을 입력한 후, 로그 검색을 클릭하세요.
- 검색 조건에 해당하는 서비스 목록과 검색 정보가 하단에 표시됩니다.
- 각 서비스의 상세 보기 버튼을 클릭하면 해당 서비스의 상세 로그 정보가 표시됩니다.
항목 설명 검색 영역 서비스 유형에 따라 검색 영역에 표시된 검색 필터가 다르게 표시 - 상세 검색을 하려면 상세 검색 버튼을 클릭하세요.
- 상세 검색 필터별 조건 항목은 1개 이상 선택 가능
모니터링 대상 표시 수 검색 결과 수량과 목록에서 한 번에 볼 수 있는 성능 개수를 표시 - 기본값은 20개씩 보기입니다.
- 목록 표기 개수는 10개, 20개, 30개, 40개, 50개, 100개씩 보기로 변경
검색 정보 검색 조건 항목에 대한 검색 결과값을 표시 상세 보기 해당하는 모니터링 대상의 상세 정보를 확인 로그 검색 키워드와 쿼리를 조합하여 로그를 검색하고 상세 내역 확인
- 모니터링 대상에 연결된 Virtual Server 또는 Node가 있는 경우, 검색 정보 영역에 해당 상태도 함께 표시됩니다.
- 모니터링 대상의 이름은 한글, 영어 대소문자, 숫자, 특수 기호(
-,_,.) 모두 사용할 수 있으며 최대 100자까지 입력할 수 있습니다. - 모니터링 대상의 권한이 없는 경우, 권한이 없는 대상 정보와 권한 확인 메시지가 팝업으로 표시됩니다.
로그 상세 정보 확인하기
모니터링 대상의 로그 상세 내역과 로그 그래프를 살펴볼 수 있습니다.
로그 목록 확인하기
모니터링 상세 팝업창에서 로그 상세 정보를 확인할 수 있습니다. 로그에 대한 모니터링 상세 정보를 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 로그 분석 > 로그 현황을 클릭하세요. 로그 현황 페이지로 이동합니다.
- 로그 현황 페이지에서 상세 정보를 확인할 로그의 클릭하세요. 모니터링 상세 팝업창이 열립니다.
- 로그 탭을 클릭하세요.
- 그래프 위에 마우스 커서를 위치하면 각 로그 항목의 값이 팝업창으로 나타납니다.
- 오른쪽 상단의 아이콘을 클릭하여 조회 기간을 설정하거나 새로고침 주기를 변경할 수 있습니다.
- 로그별 차트 왼쪽 상단에 있는 상세, 요약 버튼을 클릭하여 그래프 표시 방법을 선택할 수 있습니다.
항목 설명 기본 정보 모니터링 대상에 대한 기본적인 정보를 표시 상세 모니터링 대상의 로그별 차트가 펼쳐져서 표시 - 하나의 차트를 상세하게 확인
요약 모니터링 대상의 성능별 차트가 바둑판 형태로 표시 - 여러 개의 차트를 한눈에 확인
조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시합니다.
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경
성능 비교 키워드와 쿼리를 조합하여 로그를 검색하고 상세 내역 확인 성능별 차트 모니터링 대상의 로그별 차트가 그래프로 표시 - 그래프 위에 마우스 커서를 위치하면 지정 시각의 로그 항목 값이 팝업창으로 나타납니다.
로그 검색하여 확인하기
키워드와 쿼리를 조합하여 로그를 검색하고 상세 내역을 확인할 수 있습니다.
로그를 검색하려면 다음 절차를 따르세요.
Cloud Monitoring Console > 로그 분석 > 로그 현황을 클릭하세요. 로그 현황 페이지로 이동합니다.
로그 현황 페이지에서 로그 검색을 클릭하세요. 로그 검색 페이지로 이동합니다.
항목 설명 모니터링 대상 비교할 모니터링 대상의 서비스 종류를 표시 - 모니터링 대상 목록을 클릭하여 서비스를 변경
- 서비스를 변경하면 현재까지 생성한 차트는 모두 사라집니다.
- 추가 버튼을 클릭하여 현재 선택한 서비스의 모니터링 대상을 검색하여 추가
- 선택한 모니터링 대상은 페이지에 표시되며, X 또는 전체삭제를 클릭하여 모니터링 대상을 삭제할 수 있습니다.
검색 조건 검색할 로그에 대한 조건을 설정 조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시합니다.
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경
로그 발생량 그래프 로그를 검색하면 입력한 조건에 해당하는 로그 내역이 차트로 표시 발생 로그 메시지 모니터링 대상에서 발생한 로그 메시지가 시간별로 표시 추가 버튼을 클릭하세요. 모니터링 대상을 추가할 수 있는 팝업창이 열립니다.
모니터링 대상을 클릭한 후, 추가하고자 하는 로그 파일을 선택하세요.
로그 파일 선택이 끝나면 확인 버튼을 클릭하세요.
검색 조건을 입력한 후, 검색 버튼을 클릭하세요. 검색 결과가 로그 발생량 그래프와 발생 로그 메시지에 표시됩니다.
항목 설명 지표 추가 로그 검색 결과에 지표를 추가 - 로그를 검색한 후에 사용
실행 이력 최근 검색을 실행한 검색 조건 목록을 확인 - 실행 이력은 가장 마지막으로 실행된 20개의 검색 조건까지 표시
- 원하는 검색 이력을 선택하여 현재 검색 조건으로 입력 가능
검색 필드 검색 필드를 선택 조건 검색 조건을 선택 like,!like,=,!=,<=,>=,>,<를 선택 가능
검색값 검색할 키워드를 입력 로그 검색 새로 추가한 검색 조건에 대한 연산자(AND, OR)를 선택 - 새로운 검색 조건을 추가한 경우에만 표시
조건 추가 새로운 검색 조건을 추가 로그를 검색하면 입력한 조건에 해당하는 로그 내역이 차트로 표시됩니다.
- 로그 내역은 초 단위로 표시됩니다.
항목 설명 로그 발생량 그래프 설정한 기간 동안의 로그 발생량이 그래프로 표시 - 그래프 위에 마우스 커서를 위치하면 각 로그 항목의 값이 팝업창으로 나타납니다.
- 그래프의 막대 그래프를 클릭하면 해당 시점의 로그 목록을 표시합니다.
조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경
모니터링 대상 모니터링 대상 목록이 표시 - 로그 메시지를 확인할 모니터링 대상을 선택하면 로그 목록에 내용이 표시
로그 목록 모니터링 대상에서 발생한 로그 메시지가 시간별로 표시 - 로그 목록에 있는 버튼을 클릭하면 해당 로그의 전체 메시지를 확인
- 다운로드를 클릭하여 현재 표현되는 로그 메시지를 Excel과 TXT 파일 형식으로 다운로드
- 로그 내역은 초 단위로 표시됩니다.
로그 수집 현황 확인하기
최근 7일간의 주요 로그 수집 정보를 차트로 확인할 수 있습니다.
- 그래프 위에 마우스 커서를 위치하면 상세 정보가 팝업창으로 나타납니다.
- 수집된 로그만 집계되며, 수집되지 않은 로그는 현황에 표시되지 않습니다.
- Account를 생성하면 수집한 로그를 저장하기 위하여 1GB의 가상 용량을 기본으로 제공합니다.
- 모든 로그는 필요에 따라 수집을 중단하고 다시 시작할 수 있습니다.
로그 수집 현황을 확인하려면 Cloud Monitoring Console > 로그 분석 > 로그 수집 대시보드를 클릭하세요.
| 항목 | 설명 |
|---|---|
| 누적 로그 발생량 | 매월 1일부터 수집한 로그의 양을 GB로 표시
|
| 최근 7일 로그 수집량 | 최근 7일간 수집한 로그의 양을 서비스 유형별 그래프로 표시
|
| 서비스별 로그 발생 비율 | 최근 7일간 수집한 로그를 서비스별로 분류해 표시
|
| 로그 수집 Top 10 | 서비스별 로그 발생 비율에서 선택한 서비스 내에 최근 7일간 로그가 가장 많이 수집된 모니터링 대상 10개를 그래프로 표시
|
로그와 관련된 모니터링을 수행하려면 반드시 사전에 로그 수집 에이전트를 설치하고 운영해야 합니다. 로그 에이전트의 설치와 운영에 대한 자세한 내용은 에이전트 관리하기를 참고하세요.
- 누적 로그는 최대 1GB까지 저장됩니다. 1GB를 초과하면 오래된 로그부터 자동으로 삭제됩니다.
지표 설정 현황 확인하기
지표를 생성하여 로그 패턴의 발생 횟수를 시계열로 표시할 수 있습니다. 지표 목록을 확인하려면 Cloud Monitoring Console > 로그 분석 > 지표 설정 현황을 클릭하세요.
| 항목 | 설명 |
|---|---|
| 검색 영역 | 서비스 유형에 따라 검색 영역에 표시된 검색 필터가 다르게 표시
|
| 모니터링 대상 표시 수 | 검색 결과를 표시
|
| 검색 정보 | 검색 조건 항목에 대한 검색 결과값을 표시 |
| 추가 | 새로운 지표를 추가 |
| 삭제 | 검색 정보에 있는 지표를 선택하여 삭제 |
지표 상세 정보 확인하기
지표의 상세 정보를 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 로그 분석 > 지표 설정 현황을 클릭하세요. 지표 설정 현황 페이지로 이동합니다.
- 지표 설정 현황 페이지에서 상세 정보를 확인할 지표명을 클릭하세요. 지표 상세 팝업창이 열립니다.
지표 추가하기
새로운 지표를 추가하여 원하는 로그 데이터를 시계열로 나타낼 수 있습니다.
- 로그 지표는 로그 에이전트가 설치되어 있거나 로그가 수집되는 모니터링 대상에만 설정할 수 있습니다. 로그 에이전트의 설치와 운영에 대한 자세한 내용은 에이전트 관리하기를 참고하세요.
새로운 지표를 추가하려면 다음 절차를 따르세요.
Cloud Monitoring Console > 로그 분석 > 지표 설정 현황을 클릭하세요. 지표 설정 현황 페이지로 이동합니다.
지표 설정 현황 페이지에서 추가 버튼을 클릭하세요. 지표 추가 팝업창이 열립니다.
지표명을 입력하세요.
- 지표명은 영문 대소문자와 언더스코어(_), 온점(.), 하이픈(-)만 사용할 수 있습니다.
- 지표를 일반 성능과 구분하기 위하여 접두어
metricfilter.가 자동으로 추가되며 삭제 또는 변경할 수 없습니다.항목 설명 지표명 새로 생성할 지표명을 입력 모니터링 대상 비교할 모니터링 대상의 서비스 종류를 표시 - 모니터링 대상 목록을 클릭하여 서비스를 변경
- 서비스를 변경하면 현재까지 생성한 차트는 모두 사라집니다.
- 추가 버튼을 클릭하여 현재 선택한 서비스의 모니터링 대상을 검색하여 추가
- 선택한 모니터링 대상은 페이지에 표시되며, X 또는 전체삭제를 클릭하여 모니터링 대상을 삭제
검색 조건 검색할 로그에 대한 조건을 설정 조회 기간 설정 - 날짜/시간: 데이터의 조회 기준 일시를 표시
- 새로 고침: 현재 시각으로 직접 새로고침합니다.
- 시작/중지: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경할 수 있습니다.
로그 발생량 그래프 로그를 검색하면 입력한 조건에 해당하는 로그 내역이 차트로 표시 발생 로그 메시지 모니터링 대상에서 발생한 로그 메시지가 시간별로 표시
추가 버튼을 클릭하세요. 모니터링 대상을 추가할 수 있는 팝업창이 열립니다.
모니터링 대상을 클릭한 후, 추가하고자 하는 로그 파일을 선택하세요.
로그 파일 선택이 끝나면 확인 버튼을 클릭하세요.
검색 조건을 입력한 후, 검색 버튼을 클릭하세요. 검색 결과가 로그 발생량 그래프와 발생 로그 메시지에 표시됩니다.
항목 설명 지표 추가 로그 검색 결과에 지표를 추가 - 로그를 검색한 후에 사용
실행 이력 최근 검색을 실행한 검색 조건 목록을 확인 - 실행 이력은 가장 마지막으로 실행된 20개의 검색 조건까지 표시
- 원하는 검색 이력을 선택하여 현재 검색 조건으로 입력 가능
검색 필드 검색 필드를 선택 조건 검색 조건을 선택 like,!like,=,!=,<=,>=,>,<를 선택 가능
검색값 검색할 키워드를 입력 연산자 새로 추가한 검색 조건에 대한 연산자(AND, OR)를 선택 - 새로운 검색 조건을 추가한 경우에만 표시
조건 추가 새로운 검색 조건을 추가 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 새로운 지표가 추가됩니다.
지표 검색 조건 수정하기
지표의 검색 조건을 수정하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 로그 분석 > 지표 설정 현황을 클릭하세요. 지표 설정 현황 페이지로 이동합니다.
- 지표 설정 현황 페이지에서 수정할 지표의 지표명을 클릭하세요. 지표 상세 팝업창이 열립니다.
- 지표 상세 팝업창에서 수정 버튼을 클릭하세요. 지표 수정 팝업창이 열립니다.
- 지표 수정 팝업창에서 검색 조건을 수정한 후, 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 해당 지표가 수정됩니다.
지표 삭제하기
지표를 삭제하려면 다음 절차를 따르세요.
- 삭제하려는 지표를 사용한 차트나 이벤트 정책이 있을 경우, 해당 지표를 삭제할 수 없습니다.
- Cloud Monitoring Console > 로그 분석 > 지표 설정 현황을 클릭하세요. 지표 설정 현황 페이지로 이동합니다.
- 지표 설정 현황 페이지에서 삭제할 지표를 선택한 후, 삭제 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 해당 지표가 삭제됩니다.
2.4 - 이벤트 관리하기
이벤트란 모니터링 대상의 성능 값이 특정한 조건을 충족했을 때 그것을 사용자에게 알리기 위한 설정입니다. 이벤트를 설정하면 사용자가 반드시 알아야 하는 모니터링 정보를 놓치지 않고 파악할 수 있습니다. 예를 들어, 과부하와 관련된 성능값이 일정한 수치를 넘을 때마다 이벤트가 발생하도록 설정하면 해당 자원 운영 중 과부하 위험이 있을 때마다 사용자에게 알림이 전달됩니다. 사용자는 이를 토대로 문제가 발생하기 전에 미리 대응할 수 있습니다.
이벤트 관리에서는 이러한 이벤트를 생성하여 모니터링 중 특정한 값이 발생할 때마다 지정된 사용자에게 알리도록 설정할 수 있습니다.
이벤트 현황 확인하기
이벤트 현황에서는 발생한 모든 이벤트에 대한 정보와 관련 성능 항목, 사용자에게 전달한 이벤트 알림 이력 등을 확인할 수 있습니다. 이벤트 현황 목록을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 현황을 클릭하세요. 이벤트 현황 페이지로 이동합니다.
- 이벤트 현황 페이지에서 검색 영역에 이벤트 현황을 확인할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
항목 설명 검색 영역 서비스 유형에 따라 검색 영역에 표시된 검색 필터가 다르게 표시 - 상세 검색을 하려면 상세 검색 버튼을 클릭하세요.
- 상세 검색 필터별 조건 항목은 1개 이상 선택 가능
모니터링 대상 표시 수 검색 결과 수량과 목록에서 한 번에 볼 수 있는 성능 개수를 표시 - 목록에 표시되는 성능 개수의 기본값은 20개씩 보기입니다.
- 목록 표기 개수는 10개, 20개, 30개, 40개, 50개, 100개씩 보기로 변경
검색 정보 검색 조건 항목에 대한 검색 결과값을 표시 - 각 서비스의 메시지 내용을 클릭하면 이벤트의 상세 정보 확인 가능
상세보기 해당하는 모니터링 대상의 상세 정보를 확인 표. 이벤트 목록
- 모니터링 대상에 연결된 Virtual Server 또는 Node가 있는 경우, 검색 정보 영역에 해당 상태도 함께 표시됩니다.
- 모니터링 대상의 이름은 한글, 영어 대소문자, 숫자, 특수 기호(
-,_,.) 모두 사용할 수 있으며 최대 100자까지 입력할 수 있습니다.
이벤트 현황 목록보기
모니터링 상세 팝업창에서 이벤트 목록에서 이벤트 정보와 발생 시각, 지속 시간을 확인할 수 있습니다. 이벤트 발생 현황을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 현황을 클릭하세요. 이벤트 현황 페이지로 이동합니다.
- 이벤트 현황 페이지에서 이벤트 탭을 클릭하세요.
항목 설명 이벤트 현황 이벤트 메시지와 발생 시각 확인 활성 현재 활성화 상태인 이벤트만 표시 전체 전체 이벤트를 표시 이벤트 상세 이벤트 현황에서 선택한 메시지의 상세 정보를를 확인 표. 이벤트 탭
이벤트 상세 정보 확인하기
이벤트 상세 정보 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 현황을 클릭하세요. 이벤트 현황 페이지로 이동합니다.
- 이벤트 현황 페이지에서 이벤트 탭을 클릭하세요.
- 이벤트 현황 페이지에서 상세 정보를 확인할 이벤트를 선택한 후, 이벤트 상세를 클릭하면 이벤트 발행 조건, 성능 항목, 알림 이력을 확인할 수 있습니다.
항목 설명 모니터링 대상 모니터링 대상의 이름을 표시 발생 조건 이벤트의 발생 조건을 표시 성능 항목 성능 항목에 대한 차트를 표시합니다. - 그래프 위에 마우스 커서를 위치하면 각 시간대의 상세한 성능값을 확인
알림 이력 전체 알람 발생 이력을 표시 이벤트 설정 상세 해당 이벤트의 설정 정보를 확인 표. 이벤트 상세 정보
이벤트 설정 관리하기
모니터링 대상, 이벤트 발생의 기준이 되는 성능값, 이벤트의 위험도 수준, 이벤트 알림 대상자 등 이벤트의 세부 사항을 설정할 수 있습니다. 모니터링 대상으로부터 수집한 데이터가 이벤트 정책에 설정한 조건에 해당하면 메일, SMS, 메시지 등을 통하여 사용자에게 알림을 전달합니다.
- 이벤트 정책은 모니터링 대상을 지정한 상태에서만 설정할 수 있으며 Auto-Scaling Group별 정책은 Group 단위로 설정할 수 있습니다.
이벤트 설정 확인하기
이벤트 설정을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 검색 영역에 이벤트 정책을 확인할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
항목 설명 검색 영역 서비스 유형에 따라 검색 영역에 표시된 검색 필터가 다르게 표시 - 상세 검색을 하려면 상세 검색 버튼을 클릭하세요.
- 상세 검색 필터별 조건 항목은 1개 이상 선택 가능
모니터링 대상 표시 수 검색 결과를 표시 - 기본값은 20개씩 보기입니다.
- 목록 표기 개수는 10개, 20개, 30개, 40개, 50개, 100개씩 보기로 변경
모니터링 대상 모니터링 대상의 이름을 표시 - 체크 박스를 선택하면 삭제, 활성화, 알림 대상자 버튼이 활성화됩니다.
성능 항목 이벤트 설정 대상의 성능 항목을 표시 개별 항목 성능 항목 하위의 개별 성능 항목을 표시 - 개별 항목이 없을 경우, 표시되지 않습니다.
유형/단위 해당 성능 항목의 값 타입과 단위를 표시 이벤트 등급 해당 이벤트의 위험도를 표시 - 위험도는 이벤트를 추가할 때 사용자가 직접 설정
- Fatal: 가장 위험한 수준입니다.
- Warning: 중간 단계의 위험 수준입니다.
- Information: 가장 낮은 단계의 위험 수준이자 참고 수준입니다.
임계치 성능값을 비교하기 위한 기준값을 표시 알림 대상자 이벤트 알림의 수신자를 표시 - 마우스 커서를 이름 위에 위치하면 전체 명단이 페이지에 표시
정책 상태 이벤트의 활성화 여부를 표시 상세보기 이벤트 상세 정보를를 확인하고 수정 - 상세보기를 클릭하면 해당 이벤트의 상세 정보 팝업창이 열립니다.
추가 이벤트를 추가 삭제 이벤트를 삭제 활성화 이벤트를 활성화 또는 비활성화 알림 대상자 이벤트 알림 대상자를 확인하고 관리 표. 이벤트 설정
- 모니터링 대상의 이름은 한글, 영어 대소문자, 숫자, 특수 기호(
-,_,.) 모두 사용할 수 있으며 최대 100자까지 입력할 수 있습니다. - 모니터링 대상의 권한이 없는 경우, 권한이 없는 대상 정보와 권한 확인 메시지가 팝업으로 표시됩니다.
이벤트 설정 상세 정보 확인하기
모니터링 대상과 이벤트 조건에 대한 상세 정보를 확인하고 이벤트 조건과 알림 정보를 수정할 수 있습니다.
이벤트 설정 추가하기
이벤트 설정을 추가하려면 다음 절차를 따르세요.
- 이벤트 정책은 모니터링 대상을 지정한 상태에서만 설정할 수 있습니다.
- Auto-Scaling Group의 정책은 그룹별로 적용할 수 있습니다.
Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
이벤트 설정 페이지에서 추가 버튼을 클릭하세요. 이벤트 설정 추가 팝업창이 열립니다.
항목 설명 대상명 이벤트 설정을 추가할 모니터링 대상을 선택 - 모니터링 대상 목록을 클릭하여 서비스를 변경
- 서비스를 변경하면 현재까지 생성한 이벤트 조건이 모두 사라집니다.
- 추가 버튼을 클릭하여 현재 선택한 서비스의 모니터링 대상을 검색하여 추가
- 선택한 모니터링 대상은 페이지에 표시되며, X 또는 전체 삭제를 클릭하여 모니터링 대상을 삭제
이벤트 설정 영역 이벤트로 설정할 성능과 발생 조건을 설정 알림 정보 영역 이벤트 발생 시 알림 대상자와 알림 방식을 설정 표. 이벤트 설정 추가 팝업창 설명모니터링 대상 영역에서 서비스 유형을 선택한 후, 추가 버튼을 클릭하세요. 모니터링 대상 추가 팝업창이 열립니다.
모니터링 대상을 선택한 후, 확인 버튼을 클릭하세요.
- 여러 개의 모니터링 대상을 동시에 선택할 수 있습니다.
- 모니터링 대상이 여러 개인 경우, 설정한 이벤트가 각 모니터링 대상에 동일하게 추가됩니다.
- Kubernetes를 선택한 경우, 해당 서비스의 하위 유형도 함께 선택해야 합니다.
성능 항목에서 이벤트를 추가할 성능 항목을 클릭한 후, 이벤트 발생 조건을 입력하세요.
- 추가한 성능 항목은 성능 이름 옆에 추가한 횟수가 표시됩니다.
- 성능 항목을 여러 개 선택한 경우, 성능 항목별로 이벤트 발생 조건을 입력해야 합니다.
항목 설명 이벤트 정책 템플릿 불러오기 기존에 만들어 놓은 이벤트 정책 템플릿을 선택하여 적용 성능 항목 이벤트 발생 조건을 설정할 성능 항목을 클릭하여 이벤트 조건 설정 영역에 추가 이벤트 등급 이벤트의 등급을 설정 - Fatal: 가장 위험한 수준입니다.
- Warning: 중간 단계의 위험 수준입니다.
- Information: 가장 낮은 단계의 위험 수준이자 참고 수준입니다.
성능 유형 이벤트 발생 여부를 판단하기 위한 기준값을 선택 - 수집값: 현재값을 사용합니다.
- delta값: 이전값과 현재값의 차이를 사용합니다.
임계치 수집된 성능값과 비교할 기준값을 설정 - 이벤트 발생 여부를 판단하는 기준이 됩니다.
- 숫자와 소수점만 입력 가능
비교 방식 이벤트 발생 여부를 판단하기 위하여 해당 성능 항목의 모니터링값과 임계치를 비교하는 방식을 선택 - 구간: 성능값이 임계치에서 지정한 구간 이내인지 확인
- 일치: 성능값이 임계치와 같은지 확인
- 상이: 성능값이 임계치와 다른지 확인
- 이상: 성능값이 임계치 이상인지 확인
- 초과: 성능값이 임계치 초과인지 확인
- 이하: 성능값이 임계치보다 이하인지 확인
- 미만: 성능값이 임계치보다 미만인지 확인
개별 항목 성능 항목 하위에 있는 개별 성능 항목을 이벤트 조건으로 지정 - 개별 항목을 수집할 수 있는 성능 항목일 경우에만 활성화됩니다.
접두사 이벤트 메시지 접두사를 추가할 수 있습니다. - 이벤트 현황 페이지에서 이 이벤트를 검색하는 키워드로 사용됩니다.
통계 수집한 성능 값에 적용할 통계 방법을 설정 - 통계를 설정한 경우, 이벤트 발생 조건을 판단할 때 설정한 통계 방법을 적용한 성능값이 임계치와 비교됩니다. 선택하지 않으면 가장 최근의 성능값이 임계치와 비교됩니다.
- 통계방법: 최대, 최소, 평균, 합계 중 하나를 선택해 수집된 성능값을 계산합니다.
- 통계주기: 통계 방법의 계산을 적용할 기간을 설정합니다. 가장 최근에 수집된 성능 값으로부터의 기간입니다.
지속 발생 횟수 이벤트 발생 조건을 만족하는 연속된 모니터링값의 횟수를 설정 - 이 값은 이벤트가 순간적으로 발생한 이상값인지 실제 이벤트인지 판단하기 위한 민감도로 활용합니다.
이벤트 발생 알림 시간대 이벤트 정책 설정시 타임존 설정 기능 표. 이벤트 설정 추가 - 이벤트 설정 영역
알림 영역에서 알림 설정을 할 수 있습니다.
항목 설명 알림 대상자 선택 영역 알림 대상자를 선택 - 알림 대상자 선택 후 삭제 버튼을 클릭하면 해당 알림 대상자가 삭제됩니다.
알림 대상자 / 그룹 이벤트 발생 시 알림 내용을 전달할 대상자 목록이 표시 이벤트 위험도 설정한 이벤트의 위험도가 표시 알림 방식 대상자에게 알림을 전달하는 방식이 표시 추가 주소록에서 새로운 알림 대상자를 선택하여 추가 삭제 알림 대상자 / 그룹에서 알림 대상자를 삭제 표. 이벤트 설정 추가 - 알림 정보 영역알림 대상자를 체크하여 선택한 후 확인 버튼을 클릭하세요.
- Account의 Root 사용자 또는 IAM 사용자만 알림 대상자로 추가할 수 있습니다.
- 여러 대상자를 동시에 선택할 수 있습니다.
- 알림 대상자별로 이벤트 위험도에 따른 알림 방식을 설정하세요.
- 알림 방식은 메일, SMS, 메신저 중에서 선택할 수 있으며, 여러 방식을 동시에 선택할 수 있습니다.
- 알림 방식 설정이 완료되면, 확인 버튼을 클릭하세요.
이벤트 설정 수정하기
이벤트의 조건과 알림 대상자 정보를 수정하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 검색 영역에 이벤트 설정을 수정할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 이벤트 정책 목록에서 수정할 이벤트 정책의 상세보기 버튼을 클릭하세요. 이벤트 설정 상세 페이지로 이동합니다.
- 이벤트 설정 상세 페이지에서 수정 버튼을 클릭하세요. 이벤트 설정 수정 페이지로 이동합니다.
- 이벤트 설정 수정 페이지에서 수정할 정보를 입력한 후, 확인 버튼을 클릭하세요.
- 이벤트 조건과 알림 정보를 수정할 수 있습니다.
이벤트 설정 삭제하기
이벤트 설정을 삭제하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 검색 영역에 이벤트 정책을 삭제할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 이벤트 정책 목록에서 삭제할 이벤트 정책을 체크한 후, 삭제 버튼을 클릭하세요.
- 확인 팝업창에서 확인 버튼을 클릭하세요.
이벤트 설정 활성화 변경하기
이벤트 정책의 사용 여부를 간단하게 변경할 수 있습니다.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 검색 영역에 이벤트 정책을 삭제할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 이벤트 정책 목록에서 활성화를 변경할 이벤트 정책을 체크한 후, 활성화 버튼을 클릭하세요. 정책 활성화 팝업창이 열립니다.
- 활성화 여부를 선택한 후, 확인 버튼을 클릭하세요.
- 모두 활성화, 모두 비활성화 버튼을 클릭하여 일괄적으로 변경할 수 있습니다.
이벤트 알림 대상자 변경하기
이벤트 발생 시 알림을 전달받는 대상자를 확인하고 일괄적으로 변경할 수 있습니다.
- 이벤트 알림 대상자 변경 기능은 이벤트 알림 대상자를 일괄적으로 변경하기 위한 목적입니다. 따라서 기존 알림 대상자는 삭제되고 새로운 알림 대상자 설정으로 변경됩니다.
- 각 정책별로 알림 대상자를 확인하고 변경하려면 해당 정책의 상세 페이지에서 수정 버튼을 클릭한 후, 변경해야 합니다.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 검색 영역에 이벤트 정책을 삭제할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 이벤트 정책 목록에서 수정할 이벤트 정책을 체크한 후, 알림 대상자 버튼을 클릭하세요. 알림 대상자 페이지로 이동합니다.
- 알림 대상자 페이지에서 알림 대상자로 추가할 사용자를 선택한 후, 확인 버튼을 클릭하세요.
항목 설명 이벤트 정책 목록 알림 대상자를 변경할 이벤트 정책 목록이 표시 - 추가를 클릭하여 변경할 정책을 추가
- 정책 목록의 삭제 버튼을 클릭하면 해당 정책이 삭제됩니다.
사용자 검색 영역 이름, 이메일, 휴대 전화, 회사명을 입력하여 검색 알림 주소록 알림 주소록을 이용하여 사용자를 확인하여 추가 검색 사용자 목록 알림 주소록 또는 검색 결과에 포함되는 사용자 목록이 표시 - 알림 대상자로 추가할 사용자를 체크하면 알림 대상자 목록에 추가됩니다.
알림 대상자 목록 이벤트 정책 목록에 표시된 이벤트에 알림 대상자로 추가할 사용자 목록이 표시 - 사용자를 체크한 후, 삭제 버튼을 클릭하면 해당 사용자가 목록에서 제외됩니다.
표. 이벤트 알림 대상자 변경하기
이벤트 템플릿 관리하기
모니터링 대상, 이벤트 발생의 기준이 되는 성능값, 이벤트의 위험도 수준 등을 설정하여 템플릿으로 만들어서 활용할 수 있습니다. 이벤트를 추가하거나 수정할 때 이벤트 정책 템플릿을 가져와서 이벤트 조건을 손쉽게 입력할 수 있습니다.
이벤트 정책 템플릿 목록 확인하기
이벤트 정책 템플릿 목록을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 이벤트 정책 템플릿을 클릭하세요. 이벤트 정책 템플릿 페이지로 이동합니다.
- 이벤트 정책 템플릿 페이지에서 검색 영역에 템플릿을 확인할 서비스의 검색 조건을 입력한 후, 검색을 클릭하세요.
항목 설명 검색 영역 이벤트 정책 템플릿의 조건을 입력하여 검색 이벤트 정책 템플릿을 추가 이벤트 정책 템플릿을 추가 템플릿 목록 검색 조건에 해당하는 이벤트 정책 템플릿이 표시 표. 이벤트 정책 템플릿 목록
이벤트 정책 템플릿 추가하기
이벤트 정책 템플릿을 추가하려면 다음 절차를 따르세요.
Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
이벤트 설정 페이지에서 이벤트 정책 템플릿 버튼을 클릭하세요. 이벤트 정책 템플릿 페이지로 이동합니다.
이벤트 정책 템플릿 페이지에서 이벤트 정책 템플릿 추가 버튼을 클릭하세요. 이벤트 정책 템플릿 추가 팝업창이 열립니다.
이벤트 정책 템플릿 추가 팝업창에서 이벤트 정책 템플릿을 추가할 서비스 유형과 템플릿 정보를 설정하세요.
*표시된 항목은 필수 입력 항목이므로 반드시 입력해야 합니다.항목 설명 서비스 유형 이벤트 정책을 설정할 서비스 유형을 선택 - 서비스 유형 목록을 클릭하여 서비스를 변경
- 서비스를 변경하면 현재까지 생성한 이벤트 조건이 모두 사라집니다.
템플릿명 생성할 템플릿의 이름을 입력 템플릿 설명 생성할 템플릿에 대한 설명을 입력 표. 이벤트 정책 템플릿 추가 - 서비스 유형 및 템플릿명 설정
성능 항목에서 이벤트를 추가할 성능 항목을 클릭한 후, 이벤트 발생 조건을 입력하세요.
- 추가한 성능 항목은 성능 이름 옆에 추가한 횟수가 표시됩니다.
- 성능 항목을 여러 개 선택한 경우, 성능 항목별로 이벤트 발생 조건을 입력해야 합니다.
*표시된 항목은 필수 입력 항목이므로 반드시 입력해야 합니다.항목 설명 이벤트 정책 템플릿 불러오기 기존에 만들어 놓은 이벤트 정책 템플릿을 선택하여 적용 - 템플릿을 불러오면 이벤트 조건과 알림 대상자가 템플릿에 설정된 정보로 교체됩니다.
성능 항목 이벤트 발생 조건을 설정할 성능 항목을 클릭하여 이벤트 조건 설정 영역에 추가 이벤트 등급 이벤트의 위험도를 설정 - Fatal: 가장 위험한 수준입니다.
- Warning: 중간 단계의 위험 수준입니다.
- Information: 가장 낮은 단계의 위험 수준이자 참고 수준입니다.
성능 유형 이벤트 발생 여부를 판단하기 위한 기준값을 선택 - 수집값: 현재값을 사용합니다.
- delta값: 이전값과 현재값의 차이를 사용합니다.
임계치 수집된 성능값과 비교할 기준값을 설정 - 이벤트 발생 여부를 판단하는 기준이 됩니다.
- 숫자와 소수점만 입력 가능
비교 방식 이벤트 발생 여부를 판단하기 위하여 해당 성능 항목의 모니터링값과 임계치를 비교하는 방식을 선택 - 구간: 성능값이 임계치에서 지정한 구간 이내인지 확인
- 일치: 성능값이 임계치와 같은지 확인
- 상이: 성능값이 임계치와 다른지 확인
- 이상: 성능값이 임계치 이상인지 확인
- 초과 성능값이 임계치 초과인지 확인
- 이하: 성능값이 임계치보다 이하인지 확인
- 미만: 성능값이 임계치보다 미만인지 확인
개별 항목 성능 항목 하위에 있는 개별 성능 항목을 이벤트 조건으로 지정 - 개별 항목을 수집할 수 있는 성능 항목일 경우에만 활성화됩니다.
접두사 이벤트 메시지 접두사를 추가 - 이벤트 현황 페이지에서 이 이벤트를 검색하는 키워드로 사용됩니다.
통계 수집한 성능 값에 적용할 통계 방법을 설정 - 통계를 설정한 경우, 이벤트 발생 조건을 판단할 때 설정한 통계 방법을 적용한 성능값이 임계치와 비교됩니다. 선택하지 않으면 가장 최근의 성능값이 임계치와 비교됩니다.
- 통계방법: 최대, 최소, 평균, 합계 중 하나를 선택해 수집된 성능값을 계산합니다.
- 통계주기: 통계 방법의 계산을 적용할 기간을 설정합니다. 가장 최근에 수집된 성능 값으로부터의 기간입니다.
지속 발생 횟수 이벤트 발생 조건을 만족하는 연속된 모니터링값의 횟수를 설정 - 이 값은 이벤트가 순간적으로 발생한 이상값인지 실제 이벤트인지 판단하기 위한 민감도로 활용합니다.
이벤트 발생 알림 시간대 이벤트 정책 설정시 타임존 설정 기능 표. 이벤트 정책 템플릿 추가 - 성능 항목
알림이 발생했을 때 정보를 전달할 대상자와 전달 방식을 설정하세요.
항목 설명 추가 주소록에서 새로운 알림 대상자를 선택하여 추가 삭제 알림 대상자 / 그룹에서 선택한 알림 대상자를 삭제 알림 대상자 / 그룹 이벤트 발생 시 알림 내용을 전달할 대상자 목록이 표시 - 알림 대상자를 선택한 후, 삭제 버튼을 클릭하면 해당 알림 대상자가 삭제됩니다.
이벤트 위험도 전달할 이벤트의 위험도가 표시 알림 방식 대상자에게 알림을 전달하는 방식이 표시 - 메일, SMS, 메신저 중에서 선택할 수 있으며, 여러 방식을 동시에 선택 가능
표. 이벤트 정책 템플릿 추가 - 알림 대상자 설정
- Account 구성원과 Account에 등록된 알림 주소록만 대상자로 추가할 수 있습니다.
- 여러 대상자를 동시에 선택할 수 있습니다.
- 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 이벤트 정책 템플릿이 추가됩니다.
이벤트 정책 템플릿 수정 및 삭제하기
이벤트 정책 템플릿을 수정 또는 삭제하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 이벤트 정책 템플릿 버튼을 클릭하세요. 이벤트 정책 템플릿 페이지로 이동합니다.
- 이벤트 정책 템플릿 페이지에서 검색 영역에 템플릿을 확인할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 수정 또는 삭제하려는 템플릿의 오른쪽 상단에 있는 더보기버튼을 클릭하고, 수정 또는 삭제를 클릭하세요.
- 수정: 템플릿 수정 팝업창이 열립니다. 템플릿을 수정한 후, 확인 버튼을 클릭하세요.
- 삭제: 토스트 팝업 메시지와 함께 해당 템플릿이 삭제됩니다.
- 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 템플릿이 삭제됩니다.
이벤트 정책 템플릿 공유하기
이벤트 정책 템플릿을 공유하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 설정을 클릭하세요. 이벤트 설정 페이지로 이동합니다.
- 이벤트 설정 페이지에서 이벤트 정책 템플릿 버튼을 클릭하세요. 이벤트 정책 템플릿 페이지로 이동합니다.
- 이벤트 정책 템플릿 페이지에서 검색 영역에 템플릿을 확인할 서비스의 검색 조건을 입력한 후, 검색 버튼을 클릭하세요.
- 공유하려는 템플릿의 오른쪽 상단에 있는 더보기 > 공유 버튼을 클릭하세요.
- 공유할 사용자를 선택한 후, > 버튼을 클릭하세요. 선택한 사용자가 공유대상에 추가됩니다.
- 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 템플릿이 공유됩니다.
이벤트 필터링하기
특정한 기간에 발생하는 이벤트의 알림을 필터링할 수 있습니다. 이벤트 필터링이 적용되는 동안에는 이벤트가 발생해도 알림이 전달되지 않습니다.
이벤트 필터링 목록을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 필터링을 클릭하세요. 이벤트 필터링 페이지로 이동합니다.
항목 설명 필터링 타임라인 등록된 필터링의 타임라인을 날짜별로 표시 - 등록된 필터링이 바의 형태로 타임라인에 표시됩니다. 바를 클릭 하면 필터링의 상세 정보를 확인할 수 있습니다.
- 왼쪽 00부터 오른쪽 23까지의 숫자는 해당 일의 시각을 나타냅니다.
- 시각 아래에 있는 파란색 세로줄은 현재 시각을 나타냅니다.
<,>클릭해 표시되는 날짜를 변경
필터링 목록 등록된 필터링의 정보와 동작 상태를 목록으로 표시 - 동작중: 필터링이 등록되어 동작 중
- 종료됨: 설정된 기간이 지나 필터링의 동작이 종료되었습니다.
- 예약됨: 필터링 등록이 완료되어 대기 중입니다. 설정된 기간이 도래하면 필터링이 동작합니다.
- 사용중지: 필터링이 중지된 상태입니다. 상세 설정의 사용여부에서 사용을 선택하지 않으면 표시
추가 새로운 이벤트 필터링을 추가 삭제 필터링 목록에서 선택한 이벤트 필터링을 삭제 검색 영역 이벤트 필터링 또는 모니터링 대상으로 검색 표. 이벤트 필터링 목록
이벤트 필터링 추가하기
이벤트 필터링을 추가하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 필터링을 클릭하세요. 이벤트 필터링 페이지로 이동합니다.
- 이벤트 필터링 페이지에서 추가 버튼을 클릭하세요. 이벤트 필터링 추가 팝업창이 열립니다.
- 이벤트 필터링 추가 팝업창에서 필터링 정보를 입력하세요.
항목 설명 이벤트 필터링 이벤트 필터링의 이름을 입력 사용여부 이벤트 필터링의 사용 여부를 설정 - 사용하지 않음으로 설정할 경우, 사용으로 변경하기 전까지 사용중지 상태로 표시되며, 필터링이 동작하지 않습니다.
시간대 이벤트 필터링을 적용할 기준 시간대를 설정 반복 유형 이벤트 필터링의 반복 적용 여부를 설정 - 반복안함: 시작과 종료 연, 월, 일, 시, 분을 입력하세요. 반복 없이 한 번만 필터링합니다.
- 매일, 요일: 시작 시각과 종료 시각만 입력하세요. 입력한 시간에 매일 필터링이 반복해서 동작합니다.
기간 이벤트 필터링이 적용되는 기간을 설정 - 적용시간: 반복 작업일 경우, 활성화되며 시작 시각부터 종료 시각까지의 경과 시간을 표시
- 변환기간: 이벤트 필터링 적용 기간을 사용자가 설정한 시간대를 기준으로 변환하여 표시
이벤트 필터링 대상 이벤트 필터링을 적용할 서비스 유형과 모니터링 대상을 선택하여 추가 표. 이벤트 필터링 추가 - 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 이벤트 필터링이 추가됩니다.
이벤트 필터링 수정하기
이벤트 필터링을 수정하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 필터링을 클릭하세요. 이벤트 필터링 페이지로 이동합니다.
- 이벤트 필터링 페이지에서 수정할 필터링의 이름을 클릭하세요. 이벤트 필터링 상세 팝업창이 열립니다.
- 이벤트 필터링 상세 팝업창에서 수정 버튼을 클릭하세요. 이벤트 필터링 수정 팝업창이 열립니다.
- 이벤트 필터링 수정 팝업창에서 수정할 내용을 입력한 후, 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 이벤트 필터링이 수정됩니다.
이벤트 필터링 삭제하기
이벤트 필터링을 삭제하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 이벤트 필터링을 클릭하세요. 이벤트 필터링 페이지로 이동합니다.
- 이벤트 필터링 페이지에서 삭제할 이벤트 필터링을 선택한 후, 삭제 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 이벤트 필터링이 삭제됩니다.
- 동시에 여러 개의 이벤트 필터링을 선택할 수 있습니다.
알림 그룹 관리하기
이벤트 발생 시 알림을 전달받는 대상자를 하나의 그룹으로 묶어서 관리할 수 있습니다. 알림 그룹을 활용하면 알림 대상자들을 효율적으로 관리하고 알림 설정을 쉽고 빠르게 할 수 있습니다.
알림 그룹을 확인하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 알림 그룹을 클릭하세요. 알림 그룹 페이지로 이동합니다.
- 알림 그룹 페이지에서 알림 그룹의 확인 및 관리를 할 수 있습니다.
항목 설명 알림 그룹 추가 새로운 알림 그룹을 추가합니다. 알림 그룹 사용자가 생성한 모든 알림 그룹을 목록으로 표시합니다. - 알림 그룹을 클릭하면 알림 그룹 상세 팝업창이 열립니다.
- 수정버튼을 클릭하여 알림 그룹을 수정
상세 검색 알림 그룹 이름을 입력하여 주소록을 검색할 수 있습니다. 키워드 검색 알림 그룹, 사용자명, 생성 일시, 최종 수정 일시를 선택하여 검색할 수 있습니다.
알림 그룹 추가하기
알림 그룹을 추가하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 알림 그룹 추가를 클릭하세요.
- 알림 그룹 추가 페이지에서 알림 그룹명, 알림 그룹 설명을 입력 후 사용자를 추가할 수 있습니다.
- 저장 버튼을 클릭하면 알림 그룹이 추가됩니다.
알림 그룹 수정하기
알림 그룹에 사용자를 추가하거나 알림 그룹에 등록된 사용자를 삭제할 수 있습니다.
사용자 추가하기
알림 그룹에 사용자를 추가하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 알림 그룹을 클릭하세요.
- 전체 알림 그룹에서 사용자를 추가할 알림 그룹을 클릭한 후, 수정를 클릭하세요.
- 추가할 사용자를 선택하세요.
- Account에 등록된 사용자만 주소록에 추가할 수 있습니다.
- 실시간 검색 GUI를 사용해 원하는 구성원을 빠르게 찾을 수 있습니다
- 저장 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 사용자 주소가 추가됩니다.
알림 그룹 삭제하기
알림 그룹을 삭제하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 이벤트 관리 > 알림 그룹을 클릭하세요.
- 전체 알림 그룹에서 삭제할 알림 그룹을 클릭하세요.
- 삭제할 알림 그룹을 선택한 후, 삭제를 클릭하세요.
- 동시에 여려 개의 주소를 선택할 수 있습니다.
- 확인 버튼을 클릭하세요. 토스트 팝업 메시지와 함께 주소가 삭제됩니다.
2.5 - 사용자 정의 대시보드 활용하기
사용자 정의 대시보드는 사용자가 원하는 위젯을 선택하여 구성하는 사용자 맞춤형 대시보드입니다. 사용자는 사용자 정의 대시보드를 이용하여 모니터링 정보를 원하는 대로 구성할 수 있으며, 생성한 사용자 정의 대시보드를 다른 사용자에게 공유할 수 있습니다.
사용자 정의 대시보드 활용하기에서 다루는 내용은 다음과 같습니다.
사용자 정의 대시보드 시작하기
사용자는 사용자 정의 대시보드를 생성한 후, 원하는 위젯을 추가하여 모니터링 정보를 확인할 수 있습니다.
사용자 정의 대시보드 생성하기
사용자 정의 대시보드를 생성하려면 다음 절차를 따르세요.
- 오른쪽 상단 메뉴에서 사용자 정의 대시보드 관리를 클릭하세요. 사용자 정의 대시보드 관리 페이지로 이동합니다.
- 대시보드 추가를 클릭하세요. 대시보드 추가 팝업창이 열립니다.
- 생성할 대시보드명을 입력한 후 저장 버튼을 클릭하세요.
- 생성한 사용자 정의 대시보드가 나의 대시보드 목록에 표시됩니다.
위젯 추가하기
사용자 정의 대시보드는 성능 통계, 비교 차트, 이벤트 목록 등 다양한 형식의 위젯을 제공합니다. 사용자는 모니터링을 원하는 정보를 위젯으로 추가하여 사용자 정의 대시보드를 자유롭게 구성할 수 있습니다.
- 생성한 위젯은 위치, 크기를 변경하거나 내용을 수정, 복사, 삭제할 수 있습니다. 자세한 내용은 사용자 정의 위젯 관리하기를 참고하세요.
위젯을 추가하려면 다음 절차를 따르세요.
- 오른쪽 상단 메뉴에서 사용자 정의 대시보드 관리를 클릭하세요. 사용자 정의 대시보드 관리 페이지로 이동합니다.
- 나의 대시보드 목록에서 위젯을 추가할 사용자 정의 대시보드를 선택하세요.
- 대시보드 오른쪽 위에 있는 + 버튼 또는 위젯 추가 버튼을 클릭하세요. 위젯 추가 팝업창이 열립니다.
- 위젯 추가 팝업창에서 대시보드에 사용할 위젯을 선택하여 추가하세요.
- 위젯을 선택하면 상세 설정 항목과 미리보기가 표시됩니다.
- 각 차트에 대한 설명과 설정 방법은 사용자 정의 위젯을 참고하세요.
- 확인 버튼을 클릭하세요.
사용자 정의 위젯
사용자 정의 대시보드에 추가할 수 있는 위젯의 종류는 다음과 같습니다.
| 위젯 이름 | 설명 |
|---|---|
| 타이틀 박스 | 사용자 정의 대시보드에 타이틀 박스를 표시합니다. |
| 이벤트 현황 | 발생한 이벤트를 표시합니다. |
| 모니터링 현황 | 모니터링 대상 개수와 모니터링 상태를 표시합니다. |
| 주요성능 Top5 | 특정 성능항목의 사용률이 가장 높은 5개 모니터링 대상을 표시합니다. |
| 이벤트 맵 | 서비스별 이벤트 발생 개수를 위험도별로 표시합니다. |
| 이벤트 히스토리 | 날짜별 이벤트의 발생 개수를 위험도별로 표시합니다. |
| 시계열 그래프 | 선택한 모니터링 대상의 성능항목을 시계열 그래프로 표시합니다. |
| 현황 지표 | 선택한 모니터링 대상들의 성능 값 통계치와 위험도를 표시합니다. |
| 인스턴스 맵 | 선택한 모니터링 대상들의 성능 값을 각기 다른 농도의 색상으로 표시합니다. |
타이틀 박스
사용자 정의 대시보드에 타이틀 박스를 표시합니다.
- 타이틀 박스는 최대 10개까지 생성할 수 있습니다.
- 여러 개의 타이틀 박스를 동시에 추가할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 타이틀 | 타이틀 박스에 표기할 텍스트를 입력하세요. |
| 추가하기 | 새로운 텍스트 박스를 추가합니다. |
| 삭제 | 해당하는 텍스트 박스를 삭제합니다. |
이벤트 현황
발생한 이벤트를 표시합니다.
- 발생한 모든 이벤트를 표시하거나 활성화된 이벤트만 표시하도록 설정할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
| 조회범위 | 위젯에 표시할 이벤트의 범위를 선택
|
모니터링 현황
모니터링 대상 개수와 모니터링 상태를 표시합니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
주요 성능 Top 5
Account 내에서 특정 성능 항목의 사용률이 가장 높은 5개 모니터링 대상을 표시합니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
| 서비스 | 성능을 확인할 서비스를 선택하세요. |
| 성능항목 | 모니터링 대상을 표시할 기준이 되는 성능항목을 선택
|
이벤트 맵
서비스별 이벤트 발생 개수를 위험도별로 표시합니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
이벤트 히스토리
날짜별 이벤트의 발생 개수를 위험도별로 표시합니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
시계열 그래프
선택한 모니터링 대상의 성능항목을 시계열 그래프로 표시합니다.
- 대시보드의 조회기간 설정 기능을 이용하여 시계열 그래프가 표시되는 기간을 변경할 수 있습니다.
- 그래프 위에 마우스 커서를 위치하면 해당 부분의 시간과 대상별 성능값을 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
| 서비스 | 성능을 확인할 서비스를 선택하세요. |
| 모니터링 대상 | 그래프로 표시할 모니터링 대상을 선택하세요. |
| 성능항목 | 그래프로 표시할 성능 항목을 선택하세요. |
| 옵션추가 | 위험 구간을 표시할 수 있습니다.
|
미리보기 오른쪽 상단에 있는 아이콘을 클릭하여 그래프 형태를 변경할 수 있습니다.
- 선형 그래프
- 영역형 그래프
- 누적 막대형 그래프
- 산점형 그래프
현황지표
모니터링 대상들의 성능값의 통계 수치와 위험도를 표시합니다.
모니터링 대시보드에서 현황지표값 위에 마우스 커서를 위치하면 해당 항목에 대한 상세 정보를 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
| 서비스 | 성능을 확인할 서비스를 선택하세요. |
| 모니터링 대상 | 그래프로 표시할 모니터링 대상을 선택하세요. |
| 성능항목 | 그래프로 표시할 성능 항목을 선택하세요. |
| 통계 | 모니터링 대상의 성능값을 표시할 통계 방법을 선택
|
| 옵션추가 | 위험 구간을 표시할 수 있습니다.
|
인스턴스 맵
모니터링 대상들의 성능값을 각각 다른 농도의 색상으로 표시합니다.
- 각 히트맵 위에 마우스 커서를 위치하면 해당 항목에 대한 상세 정보를 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 위젯명 | 위젯의 이름을 입력하세요. |
| 서비스 | 성능을 확인할 서비스를 선택하세요. |
| 모니터링 대상 | 그래프로 표시할 모니터링 대상을 선택하세요. |
| 성능항목 | 그래프로 표시할 성능 항목을 선택하세요. |
사용자 정의 대시보드 확인하기
사용자 정의 대시보드를 확인하려면 다음 절차를 따르세요.
- 오른쪽 상단 메뉴에서 사용자 정의 대시보드 관리를 클릭하세요. 사용자 정의 대시보드 관리 페이지로 이동합니다.
- 나의 대시보드 목록에서 확인할 사용자 정의 대시보드를 선택하세요.
항목 설명 대시보드 목록 사용자 정의 대시보드 목록을 표시합니다. 목록을 클릭해 확인할 대시보드를 변경할 수 있습니다. - 나의 대시보드: 직접 생성한 대시보드 목록을 표시합니다.
- 공유 대시보드: 공유 받은 대시보드 목록을 표시합니다.
대시보드 이름 사용자 대시보드의 이름이 표시됩니다. 대시보드 설정 - 날짜/시간: 분석 정보의 기준 일시을 표시합니다.
- 새로고침: 현재 시간으로 새로고침합니다.
- 중지/시작: 자동 새로고침 기능을 끄거나 켭니다.
- 설정: 데이터 조회 기간을 설정하거나 자동 새로고침 주기를 변경할 수 있습니다.(조회 기간 설정하기 참고)
위젯 추가 대시보드에 새 위젯을 추가합니다. 대시보드 편집 현재 설정된 사용자 정의 대시보드를 편집할 수 있습니다. - 대시보드 수정: 현재 선택한 대시보드명을 수정합니다.
- 대시보드 복사: 현재 선택한 대시보드를 복사해 동일한 위젯을 가진 사용자 정의 대시보드를 생성합니다.
- 대시보드 삭제: 현재 선택한 대시보드를 삭제합니다.
- 대시보드 공유: 대시보드를 특정한 사용자가 확인할 수 있도록 공유합니다. 자세한 내용은 사용자 정의 대시보드 공유하기를 참고하세요.
사용자 정의 위젯 대시보드를 구성하는 위젯을 표시합니다. - 위젯의 위치, 크기를 변경하거나 수정, 삭제할 수 있습니다. 자세한 내용은 사용자 정의 위젯 관리하기를 참고
- 그래픽 위젯을 이미지 파일로 다운로드할 수 있습니다.
표. 사용자 정의 대시보드 정보
위젯 다운로드 하기
그래픽 형태의 위젯을 이미지 파일(*.png)로 다운로드할 수 있습니다.
그래프 위젯에 마우스 커서를 위치하면 오른쪽 상단에 다운로드 버튼이 표시됩니다. 다운로드 버튼을 클릭하면 해당 위젯을 이미지 파일로 다운로드합니다.
사용자 정의 대시보드 공유하기
사용자 정의 대시보드를 공유해 다른 사용자가 해당 대시보드를 확인할 수 있도록 설정할 수 있습니다.
사용자 정의 대시보드를 공유하려면 다음 절차를 따르세요.
- 오른쪽 상단 메뉴에서 사용자 정의 대시보드 관리를 클릭하세요. 사용자 정의 대시보드 관리 페이지로 이동합니다.
- 나의 대시보드 목록에서 확인할 사용자 정의 대시보드를 선택하세요.
- 대시보드 오른쪽 상단 더보기을 클릭한 뒤, 대시보드 공유를 클릭하세요. 대시보드 공유 팝업창이 열립니다.
- 대시보드를 공유할 사용자를 선택한 후 > 버튼을 클릭하여, 선택한 사용자가 공유대상으로 이동하는 것을 확인하세요.
- 확인 버튼을 클릭하세요.
사용자 정의 대시보드 관리하기
사용자 정의 대시보드를 수정하거나 복사, 삭제할 수 있습니다.
- 오른쪽 상단 메뉴에서 사용자 정의 대시보드 관리를 클릭하세요. 사용자 정의 대시보드 관리 페이지로 이동합니다.
- 나의 대시보드 목록에서 확인할 사용자 정의 대시보드를 선택하세요.
- 대시보드 오른쪽 상단 더보기 버튼을 클릭한 뒤, 원하는 명령을 선택하세요.
- 대시보드 수정: 대시보드의 이름을 수정합니다.
- 대시보드 복사: 대시보드를 복사하여 새로운 대시보드를 생성합니다.
- 대시보드 공유: 대시보드를 다른 사용자와 공유합니다.
- 대시보드 삭제: 대시보드를 삭제합니다.
사용자 정의 위젯 관리하기
위젯의 위치, 크기를 변경하거나 위젯을 수정, 복사할 수 있습니다.
위젯 위치 변경하기
위젯의 이름을 클릭한 후, 드래그하여 해당 위젯의 위치를 변경할 수 있습니다.
위젯 크기 변경하기
위젯의 크기를 변경하려면 다음 절차를 따르세요.
- 위젯에 마우스 커서를 위치하세요. 위젯의 오른쪽 하단에 사이즈 조절 버튼이 표시됩니다.
- 사이즈 조절 버튼을 클릭한 상태로 드래그하여 원하는 크기로 조절하세요.
위젯 수정, 복사, 삭제하기
위젯을 수정하거나 복사, 삭제하려면 다음 절차를 따르세요.
- 위젯에 마우스 커서를 위치하세요. 위젯의 오른쪽 상단에 더보기 버튼이 표시됩니다.
- 더보기 버튼을 클릭한 후, 원하는 명령을 클릭하세요.
- 위젯 수정: 위젯의 차트 설정값을 수정합니다.
- 위젯 복사: 위젯을 복사해 동일한 내용을 가진 위젯을 생성합니다.
- 위젯 삭제: 위젯을 삭제합니다.
2.6 - 에이전트 관리하기
에이전트는 모니터링 대상으로부터 성능값, 로그, 윈도우 이벤트를 수집하는 모듈입니다. 사용자는 모니터링 기능을 사용하기 위하여 에이전트의 설치 여부를 확인하고 운영, 관리해야 합니다.
- 모니터링 대상에 IP 접근제어가 설정되어 있을 경우, 에이전트 관리를 사용할 수 없습니다. 에이전트 관리를 사용할 수 없는 경우에는 선택한 모니터링 대상의 IP 접근제어 설정 상태를 확인하세요.
- 에이전트 관리기능은 sudo 명령어를 사용하므로 사전에 sudo 패키지가 설치해야 합니다.
에이전트 관리개요
에이전트는 성능 수집 에이전트와 로그 수집 에이전트, 윈도우 이벤트 로그 수집 에이전트가 있습니다.
- 에이전트는 사용자의 필요에 따라 모니터링 대상에 사용자가 각각 수동으로 설치해야 합니다.
에이전트 관리하기
성능 에이전트 관리하기
에이전트를 설치하고 관리하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 성능 분석 버튼을 클릭하세요. 성능 분석 페이지로 이동합니다.
- 성능 분석 페이지에서 모니터링 대상을 선택하고 모니터링 대상 상세보기 버튼을 클릭하세요. 모니터링 대상 상세 팝업창이 열립니다.
- 모니터링 대상 상세 팝업창에서 에이전트 탭을 클릭하세요. 에이전트 탭으로 이동합니다.
- 에이전트 탭에서 성능 버튼을 클릭하세요.
- 설치 명령어의 오른쪽 복사 아이콘을 클릭하여 명령어를 복사하세요.
- 복사된 명령어을 모니터링 대상 자원에서 붙여넣기 하세요.
- 모니터링 대상 자원에 복사된 명령어를 실행하세요.
| 항목 | 설명 |
|---|---|
| 설치 | 에이전트 설치에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
| 시작 | 에이전트 시작 명령어를 실행합니다. |
| 중지 | 에이전트 중지 명령어를 실행합니다. |
| 삭제 | 에이전트 삭제 명령어를 실행합니다. |
| 업데이트 | 에이전트 업데이트에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
에이전트 서비스 상태를 확인하려면 아래의 방법을 이용합니다.
- linux: $ sudo systemctl status metricbeat
- windows: Task Manager → service → metricbeat → Status(Running)
로그 에이전트 관리하기
에이전트를 설치하고 관리하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 성능 분석을 클릭하세요. 성능 분석 페이지로 이동합니다.
- 성능 분석 페이지에서 모니터링 대상을 선택하고 모니터링 대상 상세보기 버튼을 클릭하세요. 모니터링 대상 상세 팝업창이 열립니다.
- 모니터링 대상 상세 팝업창에서 에이전트 탭을 클릭하세요. 에이전트 탭으로 이동합니다.
- 로그 버튼을 클릭하세요.
- 설치 명령어의 오른쪽 복사 아이콘을 클릭하여 명령어를 복사하세요.
- 복사된 명령어을 모니터링 대상 자원에서 붙여넣기 하세요.
- 모니터링 대상 자원에 복사된 명령어를 실행하세요.
| 항목 | 설명 |
|---|---|
| 설치 | 에이전트 설치에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
| 시작 | 에이전트 시작 명령어를 실행합니다. |
| 중지 | 에이전트 중지 명령어를 실행합니다. |
| 삭제 | 에이전트 삭제 명령어를 실행합니다. |
| 업데이트 | 에이전트 업데이트에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
에이전트 서비스 상태를 확인하려면 아래의 방법을 이용합니다.
- linux: $ sudo systemctl status filebeat
- windows: Task Manager → service → filebeat → Status(Running)
모니터링 할 로그를 추가하려면 로그추가 액션을 선택하고 로그 명과 로그 경로를 맞게 입력한 후 명령어 생성 버튼을 클릭합니다. 생성된 명령어를 모니터링 대상 자원에서 붙여넣기를 한 후 실행합니다.
이벤트 에이전트 관리하기
에이전트를 설치하고 관리하려면 다음 절차를 따르세요.
- Cloud Monitoring Console > 성능 분석을 클릭하세요. 성능 분석 페이지로 이동합니다.
- 성능 분석 페이지에서 모니터링 대상을 선택하고 모니터링 대상 상세보기 버튼을 클릭하세요. 모니터링 대상 상세 팝업창이 열립니다.
- 모니터링 대상 상세 팝업창에서 에이전트 탭을 클릭하세요. 에이전트 탭으로 이동합니다.
- 이벤트 버튼을 클릭하세요.
- 설치 명령어의 오른쪽 복사 아이콘을 클릭하여 명령어를 복사하세요.
- 복사된 명령어을 모니터링 대상 자원에서 붙여넣기 하세요.
- 모니터링 대상 자원에 복사된 명령어를 실행하세요.
| 항목 | 설명 |
|---|---|
| 설치 | 에이전트 설치에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
| 시작 | 에이전트 시작 명령어를 실행합니다. |
| 중지 | 에이전트 중지 명령어를 실행합니다. |
| 삭제 | 에이전트 삭제 명령어를 실행합니다. |
| 업데이트 | 에이전트 업데이트에 필요한 스크립트 파일을 다운로드 받아 실행합니다. |
에이전트 서비스 상태를 확인하려면 아래의 방법을 이용합니다.
- windows: Task Manager → service → winlogbeat → Status(Running)
2.7 - 부록 A. 서비스별 모니터링 대상
Compute 유형
Virtual Server
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | OS | Agent Agentless | 1m |
| 로그 | OS | Agent | 로그 발생 시 |
| 상태 | OS | Agentless | 1m |
GPU Server
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | OS | Agent Agentless | 1m |
| 로그 | OS | Agent | 로그 발생 시 |
| 상태 | OS | Agentless | 1m |
Bare Metal Server
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | OS | Agent | 1m |
| 로그 | OS | Agent | 로그 발생 시 |
| 상태 | OS | N/A | - |
Multi-node GPU Cluster [Cluster Fabric]
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | OS | Agent | 1m |
| 로그 | OS | Agent | 로그 발생 시 |
| 상태 | OS | N/A | - |
Multi-node GPU Cluster [Node]
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | OS | Agent | 1m |
| 로그 | OS | Agent | 로그 발생 시 |
| 상태 | OS | N/A | - |
Storage 유형
모든 Storage 유형 서비스의 모니터링 대상과 수집 방식, 수집 주기는 동일합니다.
- File Storage
- Object Storage
- Block Storage(BM)
- Block Storage(VM)
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Storage | Agentless | 1m |
| 로그 | Storage | N/A | - |
| 상태 | Storage | Agentless | 1m |
Database 유형
모든 Database 유형 서비스의 모니터링 대상과 수집 방식, 수집 주기는 동일합니다.
- PostgreSQL(DBaaS)
- MariaDB(DBaaS)
- MySQL(DBaaS)
- Microsoft SQL Server
- EPAS
- CacheStore(DBaaS)
- Redis
- Valkey
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Database Process, OS | Agent | 1m |
| 로그 | Database Process, OS | Agent | 로그 발생 시 |
| 상태 | Database Process | Agent | 1m |
| OS | Agentless | 1m |
Data Analytics 유형
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Data Analytics Process, OS | Agent | 1m |
| 로그 | Data Analytics Process, OS | Agent | 로그 발생 시 |
| 상태 | Data Analytics Process | Agent | 1m |
| OS | Agentless | 1m |
Container 유형
Kubernetes Engine
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Cluster, Namespace, Node, ReplicaSet, Deployment, StatefulSet, DaemonSet, Job, CronJob, Pod | Agentless | 5m |
| 로그 | Cluster, Namespace, Node, ReplicaSet, Deployment, StatefulSet, DaemonSet, Job, CronJob, Pod | Agentless | 로그 발생 시 |
| 상태 | Cluster, Namespace, Node, ReplicaSet, Deployment, StatefulSet, DaemonSet, Job, CronJob, Pod | Agentless | 5m |
Container Registry
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Container Registry | Agentless | 5m |
| 로그 | Container Registry | Agentless | 로그 발생 시 |
| 상태 | Container Registry | Agentless | 5m |
Networking 유형
VPC
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Internet Gateway | Agentless | 5m |
| 로그 | Internet Gateway | N/A | - |
| 상태 | Internet Gateway | N/A | - |
Load Balancer(OLD)
Load Balancer(OLD)
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Load Balencer | Agentless | 5m |
| 로그 | Load Balencer | N/A | - |
| 상태 | Load Balencer | Agentless | 5m |
Load Balancer Listener(OLD)
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Load Balencer Listener | Agentless | 5m |
| 로그 | Load Balencer Listener | N/A | - |
| 상태 | Load Balencer Listener | Agentless | 5m |
Load Balancer
Load Balancer
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Load Balencer | Agentless | 5m |
| 로그 | Load Balencer | N/A | - |
| 상태 | Load Balencer | Agentless | 5m |
Load Balancer Listener
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Load Balencer Listener | Agentless | 5m |
| 로그 | Load Balencer Listener | N/A | - |
| 상태 | Load Balencer Listener | Agentless | 5m |
Load Balancer Server Group
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Load Balencer Server Group | Agentless | 5m |
| 로그 | Load Balencer Server Group | N/A | - |
| 상태 | Load Balencer Server Group | Agentless | 5m |
Direct Connect
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Direct Connect | Agentless | 5m |
| 로그 | Direct Connect | N/A | - |
| 상태 | Direct Connect | N/A | - |
Cloud WAN
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Cloud WAN | Agentless | 10m |
| 로그 | Cloud WAN | N/A | - |
| 상태 | Cloud WAN | Agentless | 10m |
Global CDN
| 구분 | 모니터링 대상 | 수집 방식 | 수집 주기 |
|---|---|---|---|
| 성능 | Global CDN | Agentless | 5m |
| 로그 | Global CDN | N/A | - |
| 상태 | Global CDN | Agentless | 5m |
2.8 - 부록 B. 서비스별 성능 항목
Compute 유형
Virtual Server
Agentless (기본 메트릭)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| CPU | CPU Usage/Core [Basic] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (코어 수로 정규화된 값, 코어 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Cores [Basic] | cnt | 1m | 가상 머신에 할당된 가상 프로세서 코어 수 |
| Memory | Memory Total [Basic] | bytes | 1m | 도메인에서 사용할 수 있는 메모리의 용량 |
| Memory | Memory Used [Basic] | bytes | 1m | 현재 사용중인 메모리의 용량 |
| Memory | Memory Swap In [Basic] | bytes | 1m | Bytes 단위의 Swap In 메모리 |
| Memory | Memory Swap Out [Basic] | bytes | 1m | Bytes 단위의 Swap Out 메모리 |
| Memory | Memory Free [Bytes] | bytes | 1m | 시스템에서 사용하지 않은 메모리 용량 |
| Memory | Memory Usage [Basic] | % | 1m | 현재 사용중인 메모리의 사용률 |
| Disk | Disk Read Bytes [Basic] | bytes | 1m | 읽기 바이트 수 |
| Disk | Disk Read Requests [Basic] | cnt | 1m | 읽기 요청 수 |
| Disk | Disk Write Bytes [Basic] | bytes | 1m | 쓰기 바이트 수 |
| Disk | Disk Write Requests [Basic] | cnt | 1m | 쓰기 요청 수 |
| State | Instance State [Basic] | enum | 1m | VM의 상태 |
| Network | Network In Bytes [Basic] | bytes | 1m | 수신 바이트 |
| Network | Network In Dropped [Basic] | cnt | 1m | 수신 패킷 드롭 |
| Network | Network In Errors [Basic] | cnt | 1m | 수신 오류 |
| Network | Network In Packets [Basic] | cnt | 1m | 수신 패킷 |
| Network | Network Out Bytes [Basic] | bytes | 1m | 송신 바이트 |
| Network | Network Out Dropped [Basic] | cnt | 1m | 송신 패킷 드롭 |
| Network | Network Out Errors [Basic] | cnt | 1m | 송신 오류 |
| Network | Network Out Packets [Basic] | cnt | 1m | 송신 패킷 |
| Network | Network In Bytes [Delta Basic] | bytes | 1m | 수신 바이트 (델타값) |
| Network | Network In Dropped [Delta Basic] | cnt | 1m | 수신 패킷 드롭 (델타값) |
| Network | Network In Errors [Delta Basic] | cnt | 1m | 수신 오류 (델타값) |
| Network | Network In Packets [Delta Basic] | cnt | 1m | 수신 패킷 (델타값) |
| Network | Network Out Bytes [Delta Basic] | bytes | 1m | 송신 바이트 (델타값) |
| Network | Network Out Dropped [Delta Basic] | cnt | 1m | 송신 패킷 드롭 (델타값) |
| Network | Network Out Errors [Delta Basic] | cnt | 1m | 송신 오류 (델타값) |
| Network | Network Out Packets [Delta Basic] | cnt | 1m | 송신 패킷 (델타값) |
- Windows OS의 경우 모니터링 성능 Agent를 설치해야 메모리 성능 지표 제공이 가능합니다.
Agent (상세 메트릭)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| CPU | Core Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기) |
| CPU | Core Usage [System] | % | 1m | 커널 공간에서 소요된 CPU 시간의 비율 |
| CPU | Core Usage [User] | % | 1m | 사용자 공간에서 소요된 CPU 시간의 비율 |
| CPU | CPU Cores | cnt | 1m | 호스트에 있는 CPU 코어의 수입니다. 정규화되지 않은 비율의 최대 값은 코어의 100%*입니다. 정규화되지 않은 비율에는 이 값이 이미 반영되어 있으며 최대 값은 코어의 100%*입니다. |
| CPU | CPU Usage [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 4개 모두를 100% 사용하는 경우 400%) |
| CPU | CPU Usage/Core [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage/Core [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage/Core [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| Disk | Disk CPU Usage [IO Request] | % | 1m | 장치에 대한 입출력 요청이 실행된 CPU 시간의 비율입니다(장치의 대역폭 활용도). 이 값이 100%에 가까우면 장치 포화 상태가 됩니다. |
| Disk | Disk Queue Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 대기열 길이입니다. |
| Disk | Disk Read Bytes | bytes | 1m | 장치에서 읽는 초당 바이트 수입니다. |
| Disk | Disk Read Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 평균 |
| Disk | Disk Read Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최대 |
| Disk | Disk Read Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최소 |
| Disk | Disk Read Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 합 |
| Disk | Disk Read Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.read.bytes 값의 delta |
| Disk | Disk Read Bytes [Success] | bytes | 1m | 성공적으로 읽은 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 읽어들인 섹터 수에 512를 곱한 값 |
| Disk | Disk Read Requests | cnt | 1m | 1초동안 디스크 디바이스의 읽기 요청 수 |
| Disk | Disk Read Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 평균 |
| Disk | Disk Read Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최대 |
| Disk | Disk Read Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최소 |
| Disk | Disk Read Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 합 |
| Disk | Disk Read Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.read.count 의 delta |
| Disk | Disk Read Requests [Success] | cnt | 1m | 성공적으로 완료된 총 읽기 수 |
| Disk | Disk Request Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 크기(단위: 섹터)입니다. |
| Disk | Disk Service Time [Avg] | ms | 1m | 장치에 대해 실행된 입력 요청의 평균 서비스 시간(밀리초)입니다. |
| Disk | Disk Wait Time [Avg] | ms | 1m | 지원할 장치에 대해 실행된 요청에 소요된 평균 시간입니다. |
| Disk | Disk Wait Time [Read] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Wait Time [Write] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Write Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 평균 |
| Disk | Disk Write Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최대 |
| Disk | Disk Write Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최소 |
| Disk | Disk Write Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 합 |
| Disk | Disk Write Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.write.bytes 값의 delta |
| Disk | Disk Write Bytes [Success] | bytes | 1m | 성공적으로 쓰여진 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 쓰여진 섹터 수에 512를 곱한 값 |
| Disk | Disk Write Requests | cnt | 1m | 1초동안 디스크 디바이스의 쓰기 요청 수 |
| Disk | Disk Write Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 평균 |
| Disk | Disk Write Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최대 |
| Disk | Disk Write Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최소 |
| Disk | Disk Write Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 합 |
| Disk | Disk Write Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.write.count 의 delta |
| Disk | Disk Write Requests [Success] | cnt | 1m | 성공적으로 완료된 총 쓰기 수 |
| Disk | Disk Writes Bytes | bytes | 1m | 장치에 쓰는 초당 바이트 수입니다. |
| FileSystem | Filesystem Hang Check | state | 1m | filesystem(local/NFS) hang 체크 (정상:1, 비정상:0) |
| FileSystem | Filesystem Nodes | cnt | 1m | 파일 시스템의 총 파일 노드 수입니다. |
| FileSystem | Filesystem Nodes [Free] | cnt | 1m | 파일 시스템의 총 가용 파일 노드 수입니다. |
| FileSystem | Filesystem Size [Available] | bytes | 1m | 권한 없는 사용자가 사용할 수 있는 디스크 공간(바이트)입니다. |
| FileSystem | Filesystem Size [Free] | bytes | 1m | 사용 가능한 디스크 공간 (bytes) |
| FileSystem | Filesystem Size [Total] | bytes | 1m | 총 디스크 공간 (bytes) |
| FileSystem | Filesystem Usage | % | 1m | 사용한 디스크 공간 백분율 |
| FileSystem | Filesystem Usage [Avg] | % | 1m | 개별 filesystem.used.pct들의 평균 |
| FileSystem | Filesystem Usage [Inode] | % | 1m | inode 사용률 |
| FileSystem | Filesystem Usage [Max] | % | 1m | 개별 filesystem.used.pct 중에 max |
| FileSystem | Filesystem Usage [Min] | % | 1m | 개별 filesystem.used.pct 중에 min |
| FileSystem | Filesystem Usage [Total] | % | 1m | - |
| FileSystem | Filesystem Used | bytes | 1m | 사용한 디스크 공간 (bytes) |
| FileSystem | Filesystem Used [Inode] | bytes | 1m | inode 사용량 |
| Memory | Memory Free | bytes | 1m | 사용 가능한 총 메모리 양 (bytes). 시스템 캐시 및 버퍼에서 사용하는 메모리는 포함하지 않음 (system.memory.actual.free 참고). |
| Memory | Memory Free [Actual] | bytes | 1m | 실제 사용가능한 memory (bytes). OS 에 따라 계산방식이 다르며, Linux 에서는 /proc/ meminfo 에서 MemAvailable 이거나 meminfo 를 사용할 수 없는 경우에는 사용 가능한 메모리와 캐시 및 버퍼에서 계산함. OSX 에서는 사용가능한 메모리와 비활성 메모리의 합계. Windows 에서는 system.memory.free 와 같은 값. |
| Memory | Memory Free [Swap] | bytes | 1m | 사용가능한 swap memory. |
| Memory | Memory Total | bytes | 1m | 총 memory |
| Memory | Memory Total [Swap] | bytes | 1m | 총 swap memory. |
| Memory | Memory Usage | % | 1m | 사용한 memory의 백분율 |
| Memory | Memory Usage [Actual] | % | 1m | 실제 사용된 memory의 백분율 |
| Memory | Memory Usage [Cache Swap] | % | 1m | cache 된 swap 사용률 |
| Memory | Memory Usage [Swap] | % | 1m | 사용한 swap memory의 백분율 |
| Memory | Memory Used | bytes | 1m | 사용한 memory |
| Memory | Memory Used [Actual] | bytes | 1m | 실제 사용된 memory (bytes). 총 memory 에서 사용된 memory 를 뺀 값. 사용가능 메모리는 OS 마다 다르게 계산됨 (system.actual.free 참고) |
| Memory | Memory Used [Swap] | bytes | 1m | 사용한 swap memory. |
| Network | Collisions | cnt | 1m | 네트워크 충돌 |
| Network | Network In Bytes | bytes | 1m | 수신된 byte 수 |
| Network | Network In Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 평균 |
| Network | Network In Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최대 |
| Network | Network In Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최소 |
| Network | Network In Bytes [Delta Sum] | bytes | 1m | 개별 network 들의 system.network.in.bytes_delta의 합 |
| Network | Network In Bytes [Delta] | bytes | 1m | 수신된 byte 수의 delta |
| Network | Network In Dropped | cnt | 1m | 들어온 packet 중 삭제된 패킷의 수 |
| Network | Network In Errors | cnt | 1m | 수신 중의 error 수 |
| Network | Network In Packets | cnt | 1m | 수신된 packet 수 |
| Network | Network In Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 평균 |
| Network | Network In Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최대 |
| Network | Network In Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최소 |
| Network | Network In Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 합 |
| Network | Network In Packets [Delta] | cnt | 1m | 수신된 packet 수의 delta |
| Network | Network Out Bytes | bytes | 1m | 송신된 byte 수 |
| Network | Network Out Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 평균 |
| Network | Network Out Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최대 |
| Network | Network Out Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최소 |
| Network | Network Out Bytes [Delta Sum] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 합 |
| Network | Network Out Bytes [Delta] | bytes | 1m | 송신된 byte 수의 delta |
| Network | Network Out Dropped | cnt | 1m | 나가는 packet 중 삭제된 packet 수. 이 값은 운영체제에서 보고되지 않으므로 Darwin 과 BSD에서 항상 0 임. |
| Network | Network Out Errors | cnt | 1m | 송신 중의 error 수 |
| Network | Network Out Packets | cnt | 1m | 송신된 packet 수 |
| Network | Network Out Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 평균 |
| Network | Network Out Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최대 |
| Network | Network Out Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최소 |
| Network | Network Out Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 합 |
| Network | Network Out Packets [Delta] | cnt | 1m | 송신된 packet 수의 delta |
| Network | Open Connections [TCP] | cnt | 1m | 열려 있는 모든 TCP 연결 |
| Network | Open Connections [UDP] | cnt | 1m | 열려 있는 모든 UDP 연결 |
| Network | Port Usage | % | 1m | 접속가능한 port 사용률 |
| Network | SYN Sent Sockets | cnt | 1m | SYN_SENT 상태의 소켓 수 (로컬에서 원격 접속시) |
| Process | Kernel PID Max | cnt | 1m | kernel.pid_max 값 |
| Process | Kernel Thread Max | cnt | 1m | kernel.threads-max 값 |
| Process | Process CPU Usage | % | 1m | 마지막 업데이트 후 프로세스에서 소비한 CPU 시간의 백분율. 이 값은 Unix 시스템에서 top 명령으로 표시되는 프로세스의 %CPU 값과 유사. |
| Process | Process CPU Usage/Core | % | 1m | 마지막 이벤트 이후 프로세스에서 사용한 CPU 시간의 백분율. 코어 수로 정규화되며 0~100% 사이의 값. |
| Process | Process Memory Usage | % | 1m | main memory (RAM) 에서 프로세스가 차지하는 비율 |
| Process | Process Memory Used | bytes | 1m | Resident Set 사이즈. 프로세스가 RAM 에서 차지한 메모리 양. Windows 에서는 current working set 사이즈. |
| Process | Process PID | PID | 1m | 프로세스 pid |
| Process | Process PPID | PID | 1m | 부모 프로세스의 pid |
| Process | Processes [Dead] | cnt | 1m | dead processes 수 |
| Process | Processes [Idle] | cnt | 1m | idle processes 수 |
| Process | Processes [Running] | cnt | 1m | running processes 수 |
| Process | Processes [Sleeping] | cnt | 1m | sleeping processes 수 |
| Process | Processes [Stopped] | cnt | 1m | stopped processes 수 |
| Process | Processes [Total] | cnt | 1m | 총 processes 수 |
| Process | Processes [Unknown] | cnt | 1m | 상태를 검색할 수 없거나 알 수 없는 processes 수 |
| Process | Processes [Zombie] | cnt | 1m | 좀비 processes 수 |
| Process | Running Process Usage | % | 1m | process 사용률 |
| Process | Running Processes | cnt | 1m | running processes 수 |
| Process | Running Thread Usage | % | 1m | thread 사용률 |
| Process | Running Threads | cnt | 1m | running processes 에서 실행중인 thread 수 총합 |
| System | Context Switches | cnt | 1m | context switch 수 (초당) |
| System | Load/Core [1 min] | cnt | 1m | 마지막 1 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [15 min] | cnt | 1m | 마지막 15 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [5 min] | cnt | 1m | 마지막 5 분 동안의 로드를 코어 수로 나눈 값 |
| System | Multipaths [Active] | cnt | 1m | 외장 스토리지 연결 path state = active 카운트 |
| System | Multipaths [Failed] | cnt | 1m | 외장 스토리지 연결 path state = failed 카운트 |
| System | Multipaths [Faulty] | cnt | 1m | 외장 스토리지 연결 path state = faulty 카운트 |
| System | NTP Offset | num | 1m | last sample의 measured offset (NTP 서버와 로컬환경 간의 시간 차이) |
| System | Run Queue Length | num | 1m | 실행 대기열 길이 |
| System | Uptime | ms | 1m | OS 가동시간(uptime). (milliseconds) |
| Windows | Context Switchies | cnt | 1m | CPU context switch 수 (초당) |
| Windows | Disk Read Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 읽어들인 바이트 수 |
| Windows | Disk Read Time [Avg] | sec | 1m | 데이터 읽기 평균 시간 (초) |
| Windows | Disk Transfer Time [Avg] | sec | 1m | 디스크 average wait time |
| Windows | Disk Usage | % | 1m | 디스크 사용률 |
| Windows | Disk Write Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 쓰여진 바이트 수 |
| Windows | Disk Write Time [Avg] | sec | 1m | 데이터 쓰기 평균 시간 (초) |
| Windows | Pagingfile Usage | % | 1m | paging file 사용률 |
| Windows | Pool Used [Non Paged] | bytes | 1m | 커널 메모리 중 Nonpaged Pool 사용량 |
| Windows | Pool Used [Paged] | bytes | 1m | 커널 메모리 중 Paged Pool 사용량 |
| Windows | Process [Running] | cnt | 1m | 현재 동작 중인 프로세스 수 |
| Windows | Threads [Running] | cnt | 1m | 현재 동작 중인 thread 수 |
| Windows | Threads [Waiting] | cnt | 1m | 프로세서 시간을 기다리는 thread 수 |
GPU Server
Agentless (기본 메트릭)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| CPU | CPU Usage/Core [Basic] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (코어 수로 정규화된 값, 코어 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Cores [Basic] | cnt | 1m | 가상 머신에 할당된 가상 프로세서 코어 수 |
| Memory | Memory Total [Basic] | bytes | 1m | 도메인에서 사용할 수 있는 메모리의 용량 |
| Memory | Memory Used [Basic] | bytes | 1m | 현재 사용중인 메모리의 용량 |
| Memory | Memory Swap In [Basic] | bytes | 1m | Bytes 단위의 Swap In 메모리 |
| Memory | Memory Swap Out [Basic] | bytes | 1m | Bytes 단위의 Swap Out 메모리 |
| Memory | Memory Free [Bytes] | bytes | 1m | 시스템에서 사용하지 않은 메모리 용량 |
| Memory | Memory Usage [Basic] | % | 1m | 현재 사용중인 메모리의 사용률 |
| Disk | Disk Read Bytes [Basic] | bytes | 1m | 읽기 바이트 수 |
| Disk | Disk Read Requests [Basic] | cnt | 1m | 읽기 요청 수 |
| Disk | Disk Write Bytes [Basic] | bytes | 1m | 쓰기 바이트 수 |
| Disk | Disk Write Requests [Basic] | cnt | 1m | 쓰기 요청 수 |
| State | Instance State [Basic] | enum | 1m | VM의 상태 |
| Network | Network In Bytes [Basic] | bytes | 1m | 수신 바이트 |
| Network | Network In Dropped [Basic] | cnt | 1m | 수신 패킷 드롭 |
| Network | Network In Errors [Basic] | cnt | 1m | 수신 오류 |
| Network | Network In Packets [Basic] | cnt | 1m | 수신 패킷 |
| Network | Network Out Bytes [Basic] | bytes | 1m | 송신 바이트 |
| Network | Network Out Dropped [Basic] | cnt | 1m | 송신 패킷 드롭 |
| Network | Network Out Errors [Basic] | cnt | 1m | 송신 오류 |
| Network | Network Out Packets [Basic] | cnt | 1m | 송신 패킷 |
| Network | Network In Bytes [Delta Basic] | bytes | 1m | 수신 바이트 (델타값) |
| Network | Network In Dropped [Delta Basic] | cnt | 1m | 수신 패킷 드롭 (델타값) |
| Network | Network In Errors [Delta Basic] | cnt | 1m | 수신 오류 (델타값) |
| Network | Network In Packets [Delta Basic] | cnt | 1m | 수신 패킷 (델타값) |
| Network | Network Out Bytes [Delta Basic] | bytes | 1m | 송신 바이트 (델타값) |
| Network | Network Out Dropped [Delta Basic] | cnt | 1m | 송신 패킷 드롭 (델타값) |
| Network | Network Out Errors [Delta Basic] | cnt | 1m | 송신 오류 (델타값) |
| Network | Network Out Packets [Delta Basic] | cnt | 1m | 송신 패킷 (델타값) |
Agent (상세 메트릭)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| GPU | GPU Count | cnt | 1m | gpu 개수 |
| GPU | GPU Memory Usage | % | 1m | 메모리 사용률 |
| GPU | GPU Memory Used | bytes | 1m | 메모리 사용량 |
| GPU | GPU Temperature | ℃ | 1m | gpu 온도 |
| GPU | GPU Usage | % | 1m | GPU 전체 사용률의 합계 (GPU 8개 모두를 100% 사용하는 경우 800%) |
| GPU | GPU Usage [Avg] | % | 1m | GPU 전체 평균 사용율(%) |
| GPU | GPU Power Cap | W | 1m | GPU의 최대 전력 용량 |
| GPU | GPU Power Usage | W | 1m | GPU의 현재 전력 사용량 |
| GPU | GPU Memory Usage [Avg] | % | 1m | GPU Memory Uti. AVG |
| GPU | GPU Count in use | cnt | 1m | Node 내 Job이 수행중인 GPU 수 |
| GPU | Execution State for nvidia-smi | state | 1m | nvidia-smi 명령어 실행결과 |
| CPU | Core Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기) |
| CPU | Core Usage [System] | % | 1m | 커널 공간에서 소요된 CPU 시간의 비율 |
| CPU | Core Usage [User] | % | 1m | 사용자 공간에서 소요된 CPU 시간의 비율 |
| CPU | CPU Cores | cnt | 1m | 호스트에 있는 CPU 코어의 수입니다. 정규화되지 않은 비율의 최대 값은 코어의 100%*입니다. 정규화되지 않은 비율에는 이 값이 이미 반영되어 있으며 최대 값은 코어의 100%*입니다. |
| CPU | CPU Usage [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 4개 모두를 100% 사용하는 경우 400%) |
| CPU | CPU Usage/Core [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage/Core [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage/Core [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| Disk | Disk CPU Usage [IO Request] | % | 1m | 장치에 대한 입출력 요청이 실행된 CPU 시간의 비율입니다(장치의 대역폭 활용도). 이 값이 100%에 가까우면 장치 포화 상태가 됩니다. |
| Disk | Disk Queue Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 대기열 길이입니다. |
| Disk | Disk Read Bytes | bytes | 1m | 장치에서 읽는 초당 바이트 수입니다. |
| Disk | Disk Read Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 평균 |
| Disk | Disk Read Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최대 |
| Disk | Disk Read Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최소 |
| Disk | Disk Read Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 합 |
| Disk | Disk Read Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.read.bytes 값의 delta |
| Disk | Disk Read Bytes [Success] | bytes | 1m | 성공적으로 읽은 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 읽어들인 섹터 수에 512를 곱한 값 |
| Disk | Disk Read Requests | cnt | 1m | 1초동안 디스크 디바이스의 읽기 요청 수 |
| Disk | Disk Read Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 평균 |
| Disk | Disk Read Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최대 |
| Disk | Disk Read Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최소 |
| Disk | Disk Read Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 합 |
| Disk | Disk Read Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.read.count 의 delta |
| Disk | Disk Read Requests [Success] | cnt | 1m | 성공적으로 완료된 총 읽기 수 |
| Disk | Disk Request Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 크기(단위: 섹터)입니다. |
| Disk | Disk Service Time [Avg] | ms | 1m | 장치에 대해 실행된 입력 요청의 평균 서비스 시간(밀리초)입니다. |
| Disk | Disk Wait Time [Avg] | ms | 1m | 지원할 장치에 대해 실행된 요청에 소요된 평균 시간입니다. |
| Disk | Disk Wait Time [Read] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Wait Time [Write] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Write Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 평균 |
| Disk | Disk Write Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최대 |
| Disk | Disk Write Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최소 |
| Disk | Disk Write Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 합 |
| Disk | Disk Write Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.write.bytes 값의 delta |
| Disk | Disk Write Bytes [Success] | bytes | 1m | 성공적으로 쓰여진 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 쓰여진 섹터 수에 512를 곱한 값 |
| Disk | Disk Write Requests | cnt | 1m | 1초동안 디스크 디바이스의 쓰기 요청 수 |
| Disk | Disk Write Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 평균 |
| Disk | Disk Write Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최대 |
| Disk | Disk Write Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최소 |
| Disk | Disk Write Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 합 |
| Disk | Disk Write Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.write.count 의 delta |
| Disk | Disk Write Requests [Success] | cnt | 1m | 성공적으로 완료된 총 쓰기 수 |
| Disk | Disk Writes Bytes | bytes | 1m | 장치에 쓰는 초당 바이트 수입니다. |
| FileSystem | Filesystem Hang Check | state | 1m | filesystem(local/NFS) hang 체크 (정상:1, 비정상:0) |
| FileSystem | Filesystem Nodes | cnt | 1m | 파일 시스템의 총 파일 노드 수입니다. |
| FileSystem | Filesystem Nodes [Free] | cnt | 1m | 파일 시스템의 총 가용 파일 노드 수입니다. |
| FileSystem | Filesystem Size [Available] | bytes | 1m | 권한 없는 사용자가 사용할 수 있는 디스크 공간(바이트)입니다. |
| FileSystem | Filesystem Size [Free] | bytes | 1m | 사용 가능한 디스크 공간 (bytes) |
| FileSystem | Filesystem Size [Total] | bytes | 1m | 총 디스크 공간 (bytes) |
| FileSystem | Filesystem Usage | % | 1m | 사용한 디스크 공간 백분율 |
| FileSystem | Filesystem Usage [Avg] | % | 1m | 개별 filesystem.used.pct들의 평균 |
| FileSystem | Filesystem Usage [Inode] | % | 1m | inode 사용률 |
| FileSystem | Filesystem Usage [Max] | % | 1m | 개별 filesystem.used.pct 중에 max |
| FileSystem | Filesystem Usage [Min] | % | 1m | 개별 filesystem.used.pct 중에 min |
| FileSystem | Filesystem Usage [Total] | % | 1m | - |
| FileSystem | Filesystem Used | bytes | 1m | 사용한 디스크 공간 (bytes) |
| FileSystem | Filesystem Used [Inode] | bytes | 1m | inode 사용량 |
| Memory | Memory Free | bytes | 1m | 사용 가능한 총 메모리 양 (bytes). 시스템 캐시 및 버퍼에서 사용하는 메모리는 포함하지 않음 (system.memory.actual.free 참고). |
| Memory | Memory Free [Actual] | bytes | 1m | 실제 사용가능한 memory (bytes). OS 에 따라 계산방식이 다르며, Linux 에서는 /proc/ meminfo 에서 MemAvailable 이거나 meminfo 를 사용할 수 없는 경우에는 사용 가능한 메모리와 캐시 및 버퍼에서 계산함. OSX 에서는 사용가능한 메모리와 비활성 메모리의 합계. Windows 에서는 system.memory.free 와 같은 값. |
| Memory | Memory Free [Swap] | bytes | 1m | 사용가능한 swap memory. |
| Memory | Memory Total | bytes | 1m | 총 memory |
| Memory | Memory Total [Swap] | bytes | 1m | 총 swap memory. |
| Memory | Memory Usage | % | 1m | 사용한 memory의 백분율 |
| Memory | Memory Usage [Actual] | % | 1m | 실제 사용된 memory의 백분율 |
| Memory | Memory Usage [Cache Swap] | % | 1m | cache 된 swap 사용률 |
| Memory | Memory Usage [Swap] | % | 1m | 사용한 swap memory의 백분율 |
| Memory | Memory Used | bytes | 1m | 사용한 memory |
| Memory | Memory Used [Actual] | bytes | 1m | 실제 사용된 memory (bytes). 총 memory 에서 사용된 memory 를 뺀 값. 사용가능 메모리는 OS 마다 다르게 계산됨 (system.actual.free 참고) |
| Memory | Memory Used [Swap] | bytes | 1m | 사용한 swap memory. |
| Network | Collisions | cnt | 1m | 네트워크 충돌 |
| Network | Network In Bytes | bytes | 1m | 수신된 byte 수 |
| Network | Network In Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 평균 |
| Network | Network In Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최대 |
| Network | Network In Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최소 |
| Network | Network In Bytes [Delta Sum] | bytes | 1m | 개별 network 들의 system.network.in.bytes_delta의 합 |
| Network | Network In Bytes [Delta] | bytes | 1m | 수신된 byte 수의 delta |
| Network | Network In Dropped | cnt | 1m | 들어온 packet 중 삭제된 패킷의 수 |
| Network | Network In Errors | cnt | 1m | 수신 중의 error 수 |
| Network | Network In Packets | cnt | 1m | 수신된 packet 수 |
| Network | Network In Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 평균 |
| Network | Network In Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최대 |
| Network | Network In Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최소 |
| Network | Network In Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 합 |
| Network | Network In Packets [Delta] | cnt | 1m | 수신된 packet 수의 delta |
| Network | Network Out Bytes | bytes | 1m | 송신된 byte 수 |
| Network | Network Out Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 평균 |
| Network | Network Out Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최대 |
| Network | Network Out Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최소 |
| Network | Network Out Bytes [Delta Sum] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 합 |
| Network | Network Out Bytes [Delta] | bytes | 1m | 송신된 byte 수의 delta |
| Network | Network Out Dropped | cnt | 1m | 나가는 packet 중 삭제된 packet 수. 이 값은 운영체제에서 보고되지 않으므로 Darwin 과 BSD에서 항상 0 임. |
| Network | Network Out Errors | cnt | 1m | 송신 중의 error 수 |
| Network | Network Out Packets | cnt | 1m | 송신된 packet 수 |
| Network | Network Out Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 평균 |
| Network | Network Out Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최대 |
| Network | Network Out Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최소 |
| Network | Network Out Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 합 |
| Network | Network Out Packets [Delta] | cnt | 1m | 송신된 packet 수의 delta |
| Network | Open Connections [TCP] | cnt | 1m | 열려 있는 모든 TCP 연결 |
| Network | Open Connections [UDP] | cnt | 1m | 열려 있는 모든 UDP 연결 |
| Network | Port Usage | % | 1m | 접속가능한 port 사용률 |
| Network | SYN Sent Sockets | cnt | 1m | SYN_SENT 상태의 소켓 수 (로컬에서 원격 접속시) |
| Process | Kernel PID Max | cnt | 1m | kernel.pid_max 값 |
| Process | Kernel Thread Max | cnt | 1m | kernel.threads-max 값 |
| Process | Process CPU Usage | % | 1m | 마지막 업데이트 후 프로세스에서 소비한 CPU 시간의 백분율. 이 값은 Unix 시스템에서 top 명령으로 표시되는 프로세스의 %CPU 값과 유사. |
| Process | Process CPU Usage/Core | % | 1m | 마지막 이벤트 이후 프로세스에서 사용한 CPU 시간의 백분율. 코어 수로 정규화되며 0~100% 사이의 값. |
| Process | Process Memory Usage | % | 1m | main memory (RAM) 에서 프로세스가 차지하는 비율 |
| Process | Process Memory Used | bytes | 1m | Resident Set 사이즈. 프로세스가 RAM 에서 차지한 메모리 양. Windows 에서는 current working set 사이즈. |
| Process | Process PID | PID | 1m | 프로세스 pid |
| Process | Process PPID | PID | 1m | 부모 프로세스의 pid |
| Process | Processes [Dead] | cnt | 1m | dead processes 수 |
| Process | Processes [Idle] | cnt | 1m | idle processes 수 |
| Process | Processes [Running] | cnt | 1m | running processes 수 |
| Process | Processes [Sleeping] | cnt | 1m | sleeping processes 수 |
| Process | Processes [Stopped] | cnt | 1m | stopped processes 수 |
| Process | Processes [Total] | cnt | 1m | 총 processes 수 |
| Process | Processes [Unknown] | cnt | 1m | 상태를 검색할 수 없거나 알 수 없는 processes 수 |
| Process | Processes [Zombie] | cnt | 1m | 좀비 processes 수 |
| Process | Running Process Usage | % | 1m | process 사용률 |
| Process | Running Processes | cnt | 1m | running processes 수 |
| Process | Running Thread Usage | % | 1m | thread 사용률 |
| Process | Running Threads | cnt | 1m | running processes 에서 실행중인 thread 수 총합 |
| System | Context Switches | cnt | 1m | context switch 수 (초당) |
| System | Load/Core [1 min] | cnt | 1m | 마지막 1 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [15 min] | cnt | 1m | 마지막 15 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [5 min] | cnt | 1m | 마지막 5 분 동안의 로드를 코어 수로 나눈 값 |
| System | Multipaths [Active] | cnt | 1m | 외장 스토리지 연결 path state = active 카운트 |
| System | Multipaths [Failed] | cnt | 1m | 외장 스토리지 연결 path state = failed 카운트 |
| System | Multipaths [Faulty] | cnt | 1m | 외장 스토리지 연결 path state = faulty 카운트 |
| System | NTP Offset | num | 1m | last sample의 measured offset (NTP 서버와 로컬환경 간의 시간 차이) |
| System | Run Queue Length | num | 1m | 실행 대기열 길이 |
| System | Uptime | ms | 1m | OS 가동시간(uptime). (milliseconds) |
| Windows | Context Switchies | cnt | 1m | CPU context switch 수 (초당) |
| Windows | Disk Read Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 읽어들인 바이트 수 |
| Windows | Disk Read Time [Avg] | sec | 1m | 데이터 읽기 평균 시간 (초) |
| Windows | Disk Transfer Time [Avg] | sec | 1m | 디스크 average wait time |
| Windows | Disk Usage | % | 1m | 디스크 사용률 |
| Windows | Disk Write Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 쓰여진 바이트 수 |
| Windows | Disk Write Time [Avg] | sec | 1m | 데이터 쓰기 평균 시간 (초) |
| Windows | Pagingfile Usage | % | 1m | paging file 사용률 |
| Windows | Pool Used [Non Paged] | bytes | 1m | 커널 메모리 중 Nonpaged Pool 사용량 |
| Windows | Pool Used [Paged] | bytes | 1m | 커널 메모리 중 Paged Pool 사용량 |
| Windows | Process [Running] | cnt | 1m | 현재 동작 중인 프로세스 수 |
| Windows | Threads [Running] | cnt | 1m | 현재 동작 중인 thread 수 |
| Windows | Threads [Waiting] | cnt | 1m | 프로세서 시간을 기다리는 thread 수 |
Bare Metal Server
Agent (상세 메트릭)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| CPU | Core Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기) |
| CPU | Core Usage [System] | % | 1m | 커널 공간에서 소요된 CPU 시간의 비율 |
| CPU | Core Usage [User] | % | 1m | 사용자 공간에서 소요된 CPU 시간의 비율 |
| CPU | CPU Cores | cnt | 1m | 호스트에 있는 CPU 코어의 수입니다. 정규화되지 않은 비율의 최대 값은 코어의 100%*입니다. 정규화되지 않은 비율에는 이 값이 이미 반영되어 있으며 최대 값은 코어의 100%*입니다. |
| CPU | CPU Usage [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 4개 모두를 100%사용하는 경우: 400%) |
| CPU | CPU Usage [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 4개 모두를 100% 사용하는 경우 400%) |
| CPU | CPU Usage/Core [Active] | % | 1m | Idle 및 IOWait 상태 이외에 사용된 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [Idle] | % | 1m | 유휴 상태로 소요된 CPU 시간의 비율입니다. |
| CPU | CPU Usage/Core [IO Wait] | % | 1m | 대기 상태로 소요된 CPU 시간의 비율(디스크 대기)입니다. |
| CPU | CPU Usage/Core [System] | % | 1m | 커널에서 사용한 CPU 시간의 백분율 (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| CPU | CPU Usage/Core [User] | % | 1m | 사용자 영역에서 사용한 CPU 시간의 백분율. (core 수로 정규화된 값, core 4개 모두를 100% 사용하는 경우 100%) |
| Disk | Disk CPU Usage [IO Request] | % | 1m | 장치에 대한 입출력 요청이 실행된 CPU 시간의 비율입니다(장치의 대역폭 활용도). 이 값이 100%에 가까우면 장치 포화 상태가 됩니다. |
| Disk | Disk Queue Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 대기열 길이입니다. |
| Disk | Disk Read Bytes | bytes | 1m | 장치에서 읽는 초당 바이트 수입니다. |
| Disk | Disk Read Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 평균 |
| Disk | Disk Read Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최대 |
| Disk | Disk Read Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 최소 |
| Disk | Disk Read Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.read.bytes_delta의 합 |
| Disk | Disk Read Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.read.bytes 값의 delta |
| Disk | Disk Read Bytes [Success] | bytes | 1m | 성공적으로 읽은 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 읽어들인 섹터 수에 512를 곱한 값 |
| Disk | Disk Read Requests | cnt | 1m | 1초동안 디스크 디바이스의 읽기 요청 수 |
| Disk | Disk Read Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 평균 |
| Disk | Disk Read Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최대 |
| Disk | Disk Read Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 최소 |
| Disk | Disk Read Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.read.count_delta의 합 |
| Disk | Disk Read Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.read.count 의 delta |
| Disk | Disk Read Requests [Success] | cnt | 1m | 성공적으로 완료된 총 읽기 수 |
| Disk | Disk Request Size [Avg] | num | 1m | 장치에 대해 실행된 요청의 평균 크기(단위: 섹터)입니다. |
| Disk | Disk Service Time [Avg] | ms | 1m | 장치에 대해 실행된 입력 요청의 평균 서비스 시간(밀리초)입니다. |
| Disk | Disk Wait Time [Avg] | ms | 1m | 지원할 장치에 대해 실행된 요청에 소요된 평균 시간입니다. |
| Disk | Disk Wait Time [Read] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Wait Time [Write] | ms | 1m | 디스크 평균 대기 시간 |
| Disk | Disk Write Bytes [Delta Avg] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 평균 |
| Disk | Disk Write Bytes [Delta Max] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최대 |
| Disk | Disk Write Bytes [Delta Min] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 최소 |
| Disk | Disk Write Bytes [Delta Sum] | bytes | 1m | 개별 disk들의 system.diskio.write.bytes_delta의 합 |
| Disk | Disk Write Bytes [Delta] | bytes | 1m | 개별 disk의 system.diskio.write.bytes 값의 delta |
| Disk | Disk Write Bytes [Success] | bytes | 1m | 성공적으로 쓰여진 총 바이트 수. Linux에서는 섹터 크기를 512로 가정하고, 쓰여진 섹터 수에 512를 곱한 값 |
| Disk | Disk Write Requests | cnt | 1m | 1초동안 디스크 디바이스의 쓰기 요청 수 |
| Disk | Disk Write Requests [Delta Avg] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 평균 |
| Disk | Disk Write Requests [Delta Max] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최대 |
| Disk | Disk Write Requests [Delta Min] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 최소 |
| Disk | Disk Write Requests [Delta Sum] | cnt | 1m | 개별 disk들의 system.diskio.write.count_delta의 합 |
| Disk | Disk Write Requests [Success Delta] | cnt | 1m | 개별 disk의 system.diskio.write.count 의 delta |
| Disk | Disk Write Requests [Success] | cnt | 1m | 성공적으로 완료된 총 쓰기 수 |
| Disk | Disk Writes Bytes | bytes | 1m | 장치에 쓰는 초당 바이트 수입니다. |
| FileSystem | Filesystem Hang Check | state | 1m | filesystem(local/NFS) hang 체크 (정상:1, 비정상:0) |
| FileSystem | Filesystem Nodes | cnt | 1m | 파일 시스템의 총 파일 노드 수입니다. |
| FileSystem | Filesystem Nodes [Free] | cnt | 1m | 파일 시스템의 총 가용 파일 노드 수입니다. |
| FileSystem | Filesystem Size [Available] | bytes | 1m | 권한 없는 사용자가 사용할 수 있는 디스크 공간(바이트)입니다. |
| FileSystem | Filesystem Size [Free] | bytes | 1m | 사용 가능한 디스크 공간 (bytes) |
| FileSystem | Filesystem Size [Total] | bytes | 1m | 총 디스크 공간 (bytes) |
| FileSystem | Filesystem Usage | % | 1m | 사용한 디스크 공간 백분율 |
| FileSystem | Filesystem Usage [Avg] | % | 1m | 개별 filesystem.used.pct들의 평균 |
| FileSystem | Filesystem Usage [Inode] | % | 1m | inode 사용률 |
| FileSystem | Filesystem Usage [Max] | % | 1m | 개별 filesystem.used.pct 중에 max |
| FileSystem | Filesystem Usage [Min] | % | 1m | 개별 filesystem.used.pct 중에 min |
| FileSystem | Filesystem Usage [Total] | % | 1m | - |
| FileSystem | Filesystem Used | bytes | 1m | 사용한 디스크 공간 (bytes) |
| FileSystem | Filesystem Used [Inode] | bytes | 1m | inode 사용량 |
| Memory | Memory Free | bytes | 1m | 사용 가능한 총 메모리 양 (bytes). 시스템 캐시 및 버퍼에서 사용하는 메모리는 포함하지 않음 (system.memory.actual.free 참고). |
| Memory | Memory Free [Actual] | bytes | 1m | 실제 사용가능한 memory (bytes). OS 에 따라 계산방식이 다르며, Linux 에서는 /proc/ meminfo 에서 MemAvailable 이거나 meminfo 를 사용할 수 없는 경우에는 사용 가능한 메모리와 캐시 및 버퍼에서 계산함. OSX 에서는 사용가능한 메모리와 비활성 메모리의 합계. Windows 에서는 system.memory.free 와 같은 값. |
| Memory | Memory Free [Swap] | bytes | 1m | 사용가능한 swap memory. |
| Memory | Memory Total | bytes | 1m | 총 memory |
| Memory | Memory Total [Swap] | bytes | 1m | 총 swap memory. |
| Memory | Memory Usage | % | 1m | 사용한 memory의 백분율 |
| Memory | Memory Usage [Actual] | % | 1m | 실제 사용된 memory의 백분율 |
| Memory | Memory Usage [Cache Swap] | % | 1m | cache 된 swap 사용률 |
| Memory | Memory Usage [Swap] | % | 1m | 사용한 swap memory의 백분율 |
| Memory | Memory Used | bytes | 1m | 사용한 memory |
| Memory | Memory Used [Actual] | bytes | 1m | 실제 사용된 memory (bytes). 총 memory 에서 사용된 memory 를 뺀 값. 사용가능 메모리는 OS 마다 다르게 계산됨 (system.actual.free 참고) |
| Memory | Memory Used [Swap] | bytes | 1m | 사용한 swap memory. |
| Network | Collisions | cnt | 1m | 네트워크 충돌 |
| Network | Network In Bytes | bytes | 1m | 수신된 byte 수 |
| Network | Network In Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 평균 |
| Network | Network In Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최대 |
| Network | Network In Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.in.bytes_delta의 최소 |
| Network | Network In Bytes [Delta Sum] | bytes | 1m | 개별 network 들의 system.network.in.bytes_delta의 합 |
| Network | Network In Bytes [Delta] | bytes | 1m | 수신된 byte 수의 delta |
| Network | Network In Dropped | cnt | 1m | 들어온 packet 중 삭제된 패킷의 수 |
| Network | Network In Errors | cnt | 1m | 수신 중의 error 수 |
| Network | Network In Packets | cnt | 1m | 수신된 packet 수 |
| Network | Network In Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 평균 |
| Network | Network In Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최대 |
| Network | Network In Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 최소 |
| Network | Network In Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.in.packets_delta의 합 |
| Network | Network In Packets [Delta] | cnt | 1m | 수신된 packet 수의 delta |
| Network | Network Out Bytes | bytes | 1m | 송신된 byte 수 |
| Network | Network Out Bytes [Delta Avg] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 평균 |
| Network | Network Out Bytes [Delta Max] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최대 |
| Network | Network Out Bytes [Delta Min] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 최소 |
| Network | Network Out Bytes [Delta Sum] | bytes | 1m | 개별 network들의 system.network.out.bytes_delta의 합 |
| Network | Network Out Bytes [Delta] | bytes | 1m | 송신된 byte 수의 delta |
| Network | Network Out Dropped | cnt | 1m | 나가는 packet 중 삭제된 packet 수. 이 값은 운영체제에서 보고되지 않으므로 Darwin 과 BSD에서 항상 0 임. |
| Network | Network Out Errors | cnt | 1m | 송신 중의 error 수 |
| Network | Network Out Packets | cnt | 1m | 송신된 packet 수 |
| Network | Network Out Packets [Delta Avg] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 평균 |
| Network | Network Out Packets [Delta Max] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최대 |
| Network | Network Out Packets [Delta Min] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 최소 |
| Network | Network Out Packets [Delta Sum] | cnt | 1m | 개별 network들의 system.network.out.packets_delta의 합 |
| Network | Network Out Packets [Delta] | cnt | 1m | 송신된 packet 수의 delta |
| Network | Open Connections [TCP] | cnt | 1m | 열려 있는 모든 TCP 연결 |
| Network | Open Connections [UDP] | cnt | 1m | 열려 있는 모든 UDP 연결 |
| Network | Port Usage | % | 1m | 접속가능한 port 사용률 |
| Network | SYN Sent Sockets | cnt | 1m | SYN_SENT 상태의 소켓 수 (로컬에서 원격 접속시) |
| Process | Kernel PID Max | cnt | 1m | kernel.pid_max 값 |
| Process | Kernel Thread Max | cnt | 1m | kernel.threads-max 값 |
| Process | Process CPU Usage | % | 1m | 마지막 업데이트 후 프로세스에서 소비한 CPU 시간의 백분율. 이 값은 Unix 시스템에서 top 명령으로 표시되는 프로세스의 %CPU 값과 유사. |
| Process | Process CPU Usage/Core | % | 1m | 마지막 이벤트 이후 프로세스에서 사용한 CPU 시간의 백분율. 코어 수로 정규화되며 0~100% 사이의 값. |
| Process | Process Memory Usage | % | 1m | main memory (RAM) 에서 프로세스가 차지하는 비율 |
| Process | Process Memory Used | bytes | 1m | Resident Set 사이즈. 프로세스가 RAM 에서 차지한 메모리 양. Windows 에서는 current working set 사이즈. |
| Process | Process PID | PID | 1m | 프로세스 pid |
| Process | Process PPID | PID | 1m | 부모 프로세스의 pid |
| Process | Processes [Dead] | cnt | 1m | dead processes 수 |
| Process | Processes [Idle] | cnt | 1m | idle processes 수 |
| Process | Processes [Running] | cnt | 1m | running processes 수 |
| Process | Processes [Sleeping] | cnt | 1m | sleeping processes 수 |
| Process | Processes [Stopped] | cnt | 1m | stopped processes 수 |
| Process | Processes [Total] | cnt | 1m | 총 processes 수 |
| Process | Processes [Unknown] | cnt | 1m | 상태를 검색할 수 없거나 알 수 없는 processes 수 |
| Process | Processes [Zombie] | cnt | 1m | 좀비 processes 수 |
| Process | Running Process Usage | % | 1m | process 사용률 |
| Process | Running Processes | cnt | 1m | running processes 수 |
| Process | Running Thread Usage | % | 1m | thread 사용률 |
| Process | Running Threads | cnt | 1m | running processes 에서 실행중인 thread 수 총합 |
| System | Context Switches | cnt | 1m | context switch 수 (초당) |
| System | Load/Core [1 min] | cnt | 1m | 마지막 1 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [15 min] | cnt | 1m | 마지막 15 분 동안의 로드를 코어 수로 나눈 값 |
| System | Load/Core [5 min] | cnt | 1m | 마지막 5 분 동안의 로드를 코어 수로 나눈 값 |
| System | Multipaths [Active] | cnt | 1m | 외장 스토리지 연결 path state = active 카운트 |
| System | Multipaths [Failed] | cnt | 1m | 외장 스토리지 연결 path state = failed 카운트 |
| System | Multipaths [Faulty] | cnt | 1m | 외장 스토리지 연결 path state = faulty 카운트 |
| System | NTP Offset | num | 1m | last sample의 measured offset (NTP 서버와 로컬환경 간의 시간 차이) |
| System | Run Queue Length | num | 1m | 실행 대기열 길이 |
| System | Uptime | ms | 1m | OS 가동시간(uptime). (milliseconds) |
| Windows | Context Switchies | cnt | 1m | CPU context switch 수 (초당) |
| Windows | Disk Read Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 읽어들인 바이트 수 |
| Windows | Disk Read Time [Avg] | sec | 1m | 데이터 읽기 평균 시간 (초) |
| Windows | Disk Transfer Time [Avg] | sec | 1m | 디스크 average wait time |
| Windows | Disk Usage | % | 1m | 디스크 사용률 |
| Windows | Disk Write Bytes [Sec] | cnt | 1m | windows logical 디스크에서 1초동안 쓰여진 바이트 수 |
| Windows | Disk Write Time [Avg] | sec | 1m | 데이터 쓰기 평균 시간 (초) |
| Windows | Pagingfile Usage | % | 1m | paging file 사용률 |
| Windows | Pool Used [Non Paged] | bytes | 1m | 커널 메모리 중 Nonpaged Pool 사용량 |
| Windows | Pool Used [Paged] | bytes | 1m | 커널 메모리 중 Paged Pool 사용량 |
| Windows | Process [Running] | cnt | 1m | 현재 동작 중인 프로세스 수 |
| Windows | Threads [Running] | cnt | 1m | 현재 동작 중인 thread 수 |
| Windows | Threads [Waiting] | cnt | 1m | 프로세서 시간을 기다리는 thread 수 |
Multi-node GPU Cluster [Cluster Fabric]
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Cluster GPU | Cluster GPU Count | cnt | 1m | 클러스터 내 GPU Count Sum. 클러스터 내 노드 GPU Count의 Sum 값: 같은 GPU 클러스터 내 노드끼리 각 노드의 GPU Count의 합계 계산 |
| Cluster GPU | Cluster GPU Count In Use | cnt | 1m | 클러스터 내 Job이 수행 중인 GPU 수 클러스터 내 Process에서 사용 중인 GPU 수: 같은 GPU 클러스터 내 노드들의 nvidia-smi 결과의 하단 ‘Processes:’ 정보를 파싱하여 프로세스가 물고 있는 GPU 갯수 합계 |
| Cluster GPU | Cluster GPU Usage | % | 1m | 클러스터 내 GPU Utilization Average. 클러스터 내 노드 GPU Utilization Average 값 : 같은 GPU 클러스터 내 노드끼리 각 노드의 GPU Utilization값 평균 계산 |
| Cluster GPU | Cluster GPU Memory Usage [Avg] | % | 1m | 송클러스터 내 GPU Memory Utilization Average. 클러스터 내 노드 Memory Utilization Average 값 : 같은 GPU 클러스터 내 노드끼리 각 노드의 Memory Utilization 값 평균 계산 |
Multi-node GPU Cluster [Node]
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| GPU | GPU Count | cnt | 1m | GPU 개수 |
| GPU | GPU Memory Usage | % | 1m | 메모리 사용율 |
| GPU | GPU Memory Used | MB | 1m | 메모리 사용량 |
| GPU | GPU Temperature | ℃ | 1m | GPU 온도 |
| GPU | GPU Usage | % | 1m | Utilization |
| GPU | GPU Usage [Avg] | % | 1m | GPU 전체 평균 사용율(%) |
| GPU | GPU Power Cap | W | 1m | GPU의 최대 전력 용량 |
| GPU | GPU Power Usage | W | 1m | GPU의 현재 전력 사용량 |
| GPU | GPU Memory Usage [Avg] | % | 1m | GPU Memory Utilization Average |
| GPU | GPU Count in use | cnt | 1m | 노드 내 Job이 수행 중인 GPU 수 |
| GPU | Execution State for nvidia-smi | state | 1m | nvidia-smi 명령어 실행결과 |
Storage 유형
File Storage
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Volume | Instance State | state | 1m | filestorage 볼륨 상태 |
| Volume | IOPS [Other] | iops | 1m | iops(기타) |
| Volume | IOPS [Read] | iops | 1m | iops(읽기) |
| Volume | IOPS [Total] | iops | 1m | iops(합계) |
| Volume | IOPS [Write] | iops | 1m | iops(쓰기) |
| Volume | Latency Time [Other] | usec | 1m | 지연 시간(기타) |
| Volume | Latency Time [Read] | usec | 1m | 지연 시간(읽기) |
| Volume | Latency Time [Total] | usec | 1m | 지연 시간(합계) |
| Volume | Latency Time [write] | usec | 1m | 지연 시간(쓰기) |
| Volume | Throughput [Other] | bytes/s | 1m | 처리량(기타) |
| Volume | Throughput [Read] | bytes/s | 1m | 처리량(읽기) |
| Volume | Throughput [Total] | bytes/s | 1m | 처리량(합계) |
| Volume | Throughput [Write] | bytes/s | 1m | 처리량(쓰기) |
| Volume | Volume Total | bytes | 1m | 총 바이트 수 |
| Volume | Volume Usage | % | 1m | 사용률 |
| Volume | Volume Used | bytes | 1m | 사용량 |
Object Storage
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Request | Requests [Delete] | cnt | 1m | bucket 내 객체들에 대해 실행된 HTTP DELETE 요청 횟수 |
| Request | Requests [Download Avg] | bytes | 1m | 버킷별 Download 사용량 |
| Request | Requests [Get] | cnt | 1m | bucket 내 객체들에 대해 실행된 HTTP GET 요청 횟수 |
| Request | Requests [Head] | cnt | 1m | bucket 내 객체들에 대해 실행된 HTTP HEAD 요청 횟수 |
| Request | Requests [List] | cnt | 1m | bucket 내 객체들에 대해 실행된 LIST 요청 횟수 |
| Request | Requests [Post] | cnt | 1m | bucket 내 객체들에 대해 실행된 HTTP POST 요청 횟수 |
| Request | Requests [Put] | cnt | 1m | bucket 내 객체들에 대해 실행된 HTTP PUT 요청 횟수 |
| Request | Requests [Total] | cnt | 1m | bucket 에 실행된 HTTP 요청 총 횟수 |
| Request | Requests [Upload Avg] | bytes | 1m | 버킷별 Upload 사용량 |
| Usage | Bucket Used | bytes | 1m | bucket 내 저장된 데이터 양 (bytes) |
| Usage | Objects | cnt | 1m | bucket 내 저장된 오브젝트 수 |
Block Storage(BM)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State | state | 1m | Blockstorage 볼륨 상태 |
| Volume | IOPS [Total] | iops | 1m | iops(합계) |
| Volume | IOPS [Read] | iops | 1m | iops(읽기) |
| Volume | IOPS [Write] | iops | 1m | iops(쓰기) |
| Volume | IOPS [Other] | iops | 1m | iops(기타) |
| Volume | Latency Time [Total] | usec | 1m | 지연 시간(합계) |
| Volume | Latency Time [Read] | usec | 1m | 지연 시간(읽기) |
| Volume | Latency Time [Write] | usec | 1m | 지연 시간(쓰기) |
| Volume | Latency Time [Other] | usec | 1m | 지연 시간(기타) |
| Volume | Throughput [Total] | MB/s | 1m | 처리량(합계) |
| Volume | Throughput [Read] | MB/s | 1m | 처리량(읽기) |
| Volume | Throughput [Write] | MB/s | 1m | 처리량(쓰기) |
| Volume | Throughput [Other] | MB/s | 1m | 처리량(기타) |
| Volume | Volume Bytes | bytes | 1m | 총 바이트 수 |
Block Storage(VM)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State | state | 1m | Blockstorage 볼륨 상태 |
| Volume | IOPS [Read] | iops | 1m | iops(읽기) |
| Volume | IOPS [Write] | iops | 1m | iops(쓰기) |
| Volume | Latency Time [Read] | usec | 1m | 지연 시간(읽기) |
| Volume | Latency Time [Write] | usec | 1m | 지연 시간(쓰기) |
| Volume | Throughput [Read] | MB/s | 1m | 처리량(읽기) |
| Volume | Throughput [Write] | MB/s | 1m | 처리량(쓰기) |
| Volume | Volume Bytes | bytes | 1m | 총 바이트 수 |
Database 유형
PostgreSQL(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Activelock | Active Locks | cnt | 1m | activelock 수 |
| Activelock | Active Locks [Access Exclusive] | cnt | 1m | accessexclusive lock 수 |
| Activelock | Active Locks [Access Share] | cnt | 1m | accessshare lock 수 |
| Activelock | Active Locks [Total] | cnt | 1m | - |
| Activelock | Exclusive Locks | cnt | 1m | exclusive lock 수 |
| Activelock | Row Exclusive Locks | cnt | 1m | row exclusive lock 수 |
| Activelock | Row Share Locks | cnt | 1m | row share lock 수 |
| Activelock | Share Locks | cnt | 1m | share lock 수 |
| Activelock | Share Row Exclusive Locks | cnt | 1m | sharerowexclusive lock 수 |
| Activelock | Share Update Exclusive Locks | cnt | 1m | share update exclusive lock 수 |
| ActiveSession | Active Sessions | cnt | 1m | active 상태인 session 수 |
| ActiveSession | Active Sessions [Total] | cnt | 1m | - |
| ActiveSession | Idle In Transaction Sessions | cnt | 1m | idle_in_transaction 상태인 session 수 |
| ActiveSession | Idle In Transaction Sessions [Total] | cnt | 1m | - |
| ActiveSession | Idle Sessions | cnt | 1m | idle 상태인 session 수 |
| ActiveSession | Idle Sessions [Total] | cnt | 1m | - |
| ActiveSession | Waiting Sessions | cnt | 1m | waiting 상태인 session 수 |
| ActiveSession | Waiting Sessions [Total] | cnt | 1m | - |
| Connection | Connection Usage | % | 1m | - |
| Connection | Connection Usage [Total] | % | 1m | DB 접속 수 사용률 (%) |
| DB Age | DB Age Max | age | 1m | database age (frozen XID) 값 |
| Lock | Wait Locks | cnt | 1m | 잠금 대기 세션 개수(DB별) |
| Lock | Wait Locks [Long Total] | cnt | 1m | 장시간(300초) Lock waiting 세션 개수 |
| Lock | Wait Locks [Long] | cnt | 1m | - |
| Lock | Wait Locks [Total] | cnt | 1m | Lock 발생으로 대기하는 세션수 |
| Long Transaction | Transaction Time Max [Long] | sec | 1m | - |
| Long Transaction | Transaction Time Max Total [Long] | sec | 1m | 장시간 수행중인 트랜잭션 시간(분) |
| Replica | Apply Lag Time | sec | 1m | apply_lag 시간 |
| Replica | Check No Replication | cnt | 1m | check_no_replication 값 |
| Replica | Check Replication | state | 1m | check_replication_state 값 |
| Slowquery | Slowqueries | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 |
| State | Instance State [PID] | PID | 1m | postgres 프로세스 pid |
| Tablespace | Tablespace Used | bytes | 1m | Tablespace 크기 |
| Tablespace | Tablespace Used [Total] | bytes | 1m | - |
| Tablespace | Tablespace Used Bytes [MB] | bytes | 1m | filesystem directory 사용량 (MB) |
| Tablespace | Tablespaces [Total] | cnt | 1m | - |
MariaDB(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Activelock | Active Locks | cnt | 1m | activelock 수 |
| Activesssion | Active Sessions | cnt | 1m | activesession 수 |
| Activesssion | Connection Usage [Total] | % | 1m | DB 접속 세션 사용률 |
| Activesssion | Connections | cnt | 1m | connection 수 |
| Activesssion | Connections [MAX] | cnt | 1m | max connected threads 수 |
| Datafile | Binary Log Used [MB] | bytes | 1m | binary log 사용량(MB) |
| Datafile | Data Directory Used [MB] | bytes | 1m | datadir 사용량(MB) |
| Datafile | Open Files | cnt | 1m | open 상태인 DB 파일 개수 |
| Datafile | Open Files [MAX] | cnt | 1m | open 가능한 DB 파일 수 |
| Datafile | Open Files Usage | % | 1m | DB 파일 최대 개수 사용률 |
| Datafile | Relay Log Used [MB] | bytes | 1m | relay log 사용량(MB) |
| State | Instance State [PID] | PID | 1m | mariadbd 프로세스 pid mysqld 프로세스 pid(v10.5.2 이전 버전) |
| State | Safe PID | PID | 1m | mariadbd_safe 프로세스 pid mysqld_safe 프로세스 pid(v10.5.2 이전 버전) |
| State | Slave Behind Master seconds | sec | 1m | Master와 Slave의 Data 시간 차 (slave 에서만 실행) |
| Tablespace | Tablespace Used | bytes | 1m | Tablespace 사용량 |
| Tablespace | Tablespace Used [Total] | bytes | 1m | - |
| Transaction | Running Threads | cnt | 1m | running thread 수 |
| Transaction | Slowqueries | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 (DB별) |
| Transaction | Slowqueries [Total] | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 (전체) |
| Transaction | Transaction Time [Long] | sec | 1m | 트랜잭션 최장 수행시간 (초) |
| Transaction | Wait Locks | cnt | 1m | lock 으로 60초 이상 blocked 된 세션 수 |
MySQL(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Activelock | Active Locks | cnt | 1m | activelock 수 |
| Activesssion | Active Sessions | cnt | 1m | connected threads 수 |
| Activesssion | Connection Usage [Total] | % | 1m | DB 접속 세션 사용률 |
| Activesssion | Connections | cnt | 1m | connection 수 |
| Activesssion | Connections [MAX] | cnt | 1m | max connected threads 수 |
| Datafile | Binary Log Used [MB] | bytes | 1m | binary log 사용량(MB) |
| Datafile | Data Directory Used [MB] | bytes | 1m | datadir 사용량(MB) |
| Datafile | Open Files | cnt | 1m | open 상태인 DB 파일 개수 |
| Datafile | Open Files [MAX] | cnt | 1m | open 가능한 DB 파일 수 |
| Datafile | Open Files Usage | % | 1m | DB 파일 최대 개수 사용률 |
| Datafile | Relay Log Used [MB] | bytes | 1m | relay log 사용량(MB) |
| State | Instance State [PID] | PID | 1m | mysqld 프로세스 pid |
| State | Safe PID | PID | 1m | safe 프로그램 pid |
| State | Slave Behind Master seconds | sec | 1m | master 노드와의 시간 차이 (sec) |
| Tablespace | Tablespace Used | bytes | 1m | Tablespace 사용량 |
| Tablespace | Tablespace Used [Total] | bytes | 1m | Tablespace 사용량 (total) |
| Transaction | Running Threads | cnt | 1m | running thread 수 |
| Transaction | Slowqueries | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 (DB별) |
| Transaction | Slowqueries [Total] | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 (전체) |
| Transaction | Transaction Time [Long] | sec | 1m | 트랜잭션 최장 수행시간 (초) |
| Transaction | Wait Locks | cnt | 1m | lock 으로 60초 이상 blocked 된 세션 수 |
Microsoft SQL Server(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Activelock | Active Locks | cnt | 1m | activelock 수 |
| Activesssion | Active Sessions | cnt | 1m | activesession 수 |
| Activetransaction | Active Transactions [Total] | cnt | 1m | 활성화된 트랜잭션 수 |
| Connection | Connected Users | cnt | 1m | 시스템에 접속한 유저의 수 |
| Datafile | Datavolume Size [Free] | bytes | 1m | 사용가능 공간 |
| Datafile | DBFiles [Not Online] | cnt | 1m | 데이터파일이 모두 ONLINE 상태인지 Query 수행 |
| Datafile | Tablespace Used | bytes | 1m | 데이터볼륨 사이즈 |
| Lock | Lock Processes [Blocked] | cnt | 1m | 다른 프로세스에 의해 차단된 SQL 프로세스 개수 |
| Lock | Lock Waits [Per Second] | cnt | 1m | Lock이 걸리는 초당 대기횟수 |
| Slowquery | Blocking Session ID | ID | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 |
| Slowquery | Slowqueries | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 |
| Slowquery | Slowquery CPU Time | ms | 1m | 장시간(5분 이상) 수행 중인 SQL의 실행에 소요 된 CPU 시간 |
| Slowquery | Slowquery Execute Context ID | ID | 1m | 장시간(5분 이상) 수행 중인 SQL의 실행 Task와 연결 된 컨텍스트 ID |
| Slowquery | Slowquery Memory Usage | bytes | 1m | 장시간(5분 이상) 수행 중인 SQL의 실행에 소요 된 메모리 사용량 |
| Slowquery | Slowquery Session ID | ID | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리의 세션 ID |
| Slowquery | Slowquery Wait Duration Time | ms | 1m | 대기 유형에 소요된 총 대기 시간 |
| State | Instance State [Cluster] | state | 1m | MSSQL 클러스터 구성 시 상태 |
| State | Instance State [PID] | PID | 1m | sqlservr.exe 프로세스 pid |
| State | Page IO Latch Wait Time | ms | 1m | Page IO latch waits 평균 대기시간 |
| Transaction | Transaction Time [MAX] | cnt | 1m | 장기 실행(5분 이상) 트랜잭션 |
EPAS(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Activelock | Access Exclusive Locks | cnt | 1m | accessexclusive lock 수 |
| Activelock | Access Share Locks | cnt | 1m | accessshare lock 수 |
| Activelock | Active Locks | cnt | 1m | activelock 수 |
| Activelock | Active Locks [Total] | cnt | 1m | activelock 수 (total) |
| Activelock | Exclusive Locks | cnt | 1m | exclusive lock 수 |
| Activelock | Row Exclusive Locks | cnt | 1m | row exclusive lock 수 |
| Activelock | Row Share Locks | cnt | 1m | row share lock 수 |
| Activelock | Share Locks | cnt | 1m | share lock 수 |
| Activelock | Share Row Exclusive Locks | cnt | 1m | share row exclusive lock 수 |
| Activelock | Share Update Exclusive Locks | cnt | 1m | share update exclusive lock 수 |
| Activesession | Active Sessions | cnt | 1m | active 상태인 session 수 |
| Activesession | Active Sessions [Total] | cnt | 1m | active 상태인 전체 session 수 |
| Activesession | Idel In Transaction Sessions | cnt | 1m | idle_in_transaction 상태인 session 수 |
| Activesession | Idle In Transaction Sessions [Total] | cnt | 1m | idle_in_transaction 상태인 총 session 수 |
| Activesession | Idle Sessions | cnt | 1m | idle 상태인 session 수 |
| Activesession | Idle Sessions [Total] | cnt | 1m | idle 상태인 총 session 수 |
| Activesession | Waiting Sessions | cnt | 1m | waiting 상태인 session 수 |
| Activesession | Waiting Sessions [Total] | cnt | 1m | waiting 상태인 총 session 수 |
| Connection | Connection Usage | % | 1m | DB 접속 수 사용률 (%) |
| Connection | Connection Usage [Total] | % | 1m | DB 접속 수 전체 사용률 (%) |
| Connection | Connection Usage Per DB | % | 1m | DB별 DB 접속 수 사용률 (%) |
| DB Age | DB Age Max | age | 1m | database age (frozen XID) 값 |
| Lock | Wait Locks | cnt | 1m | 장시간(300초) Lock waiting 세션 개수 |
| Lock | Wait Locks [Long Total] | cnt | 1m | 장시간(300초) Lock waiting 세션 총 개수 |
| Lock | Wait Locks [Long] | cnt | 1m | Lock 발생으로 대기하는 세션 수 |
| Lock | Wait Locks [Total] | cnt | 1m | Lock 발생으로 대기하는 총 세션 수 |
| Lock | Wait Locks Per DB [Total] | cnt | 1m | DB별 Lock 발생으로 대기하는 총 세션 수 |
| Long Transaction | Transaction Time Max [Long] | sec | 1m | 장시간 수행중인 트랜잭션 시간(분) |
| Long Transaction | Transaction Time Max Total [Long] | sec | 1m | 장시간 수행중인 트랜잭션 시간(분) |
| Replica | Apply Lag Time | sec | 1m | apply_lag 시간 |
| Replica | Check No Replication | cnt | 1m | check_no_replication 값 |
| Replica | Check Replication | state | 1m | check_replication_state 값 |
| Slowquery | Slowqueries | cnt | 1m | 장시간(5분 이상) 수행 중인 SQL 쿼리 수 |
| State | Instance state [PID] | PID | 1m | edb-postgres 프로세스 pid |
| Tablespace | Tablespace Used Bytes [MB] | bytes | 1m | filesystem directory 사용량 (MB) |
| Tablespace | Tablespaces [Total] | cnt | 1m | 전체 Tablespace 크기 |
| Tablespace | Tablespace Used | bytes | 1m | 사용 중인 Tablespace 크기 |
| Tablespace | Tablespace Used [Total] | bytes | 1m | 사용 중인 Tablespace 전체 크기 |
CacheStore(DBaaS)
Redis
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Stats | Active Defragmentation Keys [Hits] | cnt | 1m | 단편화 제거된 키의 수 |
| Stats | Active Defragmentation Keys [Miss] | cnt | 1m | 활성 단편화 제거 프로세스에서 건너뛴 키의 수 |
| Stats | Active Defragmentationd [Hits] | cnt | 1m | 활성 단편화 제거 프로세스로 수행된 값 재할당의 수 |
| Stats | Active Defragmentations [Miss] | cnt | 1m | 활성 단편화 제거 프로세스로 시작되어 중단된 값 재할당의 수 |
| Memory | Allocated Bytes [OS] | bytes | 1m | Redis가 할당하고 운영 체제에 인식되는 바이트 수 (상주 세트 크기) |
| Memory | Allocated Bytes [Redis] | bytes | 1m | Redis가 할당한 총 바이트 수 |
| Persistence | AOF Buffer Size | bytes | 1m | AOF 버퍼 크기 |
| Persistence | AOF File Size [Current] | bytes | 1m | AOF 현재 파일 크기 |
| Persistence | AOF File Size [Lastest Startup] | bytes | 1m | 최근 시작 또는 다시쓰기에서 AOF 파일 크기 |
| Persistence | AOF Rewrite Buffer Size | bytes | 1m | AOF 다시쓰기 버퍼의 크기 |
| Persistence | AOF Rewrite Current Time | sec | 1m | 해당하는 경우 진행 중인 AOF 다시쓰기 작업 시간 |
| Persistence | AOF Rewrite Last Time | sec | 1m | 최종 AOF 다시쓰기 작업 시간 (초) |
| Commandstats | Calls | cnt | 1m | 명령 실행에 도달한(거부되지 않은) 호출 수 |
| Commandstats | Calls [Failed] | cnt | 1m | 실패한 호출 수 |
| Commandstats | Calls [Rejected] | cnt | 1m | 거부된 호출 수 |
| Persistence | Changes [Last Saved] | cnt | 1m | 최종 덤프 이후 변경의 수 |
| Clients | Client Output Buffer [MAX] | cnt | 1m | 현재 클라이언트 연결 중 최장 출력 목록 |
| Clients | Client Input Buffer [MAX] | cnt | 1m | 현재 클라이언트 연결 중 최대 입력 버퍼 |
| Sentinel | Clients [Sentinel] | cnt | 1m | 클라이언트 connections 수 (sentinel) |
| Replication | Connected Slaves | cnt | 1m | 연결된 슬레이브 수 |
| Clients | Connections [Blocked] | cnt | 1m | 블록킹 호출 보류 중인 클라이언트의 수 (BLPOP, BRPOP, BRPOPLPUSH) |
| Clients | Connections [Current] | cnt | 1m | 클라이언트 connections 수 (slaves connection은 제외) |
| Persistence | Copy On Write Allocated Size [AOF] | bytes | 1m | 최종 RBD 저장 작업 동안 COW 할당 크기 |
| Persistence | Copy On Write Allocated Size [RDB] | bytes | 1m | 최종 RBD 저장 작업 동안 COW 할당 크기 |
| Commandstats | CPU Time [Average] | cnt | 1m | 명령 실행당 사용된 평균 CPU |
| Commandstats | CPU Time [Total] | usec | 1m | 이들 명령이 사용한 총 CPU 시간 |
| CPU | CPU Usage [System Process] | % | 1m | 백그라운드 프로세스에서 사용한 시스템 CPU |
| CPU | CPU Usage [System] | % | 1m | Redis 서버에 사용된 시스템 CPU |
| CPU | CPU Usage [User Process] | % | 1m | 백그라운드 프로세스에서 사용한 사용자 CPU |
| CPU | CPU Usage [User] | % | 1m | 백그라운드 프로세스에 사용된 시스템 CPU |
| Memory | Dataset Used | bytes | 1m | 데이터셋 크기 |
| Disk | Disk Used | bytes | 1m | datadir 사용량 |
| Stats | Evicted Keys | cnt | 1m | maxmemory limit에 의해 발생한 evicted keys 수 |
| Persistence | Fsyncs [Delayed] | cnt | 1m | 지연된 fsync 카운터 |
| Persistence | Fsyncs [Pending] | cnt | 1m | 백그라운드 입출력 대기열에 보류 중인 fsync 작업의 수 (형식: 바이트) |
| Stats | Full Resyncs | cnt | 1m | 슬레이브와의 완전 재동기화 수 |
| Stats | Keys [Expired] | cnt | 1m | 키 만료 이벤트의 총 수 |
| Keyspace | Keys [Keyspace] | cnt | 1m | 키 공간의 키 수 |
| Stats | Lastest Fork Duration Time | usec | 1m | 최근 포크(fork) 작업 시간 (마이크로초) |
| Stats | Lookup Keys [Hit] | cnt | 1m | 주 사전 내 성공적 키 조회의 수 |
| Stats | Lookup Keys [Miss] | cnt | 1m | 주 사전 내 실패한 키 조회의 수 |
| Memory | Lua Engine Memory Used | bytes | 1m | Lua 엔진이 사용한 메모리 |
| Replication | Master Last Interaction Time Ago | sec | 1m | 마스터와의 최종 상호작용 이후 지난 시간 (초) |
| Replication | Master Last Interaction Time Ago [Sync] | sec | 1m | 마스터와의 최종 상호작용 이후 지난 시간 (초) |
| Replication | Master Offset | pid | 1m | 서버의 현재 복제 오프셋 |
| Replication | Master Second Offset | pid | 1m | 복제 ID가 수락될 때까지의 오프셋 |
| Replication | Master Sync Left Bytes | bytes | 1m | 동기화가 완료되기 전 남은 바이트 수 |
| Memory | Memory Fragmentation Rate | % | 1m | used_memory_rss and used_memory 비율 |
| Memory | Memory Fragmentation Rate [Allocator] | % | 1m | 단편화 비율 |
| Memory | Memory Fragmentation Used | bytes | 1m | used_memory_rss와 used_memory 간의 바이트 |
| Memory | Memory Fragmentation Used [Allocator] | bytes | 1m | 상주 바이트 |
| Memory | Memory Max Value | bytes | 1m | 메모리 제한 |
| Memory | Memory Resident [Allocator] | bytes | 1m | 상주 메모리 |
| Memory | Memory RSS Rate [Allocator] | % | 1m | 상주 비율 |
| Memory | Memory Used [Active] | bytes | 1m | 활성 메모리 |
| Memory | Memory Used [Allocated] | bytes | 1m | 할당된 메모리 |
| Memory | Memory Used [Resident] | bytes | 1m | 상주 바이트 |
| Stats | Network In Bytes [Total] | bytes | 1m | 총 네트워크 입력 |
| Stats | Network Out Bytes [Total] | bytes | 1m | 총 네트워크 출력 |
| Stats | Network Read Rate | cnt | 1m | 네트워크의 초당 읽기 속도 (KB/sec) |
| Stats | Network Write Rate | cnt | 1m | 네트워크의 초당 쓰기 속도 (KB/sec) |
| Stats | Partial Resync Requests [Accepted] | cnt | 1m | 수락된 부분 재동기화 요청 수 |
| Stats | Partial Resync Requests [Denied] | cnt | 1m | 거부된 부분 재동기화 요청 수 |
| Memory | Peak Memory Consumed | bytes | 1m | Redis가 사용한 최대 메모리 |
| Stats | Processed Commands | cnt | 1m | 초당 처리된 명령의 수 |
| Stats | Processed Commands [Total] | cnt | 1m | 처리된 총 명령 수 |
| Stats | Pub/Sub Channels | cnt | 1m | 클라이언트 구독이 있는 게시/구독 채널의 전역 수 |
| Stats | Pub/Sub Patterns | cnt | 1m | 클라이언트 구독이 있는 게시/구독 패턴의 전역 수 |
| Persistence | RDB Saved Duration Time [Current] | sec | 1m | 해당하는 경우 진행 중인 RDB 저장 작업 시간 |
| Persistence | RDB Saved Duration Time [Last] | sec | 1m | 최종 RDB 저장 작업 시간 (초) |
| Stats | Received Connections [Total] | cnt | 1m | 수신된 총 연결 수 |
| Stats | Rejected Connections [Total] | cnt | 1m | 거부된 총 연결 수 |
| Replication | Replication Backlog Actove Count | cnt | 1m | 복제 백로그 활성화 표시 플래그 |
| Replication | Replication Backlog Master Offset | cnt | 1m | 복제 백로그 버퍼의 마스터 오프셋 |
| Replication | Replication Backlog Size | bytes | 1m | 복제 백로그 버퍼의 데이터 크기(바이트) |
| Replication | Replication Backlog Size [Total] | bytes | 1m | 복제 백로그 버퍼의 총 크기(바이트) |
| Replication | Slave Priority | cnt | 1m | 장애조치 대상으로서 인스턴스의 우선순위 |
| Replication | Slave Replication Offset | pid | 1m | 슬레이브 인스턴스의 복제 오프셋 |
| Slowlog | Slow Operations | cnt | 1m | 느린 작업의 수 |
| Stats | Sockets [MIGRATE] | cnt | 1m | 마이그레이션용으로 열린 소켓 수 |
| Stats | Tracked Keys [Expiry] | cnt | 1m | 만료용으로 추적되는 키 수 (쓰기 가능 슬레이브만 해당) |
| State | Instance Status [PID] | PID | 1m | redis-server 프로세스 pid |
| State | Sentinel Status [PID] | PID | 1m | sentinel 프로세스 pid |
Valkey
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Stats | Active Defragmentation Keys [Hits] | cnt | 1m | 단편화 제거된 키의 수 |
| Stats | Active Defragmentation Keys [Miss] | cnt | 1m | 활성 단편화 제거 프로세스에서 건너뛴 키의 수 |
| Stats | Active Defragmentationd [Hits] | cnt | 1m | 활성 단편화 제거 프로세스로 수행된 값 재할당의 수 |
| Stats | Active Defragmentations [Miss] | cnt | 1m | 활성 단편화 제거 프로세스로 시작되어 중단된 값 재할당의 수 |
| Memory | Allocated Bytes [OS] | bytes | 1m | Valkey가 할당하고 운영 체제에 인식되는 바이트 수 (상주 세트 크기) |
| Memory | Allocated Bytes [Valkey] | bytes | 1m | Valkey가 할당한 총 바이트 수 |
| Persistence | AOF Buffer Size | bytes | 1m | AOF 버퍼 크기 |
| Persistence | AOF File Size [Current] | bytes | 1m | AOF 현재 파일 크기 |
| Persistence | AOF File Size [Lastest Startup] | bytes | 1m | 최근 시작 또는 다시쓰기에서 AOF 파일 크기 |
| Persistence | AOF Rewrite Buffer Size | bytes | 1m | AOF 다시쓰기 버퍼의 크기 |
| Persistence | AOF Rewrite Current Time | sec | 1m | 해당하는 경우 진행 중인 AOF 다시쓰기 작업 시간 |
| Persistence | AOF Rewrite Last Time | sec | 1m | 최종 AOF 다시쓰기 작업 시간 (초) |
| Commandstats | Calls | cnt | 1m | 명령 실행에 도달한(거부되지 않은) 호출 수 |
| Commandstats | Calls [Failed] | cnt | 1m | 실패한 호출 수 (Valkey 6.2-rc2) |
| Commandstats | Calls [Rejected] | cnt | 1m | 거부된 호출 수 (Valkey 6.2-rc2) |
| Persistence | Changes [Last Saved] | cnt | 1m | 최종 덤프 이후 변경의 수 |
| Clients | Cleint Output Buffer [MAX] | cnt | 1m | 현재 클라이언트 연결 중 최장 출력 목록 |
| Clients | Client Input Buffer [MAX] | cnt | 1m | 현재 클라이언트 연결 중 최대 입력 버퍼 (Valkey 5.0) |
| Sentinel | Clients [Sentinel] | cnt | 1m | 클라이언트 connections 수 (sentinel) |
| Replication | Connected Slaves | cnt | 1m | 연결된 슬레이브 수 |
| Clients | Connections [Blocked] | cnt | 1m | 블록킹 호출 보류 중인 클라이언트의 수(BLPOP, BRPOP, BRPOPLPUSH) |
| Clients | Connections [Current] | cnt | 1m | 클라이언트 connections 수 (slaves connection 은 제외) |
| Persistence | Copy On Write Allocated Size [AOF] | bytes | 1m | 최종 RBD 저장 작업 동안 COW 할당 크기 |
| Persistence | Copy On Write Allocated Size [RDB] | bytes | 1m | 최종 RBD 저장 작업 동안 COW 할당 크기 |
| Commandstats | CPU Time [Average] | cnt | 1m | 명령 실행당 사용된 평균 CPU |
| Commandstats | CPU Time [Total] | usec | 1m | 이들 명령이 사용한 총 CPU 시간 |
| CPU | CPU Usage [System Process] | % | 1m | 백그라운드 프로세스에서 사용한 시스템 CPU |
| CPU | CPU Usage [System] | % | 1m | Valkey 서버에 사용된 시스템 CPU |
| CPU | CPU Usage [User Process] | % | 1m | 백그라운드 프로세스에서 사용한 사용자 CPU |
| CPU | CPU Usage [User] | % | 1m | 백그라운드 프로세스에 사용된 시스템 CPU |
| Memory | Dataset Used | bytes | 1m | 데이터셋 크기 |
| Disk | Disk Used | MB | 1m | datadir 사용량 |
| Stats | Evicted Keys | cnt | 1m | maxmemory limit에 의해 발생한 evicted keys 수 |
| Persistence | Fsyncs [Delayed] | cnt | 1m | 지연된 fsync 카운터 |
| Persistence | Fsyncs [Pending] | cnt | 1m | 백그라운드 입출력 대기열에 보류 중인 fsync 작업의 수 (형식: 바이트) |
| Stats | Full Resyncs | cnt | 1m | 슬레이브와의 완전 재동기화 수 |
| Stats | Keys [Expired] | cnt | 1m | 키 만료 이벤트의 총 수 |
| Keyspace | Keys [Keyspace] | cnt | 1m | 키 공간의 키 수 |
| Stats | Lastest Fork Duration Time | usec | 1m | 최근 포크(fork) 작업 시간 (마이크로초) |
| Stats | Lookup Keys [Hit] | cnt | 1m | 주 사전 내 성공적 키 조회의 수 |
| Stats | Lookup Keys [Miss] | cnt | 1m | 주 사전 내 실패한 키 조회의 수 |
| Memory | Lua Engine Memory Used | bytes | 1m | Lua 엔진이 사용한 메모리 |
| Replication | Master Last Interaction Time Ago | sec | 1m | 마스터와의 최종 상호작용 이후 지난 시간 (초) |
| Replication | Master Last Interaction Time Ago [Sync] | sec | 1m | 마스터와의 최종 상호작용 이후 지난 시간 (초) |
| Replication | Master Offset | pid | 1m | 서버의 현재 복제 오프셋 |
| Replication | Master Second Offset | pid | 1m | 복제 ID가 수락될 때까지의 오프셋 |
| Replication | Master Sync Left Bytes | bytes | 1m | 동기화가 완료되기 전 남은 바이트 수 |
| Memory | Memory Fragmentation Rate | % | 1m | used_memory_rss and used_memory 비율 |
| Memory | Memory Fragmentation Rate [Allocator] | % | 1m | 단편화 비율 |
| Memory | Memory Fragmentation Used | bytes | 1m | used_memory_rss와 used_memory 간의 바이트 |
| Memory | Memory Fragmentation Used [Allocator] | bytes | 1m | 상주 바이트 |
| Memory | Memory Max Value | bytes | 1m | 메모리 제한 |
| Memory | Memory Resident [Allocator] | bytes | 1m | 상주 메모리 |
| Memory | Memory RSS Rate [Allocator] | % | 1m | 상주 비율 |
| Memory | Memory Used [Active] | bytes | 1m | 활성 메모리 |
| Memory | Memory Used [Allocated] | bytes | 1m | 할당된 메모리 |
| Memory | Memory Used [Resident] | bytes | 1m | 상주 바이트 |
| Stats | Network In Bytes [Total] | bytes | 1m | 총 네트워크 입력 |
| Stats | Network Out Bytes [Total] | bytes | 1m | 총 네트워크 출력 |
| Stats | Network Read Rate | kbps | 1m | 네트워크의 초당 읽기 속도 (KB/sec) |
| Stats | Network Write Rate | kbps | 1m | 네트워크의 초당 쓰기 속도 (KB/sec) |
| Stats | Partial Resync Requests [Accepted] | cnt | 1m | 수락된 부분 재동기화 요청 수 |
| Stats | Partial Resync Requests [Denied] | cnt | 1m | 거부된 부분 재동기화 요청 수 |
| Memory | Peak Memory Consumed | bytes | 1m | Valkey가 사용한 최대 메모리 |
| Stats | Processed Commands | cnt | 1m | 초당 처리된 명령 수 |
| Stats | Processed Commands [Total] | cnt | 1m | 처리된 총 명령 수 |
| Stats | Pub/Sub Channels | cnt | 1m | 클라이언트 구독이 있는 게시/구독 채널의 전역 수 |
| Stats | Pub/Sub Patterns | cnt | 1m | 클라이언트 구독이 있는 게시/구독 패턴의 전역 수 |
| Persistence | RDB Saved Duration Time [Current] | sec | 1m | 해당하는 경우 진행 중인 RDB 저장 작업 시간 |
| Persistence | RDB Saved Duration Time [Last] | sec | 1m | 최종 RDB 저장 작업 시간 (초) |
| Stats | Received Connections [Total] | cnt | 1m | 수신된 총 연결 수 |
| Stats | Rejected Connections [Total] | cnt | 1m | 거부된 총 연결 수 |
| Replication | Replication Backlog Active Count | cnt | 1m | 복제 백로그 활성화 표시 플래그 |
| Replication | Replication Backlog Master Offset | cnt | 1m | 복제 백로그 버퍼의 마스터 오프셋 |
| Replication | Replication Backlog Size | bytes | 1m | 복제 백로그 버퍼의 데이터 크기 |
| Replication | Replication Backlog Size [Total] | bytes | 1m | 복제 백로그 버퍼의 총 크기 |
| Replication | Slave Priority | cnt | 1m | 장애조치 대상으로서 인스턴스의 우선순위 |
| Replication | Slave Replication Offset | pid | 1m | 슬레이브 인스턴스의 복제 오프셋 |
| Slowlog | Slow Operations | cnt | 1m | 느린 작업의 수 |
| Stats | Sockets [MIGRATE] | cnt | 1m | 마이그레이션용으로 열린 소켓 수 |
| Stats | Tracked Keys [Expiry] | cnt | 1m | 만료용으로 추적되는 키 수 (쓰기 가능 슬레이브만 해당) |
| State | Instance State [PID] | PID | 1m | Valkey-server 프로세스 PID |
| State | Sentinel State [PID] | PID | 1m | Sentinel 프로세스 PID |
Data Analytics 유형
Event Streams
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Broker | Connections [Zookeeper Client] | cnt | 1m | ZooKeeper 연결된 건수 |
| Broker | Failed [Client Fetch Request] | cnt | 1m | 클라이언트 Fetch 요청 처리 실패 건수 |
| Broker | Failed [Produce Request] | cnt | 1m | Procucer 요청 처리 실패 건수 |
| Broker | Incomming Messages | cnt | 1m | Broker가 받은 message 건수 |
| Broker | Leader Elections | cnt | 1m | Leader Election 발생 건수 |
| Broker | Leader Elections [Unclean] | cnt | 1m | Unclean Leader Election 발생 건수 |
| Broker | Log Flushes | cnt | 1m | log flush 발생 건수 |
| Broker | Network In Bytes | bytes | 1m | 전체 Topic이 수신한 바이트 |
| Broker | Network Out Bytes | bytes | 1m | 전체 Topic이 송신한 바이트 |
| Broker | Rejected Bytes | bytes | 1m | 전체 Topic이 reject한 바이트 |
| Broker | Request Queue Length | cnt | 1m | 요청 대기열 크기 |
| Broker | Zookeeper Sessions [Closed] | cnt | 1m | 초당 ZooKeeper 닫힌 세션 |
| Broker | Zookeeper Sessions [Expired] | cnt | 1m | 초당 ZooKeeper 만료된 세션 |
| Broker | Zookeeper Sessions [Readonly] | cnt | 1m | 초당 ZooKeeper 읽기전용 세션 |
| Broker | Incomming Messages Rate [Topic] | cnt | 1m | 토픽별 수신 메시지 건수 |
| Broker | Incomming Byte Rate [Second] | bytes | 1m | 초당 Incomming 데이터 |
| Broker | Outgoing Byte Rate [Second] | bytes | 1m | 초당 Outgoing한 데이터 |
| Broker | Rejected Byte Rate [Second] | bytes | 1m | 초당 Reject한 바이트 |
| Disk | Disk Used | bytes | 1m | Datadir 사용량 |
| State | AKHQ State [PID] | PID | 1m | akhq 프로세스 pid |
| State | Instance State [PID] | PID | 1m | kafka 프로세스 pid |
| State | Zookeeper State [PID] | PID | 1m | zookeeper 프로세스 pid |
Search Engine
Elasticsearch
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Cluster | Shards | cnt | 1m | 클러스터 샤드 수 |
| Cluster | Shards [Primary] | cnt | 1m | 클러스터 프라이머리 샤트 수 |
| Cluster | Index [Total] | cnt | 1m | 클러스터 인덱스 수 |
| Cluster | License Expiry Date [ms] | ms | 1m | 라이선스 만료일자 [milisecond] |
| Cluster | License Status | state | 1m | 라이선스 상태 |
| Cluster | License Type | type | 1m | 라이선스 유형 |
| FileSystem | Disk Usage | bytes | 1m | datadir 사용량 |
| Node | Documents [Deleted] | cnt | 1m | 총 삭제된 문서 수 |
| Node | Documents [Existing] | cnt | 1m | 총 기존 문서 수 |
| Node | Filesystem Bytes [Available] | bytes | 1m | 사용 가능한 파일 시스템 |
| Node | Filesystem Bytes [Free] | bytes | 1m | 가용 파일 시스템 |
| Node | Filesystem Bytes [Total] | bytes | 1m | 총 파일 시스템 |
| Node | JVM Heap Used [Init] | bytes | 1m | JVM에 사용된 힙 init(바이트) |
| Node | JVM Heap Used [MAX] | bytes | 1m | JVM에 사용된 힙 max(바이트) |
| Node | JVM Non Heap Used [Init] | bytes | 1m | JVM에 사용된 힙 이외의 init(바이트) |
| Node | JVM Non Heap Used [MAX] | bytes | 1m | JVM에 사용된 힙 이외의 max(바이트) |
| Node | Segments | cnt | 1m | 총 세그먼트 수 |
| Node | Segments Bytes | bytes | 1m | 세그먼트의 총 크기 |
| Node | Store Bytes | bytes | 1m | 저장소의 총 크기 |
| State | Instance state [PID] | PID | 1m | Elasticsearch 프로세스 pid |
| Task | Queue Time | ms | 1m | 대기열 시간 |
| Kibana | Kibana state [PID] | PID | 1m | Kibana 프로세스 pid |
| Kibana | Kibana Connections | cnt | 1m | 연결 |
| Kibana | Kibana Memory Heap Allocated [Limit] | bytes | 1m | Node.js 프로세스에 할당된 최대 이전 공간 크기 |
| Kibana | Kibana Memory Heap Allocated [Total] | bytes | 1m | 메모리 |
| Kibana | Kibana Memory Heap Used | bytes | 1m | 메모리 |
| Kibana | Kibana Process Uptime | ms | 1m | 프로세스 |
| Kibana | Kibana Requests [Disconnected] | cnt | 1m | 요청 카운트 지표 |
| Kibana | Kibana Requests [Total] | cnt | 1m | 요청 카운트 지표 |
| Kibana | Kibana Response Time [Avg] | ms | 1m | 응답 시간 지표 |
| Kibana | Kibana Response Time [MAX] | ms | 1m | 응답 시간 지표 |
Opensearch
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Cluster state | state | 1m | 클러스터 상태 |
| Cluster | Nodes | cnt | 1m | 클러스터의 노드 수 |
| Cluster | Data nodes | cnt | 1m | 클러스터의 데이터 노드 수 |
| Cluster | Pending tasks | cnt | 1m | Pending task 수 |
| Shard | Shards [active] | cnt | 1m | 활성 조각 수 |
| Shard | Shards [active_primary] | cnt | 1m | 활성_1차 조각 수 |
| Shard | Shards [initializing] | cnt | 1m | 초기화 shard 수 |
| Shard | Shards [relocating] | cnt | 1m | 이전 조각 수 |
| Shard | Shards [unassigned] | cnt | 1m | 할당되지 않은 조각 수 |
| Thread | Thread Queue Count [search] | cnt | 1m | 대기열의 검색 작업 수 |
| Thread | Thread Queue Count [refresh] | cnt | 1m | 대기열의 새로 고침 작업 수 |
| Thread | Thread Queue Count [write] | cnt | 1m | 대기열에서 쓰기 작업 수 |
| Thread | Thread Queue Count [get] | cnt | 1m | 대기열에서 작업 가져오기 수 |
| Thread | Thread Queue Count [snapshot] | cnt | 1m | 대기열에서 스냅샷 작업 수 |
| Thread | Thread Queue Count [flush] | cnt | 1m | 대기열의 플러시 작업 수 |
| Thread | Thread Queue Count [force_merge] | cnt | 1m | 대기열에 있는 force_merge 작업 수 |
| System | CPU usage | % | 1m | CPU 사용률 |
| System | Memory usage | bytes | 1m | 사용된 메모리 |
| System | Disk available | bytes | 1m | 디스크 사용 가능 |
| Documents | Documents indexing rate | cnt | 1m | 인덱싱된 문서 수 |
| Documents | Documents indexing rate [Delta] | cnt | 1m | 인덱싱된 문서 수 (델타값) |
| Documents | Indexing latency | sec | 1m | 문서를 인덱싱하는 동안 소요되는 시간 |
| Documents | Indexing latency [Delta] | sec | 1m | 문서를 인덱싱하는 동안 소요되는 시간 (델타값) |
| Documents | Search rate | cnt | 1m | 검색 쿼리 수 |
| Documents | Search rate [Delta] | cnt | 1m | 검색 쿼리 수 (델타값) |
| Documents | Search latency | sec | 1m | 조회하는 동안 소요된 시간 |
| Documents | Search latency [Delta] | sec | 1m | 조회하는 동안 소요된 시간 (델타값) |
| Documents | Document count (with replicas) | cnt | 1m | 총 문서 수 |
| Documents | Document deleting rate | cnt | 1m | 삭제된 문서 수 |
| Documents | Document deleting rate [Delta] | cnt | 1m | 삭제된 문서 수 (델타값) |
| Documents | Document merging rate | cnt | 1m | 병합된 문서 수 |
| Documents | Document merging rate [Delta] | cnt | 1m | 병합된 문서 수 (델타값) |
| JVM | Heap used | bytes | 1m | 힙에 사용된 메모리 |
| JVM | GC count [young] | cnt | 1m | 젊은 GC 컬렉션 수 |
| JVM | GC count [young] [Delta] | cnt | 1m | 젊은 GC 컬렉션 수 (델타값) |
| JVM | GC count [G1] | cnt | 1m | G1 GC 수집 개수 |
| JVM | GC count [G1] [Delta] | cnt | 1m | G1 GC 수집 개수 (델타값) |
| JVM | GC count [old] | cnt | 1m | 구 GC 컬렉션 수 |
| JVM | GC count [old] [Delta] | cnt | 1m | 구 GC 컬렉션 수 (델타값) |
| JVM | GC time [young] | cnt | 1m | 젊은 GC 컬렉션을 위해 소비된 시간 |
| JVM | GC time [young] [Delta] | cnt | 1m | 젊은 GC 컬렉션을 위해 소비된 시간 (델타값) |
| JVM | GC time [G1] | cnt | 1m | G1 GC 컬렉션에 소요되는 시간 |
| JVM | GC time [G1] [Delta] | cnt | 1m | G1 GC 컬렉션에 소요되는 시간 (델타값) |
| JVM | GC time [old] | cnt | 1m | 오래된 GC 컬렉션에 소요되는 시간 |
| JVM | GC time [old] [Delta] | cnt | 1m | 오래된 GC 컬렉션에 소요되는 시간 (델타값) |
| State | Instance state [PID] | PID | 1m | Opensearch 프로세스 PID |
| State | Dashboard state [PID] | PID | 1m | Dashboard 프로세스 PID |
Vertica(DBaaS)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State [PID] | state | 1m | Vertica 프로세스 PID |
| Activelock | Active Locks | cnt | 1m | Active Locks 수 |
| Activesession | Active Sessions | cnt | 1m | Active Session 수 |
| Tablespace | Data Tablespace Used | MB | 1m | Data, Temp Tablespace 사용량 |
| Tablespace | Catalog Tablespace Used | MB | 1m | Catalog Tablespace 사용량 |
Container 유형
Kubernetes Engine
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Cluster | Cluster Namespaces [Active] | cnt | 5m | active 상태인 namespace 수 |
| Cluster | Cluster Namespaces [Total] | cnt | 5m | 클러스터에 속한 전체 namespace 수 |
| Cluster | Cluster Nodes [Ready] | cnt | 5m | READY 상태인 노드 수 |
| Cluster | Cluster Nodes [Total] | cnt | 5m | 클러스터에 속한 전체 노드 수 |
| Cluster | Cluster Pods [Failed] | cnt | 5m | cluster 내 failed 상태 pod 수 |
| Cluster | Cluster Pods [Pending] | cnt | 5m | cluster 내 pending 상태 pod 수 |
| Cluster | Cluster Pods [Running] | cnt | 5m | cluster 내 running 상태 pod 수 |
| Cluster | Cluster Pods [Succeeded] | cnt | 5m | cluster 내 succeeded 상태 pod 수 |
| Cluster | Cluster Pods [Unknown] | cnt | 5m | cluster 내 unknown 상태 pod 수 |
| Cluster | Instance State | state | 5m | cluster 상태 |
| Namespace | Namespace Pods [Failed] | cnt | 5m | namespace 내 failed 상태 pod 수 |
| Namespace | Namespace Pods [Pending] | cnt | 5m | namespace 내 pending 상태 pod 수 |
| Namespace | Namespace Pods [Running] | cnt | 5m | namespace 내 running 상태 pod 수 |
| Namespace | Namespace Pods [Succeeded] | cnt | 5m | namespace 내 succeeded 상태 pod 수 |
| Namespace | Namespace Pods [Unknown] | cnt | 5m | namespace 내 unknown 상태 pod 수 |
| Namespace | Namespace GPU Clock Frequency | MHz | 5m | Namespace 내 SM clock frequency |
| Namespace | Namespace GPU Memory Usage | % | 5m | Namespace 내 Memory utilization |
| Node | Node CPU Size [Allocatable] | cnt | 5m | 노드 내 CPU allocatable |
| Node | Node CPU Size [Capacity] | cnt | 5m | 노드 내 CPU capacity |
| Node | Node CPU Usage | % | 5m | 노드 내 CPU 사용량 |
| Node | Node CPU Usage [Request] | % | 5m | 노드 내 CPU request_ratio |
| Node | Node CPU Used | state | 5m | 노드 내 CPU utilization |
| Node | Node Filesystem Usage | % | 5m | 노드 내 FS 사용율 |
| Node | Node Memory Size [Allocatable] | bytes | 5m | 노드 내 memory allocatable |
| Node | Node Memory Size [Capacity] | bytes | 5m | 노드 내 memory utilization |
| Node | Node Memory Usage | % | 5m | 노드 내 memory utilization |
| Node | Node Memory Usage [Request] | % | 5m | 노드 내 memory request_ratio |
| Node | Node Memory Workingset | bytes | 5m | 노드 내 memory workingset |
| Node | Node Network In Bytes | bytes | 5m | 노드 네트워크 rx bytes |
| Node | Node Network Out Bytes | bytes | 5m | 노드 네트워크 tx bytes |
| Node | Node Network Total Bytes | bytes | 5m | 노드 네트워크 total bytes |
| Node | Node Pods [Failed] | cnt | 5m | 노드 내 failed 상태 pod 수 |
| Node | Node Pods [Pending] | cnt | 5m | 노드 내 pending 상태 pod 수 |
| Node | Node Pods [Running] | cnt | 5m | 노드 내 running 상태 pod 수 |
| Node | Node Pods [Succeeded] | cnt | 5m | 노드 내 succeeded 상태 pod 수 |
| Node | Node Pods [Unknown] | cnt | 5m | 노드 내 unknown 상태 pod 수 |
| Pod | Pod CPU Usage [Limit] | % | 5m | pod 내 CPU usage_limit_ratio |
| Pod | Pod CPU Usage [Request] | % | 5m | pod 내 CPU request_ratio |
| Pod | Pod CPU Usage | mc | 5m | pod 내 CPU 사용량 |
| Pod | Pod Memory Usage [Limit] | % | 5m | pod 내 memory usage_limit_ratio |
| Pod | Pod Memory Usage [Request] | % | 5m | pod 내 memory request_ratio |
| Pod | Pod Memory Usage | bytes | 5m | pod 내 memory 사용량 |
| Pod | Pod Network In Bytes | bytes | 5m | pod 내 network rx bytes |
| Pod | Pod Network Out Bytes | bytes | 5m | pod 내 network tx bytes |
| Pod | Pod Network Total Bytes | bytes | 5m | pod 내 network total bytes |
| Pod | Pod Restart Containers | cnt | 5m | pod 내 container restart count |
| Workload | Workload Pods [Running] | cnt | 5m | - |
Container Registry
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Container Registry | Image Pulls [Denied] | cnt | 1m | 거부된 Image Tag(digest) Pull 수 |
| Container Registry | Image Pushs [Allowed] | cnt | 1m | 허용된 Image Tag(digest) Push 수 |
| Container Registry | Image Pushs [Denied] | cnt | 1m | 거부된 Image Tag(digest) Push 수 |
| Container Registry | Image Scans[Allowed] | cnt | 1m | 허용된 Image Tag(digest) Scan 수 |
| Container Registry | Image Scans [Denied] | cnt | 1m | 거부된 Image Tag(digest) Scan 수 |
| Container Registry | Image Tags [Deleted] | cnt | 1m | 삭제된 Image Tag(digest) 수 |
| Container Registry | Images [Created] | cnt | 1m | 생성된 Image 수 |
| Container Registry | Images [Deleted] | cnt | 1m | 삭제된 Image 수 |
| Container Registry | Logins [Allowed] | cnt | 1m | 허용된 Registry Login 수 |
| Container Registry | Logins [Denied] | cnt | 1m | 거부된 Registry Login 수 |
| Container Registry | Repositories [Created] | cnt | 1m | 생성된 Repository 수 |
| Container Registry | Repositories [Deleted] | cnt | 1m | 삭제된 Repository 수 |
| State | Instance State | state | 1m | 상태확인 |
Networking 유형
Internet Gateway
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Internet Gateway | Network In Total Bytes [Internet Delta] | bytes | 5m | Internet Gateway → VPC로 향하는 5 분 동안의 누적 트래픽량 (Internet) ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Internet Gateway | Network In Total Bytes [Internet] | bytes | 5m | rx bytes total |
| Internet Gateway | Network Out Total Bytes [Internet Delta] | bytes | 5m | VPC → Internet Gateway로 향하는 5 분 동안의 누적 트래픽량 (Internet) ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Internet Gateway | Network Out Total Bytes [Internet] | bytes | 5m | tx bytes total |
Load Balancer(OLD)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Load Balancer | Current Connection | cnt | 5m | 현재 Connection 수 |
| Load Balancer | Total Connection | cnt | 5m | 총 Connection 수 |
| Load Balancer | Total Connection [Delta] | cnt | 5m | 총 Connection 수 (delta 값) |
| Load Balancer | Network In Bytes | bytes | 5m | in bytes |
| Load Balancer | Network In Bytes [Delta] | bytes | 5m | Client → Load Balancer로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Load Balancer | Network Out Bytes | bytes | 5m | out bytes |
| Load Balancer | Network Out Bytes [Delta] | bytes | 5m | Load Balancer → Client로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Load Balancer | Instance State | state | 5m | Load Balancer 상태 |
Load Balancer Listener(OLD)
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Listener | Connections [Current] | cnt | 5m | 현재 connection 수 |
| Listener | Connections [Total Delta] | cnt | 5m | total connection 수 (delta 값) |
| Listener | Connections [Total] | cnt | 5m | total connection 수 |
| Listener | Instance State | state | 5m | LB Listener 상태 |
| Listener | Network In Bytes | bytes | 5m | in bytes |
| Listener | Network In Bytes [Delta] | bytes | 5m | Client → Load Balancer로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Listener | Network Out Bytes | bytes | 5m | out bytes |
| Listener | Network Out Bytes [Delta] | bytes | 5m | Load Balancer → Client로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
Direct Connect
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Direct Connect | Network In Bytes | bytes | 5m | Direct Connect → VPC로 향하는 누적 트래픽량 |
| Direct Connect | Network In Bytes [Delta] | bytes | 5m | Direct Connect → VPC로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
| Direct Connect | Network Out Bytes | bytes | 5m | VPC → Direct Connect로 향하는 누적 트래픽량 |
| Direct Connect | Network Out Bytes [Delta] | bytes | 5m | VPC → Direct Connect로 향하는 5 분 동안의 누적 트래픽량 ※ 트래픽 bps 평균 변환식: 누적 트래픽량(bytes) / 300 (초) * 8 (bit) |
Load Balancer
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State | state | 5m | LB 상태 |
| Load Balancer | Current Connection | cnt | 5m | 현재 Connection 수 |
| Load Balancer | Total L4 Connection | cnt | 5m | 총 L4 Connection 수 |
| Load Balancer | Total L7 Connection | cnt | 5m | 총 L7 Connection 수 |
| Load Balancer | Total TCP Connection | cnt | 5m | 총 TCP Connection 수 |
| Load Balancer | Total Connection | cnt | 5m | 총 Connection 수 |
| Load Balancer | Bytes processed in forward direction | bytes | 5m | 전방향 Network Byte |
| Load Balancer | Packets processed in forward direction | cnt | 5m | 전방향 Network 패킷 |
| Load Balancer | Bytes processed in reverse direction | bytes | 5m | 역방향 Network Byte |
| Load Balancer | Packets processed in reverse direction | cnt | 5m | 역방향 Network 패킷 |
| Load Balancer | Total failure actions | cnt | 5m | 총 실패 수 |
| Load Balancer | Current Request | cnt | 5m | 현재 Request 수 |
| Load Balancer | Current response | cnt | 5m | 현재 Reseponse 수 |
| Load Balancer | Total Request | cnt | 5m | 총 Request 수 |
| Load Balancer | Total Request Success | cnt | 5m | 총 Request 성공 수 |
| Load Balancer | Peak Connection | cnt | 5m | 최고 Connection 수 |
| Load Balancer | Current Connection Rate | % | 5m | 현재 SSL Connection 율 |
| Load Balancer | Last response time | ms | 5m | 마지막 응답 시간 |
| Load Balancer | Fastest response time | ms | 5m | 최단 응답 시간 |
| Load Balancer | Slowest response time | ms | 5m | 최장 응답 시간 |
| Load Balancer | Current SSL Connection | cnt | 5m | 현재 SSL Connection 수 |
| Load Balancer | Total SSL Connection | cnt | 5m | 총 SSL Connection 수 |
| Load Balancer | Bytes processed in forward direction [Delta] | bytes | 5m | 전방향 Network Byte (델타값) |
| Load Balancer | Packets processed in forward direction [Delta] | cnt | 5m | 전방향 Network 패킷 (델타값) |
| Load Balancer | Bytes processed in reverse direction [Delta] | bytes | 5m | 역방향 Network Byte (델타값) |
| Load Balancer | Packets processed in reverse direction [Delta] | cnt | 5m | 역방향 Network 패킷 (델타값) |
Load Balancer Listener
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State | state | 5m | LB 상태 |
| Load Balancer | Current Connection | cnt | 5m | 현재 Connection 수 |
| Load Balancer | Total L4 Connection | cnt | 5m | 총 L4 Connection 수 |
| Load Balancer | Total L7 Connection | cnt | 5m | 총 L7 Connection 수 |
| Load Balancer | Total TCP Connection | cnt | 5m | 총 TCP Connection 수 |
| Load Balancer | Total Connection | cnt | 5m | 총 Connection 수 |
| Load Balancer | Bytes processed in forward direction | bytes | 5m | 전방향 Network Byte |
| Load Balancer | Packets processed in forward direction | cnt | 5m | 전방향 Network 패킷 |
| Load Balancer | Bytes processed in reverse direction | bytes | 5m | 역방향 Network Byte |
| Load Balancer | Packets processed in reverse direction | cnt | 5m | 역방향 Network 패킷 |
| Load Balancer | Total failure actions | cnt | 5m | 총 실패 수 |
| Load Balancer | Current Request | cnt | 5m | 현재 Request 수 |
| Load Balancer | Current response | cnt | 5m | 현재 Reseponse 수 |
| Load Balancer | Total Request | cnt | 5m | 총 Request 수 |
| Load Balancer | Total Request Success | cnt | 5m | 총 Request 성공 수 |
| Load Balancer | Peak Connection | cnt | 5m | 최고 Connection 수 |
| Load Balancer | Current Connection Rate | % | 5m | 현재 SSL Connection 율 |
| Load Balancer | Last response time | ms | 5m | 마지막 응답 시간 |
| Load Balancer | Fastest response time | ms | 5m | 최단 응답 시간 |
| Load Balancer | Slowest response time | ms | 5m | 최장 응답 시간 |
| Load Balancer | Current SSL Connection | cnt | 5m | 현재 SSL Connection 수 |
| Load Balancer | Total SSL Connection | cnt | 5m | 총 SSL Connection 수 |
| Load Balancer | Bytes processed in forward direction [Delta] | bytes | 5m | 전방향 Network Byte (델타값) |
| Load Balancer | Packets processed in forward direction [Delta] | cnt | 5m | 전방향 Network 패킷 (델타값) |
| Load Balancer | Bytes processed in reverse direction [Delta] | bytes | 5m | 역방향 Network Byte (델타값) |
| Load Balancer | Packets processed in reverse direction [Delta] | cnt | 5m | 역방향 Network 패킷 (델타값) |
Load Balancer Server Group
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Server Group | Instance State | state | 5m | LB Server Group 상태 |
| Server Group | Peak Connection | cnt | 5m | 서버그룹 최고 Connection 수 |
| Server Group | Healthy host | cnt | 5m | 서버그룹 정상 host 수 |
| Server Group | Unhealthy host | cnt | 5m | 서버그룹 비정상 host 수 |
| Server Group | Request Count | cnt | 5m | 요청 횟수 |
| Server Group | Response Count | cnt | 5m | 응답 횟수 |
| Server Group | 2xx Response Count | cnt | 5m | 2xx 응답 횟수 |
| Server Group | 3xx Response Count | cnt | 5m | 3xx 응답 횟수 |
| Server Group | 4xx Response Count | cnt | 5m | 4xx 응답 횟수 |
| Server Group | 5xx Response Count | cnt | 5m | 5xx 응답 횟수 |
Cloud WAN
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| State | Instance State | state | 10m | Attachment 연결 상태 |
| Attachment | Network in bytes | bytes | 10m | in bytes(주기당 Inbound 트래픽 사용량) |
| Attachment | Network out bytes | bytes | 10m | Out bytes(주기당 Outbound 트래픽 사용량) |
| Attachment | Network In Packets [Dropped] | cnt | 10m | in Dropped Packet 수(주기당 Dropped 패킷수) |
| Attachment | Network Out Packets [Dropped] | cnt | 10m | Out Dropped Packet 수(주기당 Dropped 패킷수) |
| Attachment | Network In Packets [Unicast] | cnt | 10m | in Unicast Packet 수(주기당 Unicast 패킷수) |
| Attachment | Network Out Packets [Unicast] | cnt | 10m | Out Unicast Packet 수(주기당 Unicast 패킷수) |
| Attachment | Network In Packets [Broadcast] | cnt | 10m | in Broadcast Packet 수(주기당 Broadcast 패킷수) |
| Attachment | Network Out Packets [Broadcast] | cnt | 10m | Out Broadcast Packet 수(주기당 Broadcast 패킷수) |
| Attachment | Network In Packets [Multicast] | cnt | 10m | in Multicast Packet 수(주기당 Multicast 패킷수) |
| Attachment | Network Out Packets [Multicast] | cnt | 10m | Out Multicast Packet 수(주기당 Multicast 패킷수) |
| Attachment | Network In Error Packets | cnt | 10m | in Error Packet 수(주기당 수신 에러 패킷수) |
| Attachment | Network Out Error Packets | cnt | 10m | Out Error Packet 수(주기당 송신 에러 패킷수) |
Global CDN
| 성능 항목 그룹명 | 성능 항목명 | 수집 단위 | 수집 주기 | 설명 |
|---|---|---|---|---|
| Global CDN | Instance State | state | 5m | Global CDN 상태 |
| Global CDN | Data Transfer Bytes | bytes | 5m | CDN 서비스를 통해 전송된 데이터의 전송량 (originBytes) |
| Global CDN | Requests [Total] | cnt | 5m | CDN 서비스로 인입된 서비스 요청 수(건) (originHits) |
2.9 - 부록 C. 서비스별 상태 체크
Compute 유형
Virtual Server
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [Basic] | 인스턴스 상태 | NOSTATE, RUNNING, BLOCKED, PASUED, SHUTDOWN, SHUTOFF, CRASHED, PMSUSPENDED, LAST |
GPU Server
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [Basic] | 인스턴스 상태 | NOSTATE RUNNING, BLOCKED, PASUED, SHUTDOWN, SHUTOFF, CRASHED, PMSUSPENDED, LAST |
Bare Metal Server
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Multi-node GPU Cluster [Cluster Fabric]
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Multi-node GPU Cluster [Node]
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Storage 유형
File Storage
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | File Storage 볼륨 상태 | * 1: Online 일 경우 * 0: 그 이외의 상태값(Offline) |
Object Storage
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Block Storage(BM)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Blockstorage 볼륨 상태 | * 1: running (정상) * 0: down (비정상) |
Block Storage(VM)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Blockstorage 볼륨 상태 | * 1: running (정상) * 0: down (비정상) |
Database 유형
PostgreSQL(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | postgres 프로세스 PID | * PID: postgres 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
MariaDB(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Safe PID | mariadb_safe 프로세스 PID | * PID: mariadb_safe 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
| Instance State [PID] | mariadb 프로세스 PID | * PID: mariadb 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
MySQL(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | mysqld 프로세스 PID | * PID: mysqld 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
Microsoft SQL Server(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [Cluster] | MSSQL 클러스터 구성 시 상태 | * PID: mssql 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
| Instance State [PID] | sqlservr.exe 프로세스 pid | * Microsoft SQL Server의 경우 secondary 서버도 PID가 기동되어 있으므로 PID 만으로 상태 확인불가 |
EPAS(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | postgres 프로세스 PID | * PID: postgres 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
CacheStore(DBaaS)
Redis
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Redis-server 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
| Sentinel State [PID] | Sentinel 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
Valkey
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Valkey-server 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
| Sentinel State [PID] | Sentinel 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
Data Analytics 유형
Event Streams
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| AKHQ State [PID] | akhq 프로세스 PID | * PID: akhq 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
| Instance State [PID] | kafka 프로세스 PID | * PID: kafka 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
| Zookeeper State [Pid] | zookeeper 프로세스 PID | * PID: zookeeper 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
Search Engine
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Elasticsearch 프로세스 PID | * PID: Elasticsearch 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
| Kibana State [PID] | Kibana 프로세스 PID | * PID: Kibana 프로세스가 존재할 경우 * -1: 프로세스가 존재하지 않을 경우 |
Elasticsearch
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Elasticsearch 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
| Kibana State [PID] | Dashboard 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
Opensearch
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Opensearch 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
| Dashboard State [PID] | Dashboard 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
Vertica(DBaaS)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State [PID] | Vertica 프로세스 PID | * -1: 프로세스가 존재하지 않을 경우 |
Container 유형
Kubernetes Engine
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | cluster 상태 | * 1: 상태 점검 쿼리 sum(up{job=““kubernetes-apiservers””})의 리턴 값이 0 초과 일 경우 * 0: 상태 점검 쿼리 sum(up{job=““kubernetes-apiservers””}) 의 리턴값이 0 이하 일 경우 |
Container Registry
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Container Registry 상태 | * 1: running (정상) * 0: down (비정상) |
Networking 유형
Internet Gateway
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Load Balancer(OLD)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Load Balancer의 상태 | API 호출 결과값 중 provisioning_status로 판단함 * 1: ACTIVE * 0: ETC |
Load Balancer Listener(OLD)
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Load Balancer Listener의 상태 | API 호출 결과값 중 provisioning_status로 판단함 * 1: ACTIVE * 0: ETC |
Load Balancer
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Load Balancer의 상태 | API 호출 결과값 중 provisioning_status로 판단함 * 1: ACTIVE * 0: ETC |
Load Balancer Listener
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Load Balancer Listener의 상태 | API 호출 결과값 중 provisioning_status로 판단함 * 1: ACTIVE * 0: ETC |
Load Balancer Server Group
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Load Balancer Server Group의 상태 | API 호출 결과값 중 provisioning_status로 판단함 * 1: ACTIVE * 0: ETC |
Direct Connect
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| N/A | N/A | N/A |
Cloud WAN
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Attachment 연결 상태 | * 0: down * 1: up * 2: testing * 3: unknown |
Global CDN
| 성능 항목명 | 설명 | 값 |
|---|---|---|
| Instance State | Global CDN 상태 | * 1: running (정상) * 0: down (비정상) |
3 - API Reference
4 - Release Note
Cloud Monitoring
- 2025년 7월 Cloud Monitoring과의 연계 서비스를 추가하였습니다.
- 추가 연계 서비스: Compute(Multi-node GPU Cluster [Cluster Fabric], Multi-node GPU Clutser [Node]), Storage(Block Storage(BM), Block Storage(VM)), Networking(Cloud WAN, Global CDN), Database(Valkey), Data Analytics(Opensearch, Vertica(DBaaS))
- 2025년 2월 Cloud Monitoring과의 연계 서비스를 추가하였습니다.
- 추가 연계 서비스: Container(Container Registry), Database(EPAS, Microsoft SQL Server), Data Analytics(Event Streams, Search Engine), Networking(Load Balancer, Load Balancer Listener, Load Balancer Server Group, VPN)
- Cloud Monitoring 서비스를 출시하였습니다. 운영중인 인프라 리소스들의 사용 현황과 변경 정보를 수집하여, 설정된 임계치 초과 시 이벤트 발생/통보를 통해 안정적인 클라우드 운영 환경을 지원합니다.