서비스 개요
Cloud Monitoring 서비스는 운영중인 인프라 리소스의 사용 현황과 변경 정보, 로그를 수집하여, 설정된 임계치를 초과할 경우 이벤트를 발생시켜 통보합니다. 이를 통해 사용자는 성능 저하 및 장애에 신속하게 대응할 수 있으며, 안정적인 컴퓨팅 환경 구성을 위해 리소스 용량 확대 계획을 편리하게 수립할 수 있습니다.
제공 기능
Cloud Monitoring은 다음과 같은 기능을 제공하고 있습니다.
- 안정적인 컴퓨팅 자원 관리: CPU 사용률, 디스크 사용률, 메모리 사용률 등의 지표를 간편하게 확인할 수 있습니다. 사용중인 자원에서 이벤트 발생시 지정된 대상자에게 자동으로 알림이 통보되어 신속한 장애 분석과 대응이 가능하기 때문에 컴퓨팅 자원을 안정적으로 운영할 수 있습니다.
- 편리한 모니터링: 자원에 대한 상태 정보는 간편하게 대시보드를 생성해 모니터링 할 수 있습니다. 기본 대시보드 및 사용자 정의 대시보드를 제공하며, 다양한 형태의 위젯을 설정해 쉽고 빠르게 대시보드를 직접 생성할 수 있습니다.
- 이벤트 지표 관리: 웹 기반 Console을 통해 몇 번의 클릭만으로 손쉽게 이벤트 지표를 설정할 수 있습니다. 모니터링 대상의 이벤트 지표 설정 (이벤트 패턴, 발생조건, 발생주기, 성능지표, 운영상태 등)은 사용 환경에 맞게 다양하게 변경할 수 있으며 임계치 설정과 알람 설정을 편리하게 관리할 수 있습니다.
- 리소스 로그 관리: 리소스의 로그 데이터를 수집/저장하고, 필요 시 대상 로그에 대한 검색이 가능합니다. 또한 주요 키워드 대해 이벤트를 지표화하여 사전 설정된 조건 충족 시 지정된 담당자에게 자동 통보하여 보다 안정적인 사용 환경을 제공합니다.
구성 요소
대시보드
모니터링 대시보드에서는 모니터링 대상 서비스 및 자원에 대한 운영 현황과 이벤트 현황, 사용률 상위 항목 등을 확인할 수 있습니다.
| 항목 | 설명 |
|---|---|
| 리전 | 자원의 위치 |
| 데이터 기준 시간 | 대시보드에 표시된 데이터의 기준 시간 |
| 새로고침 | 대시보드를 현재 시간 기준으로 새로고침 |
| 기간 설정 | 데이터의 조회 기간 설정 및 새로고침 주기 변경 |
| 모니터링 현황 | Account 내 사용 중인 서비스별 모니터링 대상의 개수와 상태 |
| 이벤트 히스토리 | 최근 7일간 발생한 이벤트를 위험도별 그래프로 표시 |
| 성능별 사용률 Top 5 | 주요 성능별 사용률이 가장 높은 5개 모니터링 대상 표시 |
| 이벤트 맵 | 각 서비스의 이벤트 발생 개수를 위험도별로 표시 |
| 이벤트 현황 | 발생한 이벤트 중 처리되지 않은 이벤트 목록 표시 |
성능분석
성능 분석에서는 모니터링 대상의 주요 성능 항목을 확인하고 각 성능 항목의 현재 데이터와 기간내 이력을 확인할 수 있습니다. 사용자는 관리하는 모니터링 대상의 성능 현황을 서비스별 또는 기간별로 확인하고, 특정 성능을 비교하여 결과를 분석할 수 있습니다.
로그 분석
로그 분석에서는 모니터링 대상의 로그를 수집해 내용을 확인하고, 정형화 데이터인 지표로 변환해 모니터링할 수 있습니다. 모니터링 대상마다 기본 수집 로그가 제공되며, 사용자는 사용자 정의 로그를 생성하여 원하는 로그를 추가로 수집하고 확인할 수 있습니다.
이벤트 관리
이벤트란 모니터링 대상의 성능 값이 특정한 조건을 충족했을 때 그것을 사용자에게 알리기 위한 설정입니다. 이벤트를 설정하면 사용자가 반드시 알아야 하는 모니터링 정보를 놓치지 않고 파악할 수 있습니다. 예를 들어, 과부하와 관련된 성능값이 일정한 수치를 넘을 때마다 이벤트가 발생하도록 설정하면 해당 자원 운영 중 과부하 위험이 있을 때마다 사용자에게 알림이 전달됩니다. 사용자는 이를 토대로 문제가 발생하기 전에 미리 대응할 수 있습니다. 이벤트 관리에서는 이러한 이벤트를 생성하여 모니터링 중 특정한 값이 발생할 때마다 지정된 사용자에게 알리도록 설정할 수 있습니다.
선행 서비스
Cloud Monitoring은 선행 서비스가 없습니다.