Overview

서비스 개요

GPU Server는 CPU, GPU, 메모리 등 서버에서 제공하는 인프라 자원을 개별 구매할 필요 없이, 필요한 시점에 필요한 만큼 자유롭게 할당 받아 사용할 수 있는 가상화 컴퓨팅 서비스 입니다. 클라우드 환경에서 AI모델 실험, 예측, 추론 등 빠른 연산 속도를 필요로 하는 업무에 적합하며, 업무 유형 및 규모에 따라 최적화 된 성능의 자원을 유연하게 선택하여 이용할 수 있습니다. GPU Server는 다음과 같은 기능을 제공하고 있습니다.

제공 기능

GPU Server 관리: 웹 기반 Console을 통해 GPU Server 프로비저닝부터 모니터링, 빌링까지 사용자가 직접 Self Service로 생성, 삭제 및 변경을 관리할 수 있습니다.
GPU 수량별 상품 제공: 프로젝트 용도 및 규모 등에 따라 H100/A100 GPU의 수량을 자유롭게 선택하여 가상 서버를 구성할 수 있습니다.
고성능 GPU 제공: Pass-through 방식을 사용하여 물리서버 수준의 고성능 GPU 서버를 제공합니다.
스토리지 연결: OS 디스크 외 추가 연결 스토리지를 제공 합니다. Block Storage, File Storage, Object Storage 를 연결하여 사용할 수 있습니다.
강력한 보안적용: Security Group 서비스를 통해 외부 인터넷이나 다른 VPC(Virtual Private Cloud)와 주고받는 Inbound/Outbound 트래픽을 제어하여 서버를 안전하게 보호합니다.
모니터링: 컴퓨텅 자원에 해당하는 CPU, Memory, Disk 및 GPU의 현황 등의 모니터링 정보를 Cloud Monitoring 서비스를 통해 확인할 수 있습니다.
네트워크 설정 관리: 서버의 서브넷/IP는 최초 생성시 설정된 값을 간편하게 변경 가능합니다. NAT IP는 필요에 따라 사용/해지를 설정할 수 있는 관리기능을 제공하고 있습니다.
Key Pair 방식: 안전한 OS접속 방식을 위해 ID/PW의 접속이 아니라 Key Pair 방식을 제공합니다.
Image 관리: Custom Image를 생성 및 관리할 수 있고, 프로젝트간 공유 기능을 제공합니다.
ServiceWatch 서비스 연계 제공: ServiceWatch 서비스를 통해 데이터를 모니터링할 수 있습니다.

구성 요소

GPU Server는 가상화 컴퓨팅 자원 위에 GPU와 NVSwitch 및 NVLink가 제공됩니다.

주의

NVSwitch는 단일 GPU Server에 8개의 GPU를 할당한 인스턴스 타입의 경우에만 활성화하여 사용 가능합니다.

GPU(A100/H100)

GPU(Graphic Processing Unit)는 컴퓨터 화면을 구성 이미지를 만들기 위해 필요한 계산을 수행하는 역할로 병렬 처리에 특화되어있어 많은 양의 데이터를 빠르게 처리할 수 있어 인공지능(AI), 데이터 분석 등 대규모 병렬 연산을 처리합니다. 다음은 GPU Server 서비스에서 제공하는 GPU Type의 사양입니다.

구분	A100 Type	H100 Type
서비스 제공 방식	Pass-through	Pass-through
GPU Architecture	NVIDIA Ampere	NVIDIA Hopper
GPU Memory	80GB	80GB
GPU Transistors	54 billion 7N TSMC	80 billion 4N TSMC
GPU Tensor Performance (FP16 기준, *: With Sparsity)	312 TFLOPs, 624* TFLOPs	989.4 TFLOPs, 1,978.9* TFLOPs
GPU Memory Bandwidth	2,039 GB/sec HBM2e	3,352 GB/sec HBM3
GPU CUDA Cores	6,912 Cores	16,896 Cores
GPU Tensor Cores	432 (3rd Generation)	528 (4th Generation)
NVLink 성능	NVLink 3	NVLink 4
총 NVLink 대역폭	600 GB/s	900 GB/s
NVLink Signaling Rate (단방향)	25 GB/s (x12)	25 GB/s (x18)
NVSwitch 성능	NVSwitch 2	NVSwitch 3
NVSwitch GPU간 대역폭	600 GB/s	900 GB/s
총 NVSwitch 집계 대역폭	4.8 TB/s	7.2 TB/s
연계 스토리지	Block Storage - SSD	Block Storage - SSD

표. GPU Type 사양

서버 타입

GPU Server에서 제공하는 서버 타입은 다음과 같습니다. GPU Server에서 제공하는 서버 타입에 대한 자세한 설명은 GPU Server 서버 타입을 참고하세요.

구분	서버 타입	CPU vCore	Memory(GB)	GPU수량
GPU-A100-1	g1v16a1	16	234	1
GPU-A100-1	g1v32a2	32	468	2
GPU-A100-1	g1v64a4	64	936	4
GPU-A100-1	g1v128a8	128	1872	8
GPU-H100-2	g2v12h1	12	234	1
GPU-H100-2	g2v24h2	24	468	2
GPU-H100-2	g2v48h4	48	936	4
GPU-H100-2	g2v96h8	96	1872	8

표. GPU Server 서버 타입

OS 및 GPU 드라이버 버전

GPU Server에서 지원하는 운영체제(OS)는 다음과 같습니다.

OS	OS 버전	GPU 드라이버버전
Ubuntu	22.04	535.183.06
RHEL	8.10	+ND 535.183.06

표. GPU Server OS 및 GPU 드라이버 버전

선행 서비스

본 서비스를 생성하기 전에 미리 설치가 되어야 하는 서비스입니다. 사전에 안내된 사용자 가이드를 참고하여 준비해주세요.

서비스 카테고리	서비스	상세 설명
Networking	VPC	클라우드 환경에서 독립된 가상 네트워크를 제공하는 서비스
Networking	Security Group	서버의 트래픽을 제어하는 가상 방화벽

표. GPU Server 선행 서비스

Release Note

서버 타입