Overview

서비스 개요

GPU Server는 CPU, GPU, 메모리 등 서버에서 제공하는 인프라 자원을 개별 구매할 필요 없이, 필요한 시점에 필요한 만큼 자유롭게 할당 받아 사용할 수 있는 가상화 컴퓨팅 서비스 입니다. 클라우드 환경에서 AI모델 실험, 예측, 추론 등 빠른 연산 속도를 필요로 하는 업무에 적합하며, 업무 유형 및 규모에 따라 최적화 된 성능의 자원을 유연하게 선택하여 이용할 수 있습니다. GPU Server는 다음과 같은 기능을 제공하고 있습니다.

제공 기능

GPU Server 관리: 웹 기반 Console을 통해 GPU Server 프로비저닝부터 모니터링, 빌링까지 사용자가 직접 Self Service로 생성, 삭제 및 변경을 관리할 수 있습니다.
GPU 수량별 상품 제공: 프로젝트 용도 및 규모 등에 따라 H100/A100 GPU의 수량을 자유롭게 선택하여 가상 서버를 구성할 수 있습니다.
고성능 GPU 제공: Pass-through 방식을 사용하여 물리서버 수준의 고성능 GPU 서버를 제공합니다.
스토리지 연결: OS 디스크 외 추가 연결 스토리지를 제공 합니다. Block Storage, File Storage, Object Storage 를 연결하여 사용할 수 있습니다.
강력한 보안적용: Security Group 서비스를 통해 외부 인터넷이나 다른 VPC(Virtual Private Cloud)와 주고받는 Inbound/Outbound 트래픽을 제어하여 서버를 안전하게 보호합니다.
모니터링: 컴퓨텅 자원에 해당하는 CPU, Memory, Disk 및 GPU의 현황 등의 모니터링 정보를 Cloud Monitoring 서비스를 통해 확인할 수 있습니다.
네트워크 설정 관리: 서버의 서브넷/IP는 최초 생성시 설정된 값을 간편하게 변경 가능합니다. NAT IP는 필요에 따라 사용/해지를 설정할 수 있는 관리기능을 제공하고 있습니다.
Key Pair 방식: 안전한 OS접속 방식을 위해 ID/PW의 접속이 아니라 Key Pair 방식을 제공합니다.
Image 관리: Custom Image를 생성 및 관리할 수 있고, 프로젝트간 공유 기능을 제공합니다.
ServiceWatch 서비스 연계 제공: ServiceWatch 서비스를 통해 데이터를 모니터링할 수 있습니다.

구성 요소

GPU Server는 가상화 컴퓨팅 자원 위에 GPU와 NVSwitch 및 NVLink가 제공됩니다.

주의

NVSwitch는 단일 GPU Server에 8개의 GPU를 할당한 인스턴스 타입의 경우에만 활성화하여 사용 가능합니다.

GPU Type별 사양

GPU (Graphic Processing Unit)는 컴퓨터 화면을 구성 이미지를 만들기 위해 필요한 계산을 수행하는 역할로 병렬 처리에 특화되어있어 많은 양의 데이터를 빠르게 처리할 수 있어 인공지능(AI), 데이터 분석 등 대규모 병렬 연산을 처리합니다.
GPU Server 서비스에서 제공하는 GPU Type의 사양은 다음과 같습니다.

구분	A100 Type	H100 Type	B300 Type
GPU Architecture	NVIDIA Ampere	NVIDIA Hopper	NVIDIA Blackwell Ultra
GPU Memory	80 GiB	80 GiB	268 GiB
GPU Transistors	54 billion 7N TSMC	80 billion 4N TSMC	208 billion 4NP TSMC
FP16 Tensor Core (Dense)	312 TFLOPs	989 TFLOPs	2.25 PFLOPs
FP8 Tensor Core (Dense)	미지원	1,979 TFLOPs	4.5 PFLOPs
FP4 Tensor Core (Dense)	미지원	미지원	13.5 PFLOPs
GPU Memory Bandwidth	2,039 GB/s HBM2e	3,352 GB/s HBM3	8 TB/s HBM3e
NVLink 성능	NVLink 3	NVLink 4	NVLink 5
NVLink Signaling Rate	25 GB/s (x12)	25 GB/s (x18)	50 GB/s (x18)
NVSwitch GPU간 대역폭	600 GB/s	900 GB/s	1.8 TB/s
총 NVSwitch 집계 대역폭	4.8 TB/s	7.2 TB/s	14.4 TB/s

표. GPU Type별 사양

NPU Type별 사양

NPU (Network Processing Unit)는 AI 추론 연산에 특화된 프로세서로써 높은 처리량과 전력 효율을 기반으로 생성형 AI 및 다양한 AI 추론 워크로드를 수행합니다. GPU Server 서비스에서 제공하는 NPU Type의 사양은 다음과 같습니다.

구분	Furiosa RNGD
Architecture	Tensor Contraction Processer
BF16	256 TFLOPS
FP8	512 TFLOPS
Memory Bandwidth	HBM3 1.5 TB/s
Memory Capacity	HBM3 48 GB
Interconnect Interface	PCIe Gen5 x16

표. NPU Type별 사양

서버 타입

GPU Server에서 제공하는 서버 타입은 다음과 같습니다. GPU Server에서 제공하는 서버 타입에 대한 자세한 설명은 GPU Server 서버 타입을 참고하세요.

구분	서버 타입	CPU vCore	Memory(GB)	GPU/NPU 수량
GPU-A100-1	g1v16a1	16	234	1
GPU-A100-1	g1v32a2	32	468	2
GPU-A100-1	g1v64a4	64	936	4
GPU-A100-1	g1v128a8	128	1,872	8
GPU-H100-2	g2v12h1	12	234	1
GPU-H100-2	g2v24h2	24	468	2
GPU-H100-2	g2v48h4	48	936	4
GPU-H100-2	g2v96h8	96	1,872	8
GPU-B300-3	g3v16b1	16	480	1
GPU-B300-3	g3v32b2	32	960	2
GPU-B300-3	g3v64b4	64	1,920	4
GPU-B300-3	g3v128b8	128	3,840	8
NPU-RNGD-1	n1v8r1	8	106	1
NPU-RNGD-1	n1v16r2	16	212	2
NPU-RNGD-1	n1v32r4	32	424	4
NPU-RNGD-1	n1v64r8	64	848	8

표. GPU Server 서버 타입

OS 및 드라이버 버전

GPU Server에서 지원하는 운영체제(OS)는 다음과 같습니다. 특정 GPU 버전 이상부터 B300 타입의 GPU를 지원하니 이미지 선택에 유의하시기 바랍니다.

OS	OS 버전	드라이버 버전	서버 타입 구분
Ubuntu	24.04	ND 580.126.20	GPU-B300-3, GPU-H100-2, GPU-A100-1
Ubuntu	24.04	ND 570.195.03	GPU-H100-2, GPU-A100-1
Ubuntu	24.04	FRD 2026.2.0	NPU-RNGD-1
Ubuntu	22.04	ND 535.183.06	GPU-H100-2, GPU-A100-1
RHEL	9.6	ND 580.126.20	GPU-B300-3, GPU-H100-2, GPU-A100-1
RHEL	8.1	ND 580.126.20	GPU-B300-3, GPU-H100-2, GPU-A100-1
RHEL	8.1	ND 535.183.06	GPU-H100-2, GPU-A100-1

표. GPU Server OS 및 드라이버 버전

선행 서비스

본 서비스를 생성하기 전에 미리 설치가 되어야 하는 서비스입니다. 사전에 안내된 사용자 가이드를 참고하여 준비해주세요.

서비스 카테고리	서비스	상세 설명
Networking	VPC	클라우드 환경에서 독립된 가상 네트워크를 제공하는 서비스
Networking	Security Group	서버의 트래픽을 제어하는 가상 방화벽

표. GPU Server 선행 서비스

Release Note

서버 타입