리더스시스템즈는 다양한 행사와 경험을 통해
고성능 컴퓨팅과 AI의 발전을 위한 발판을 마련합니다

NVIDIA Elite Partner로 참여한 다양한 행사와 소식을 확인하세요.

게시물 내용
제목 차세대 AI 슈퍼컴퓨터 NVIDIA Rubin 플랫폼 공개 — AI 컴퓨팅 성능과 효율 혁신
내용


NVIDIA는 AI 연산의 새로운 기준을 세울 Rubin 플랫폼을 공식 발표했습니다. 

Rubin 플랫폼은 향후 AI 인프라의 핵심 역할을 수행하는 차세대 AI 슈퍼컴퓨터 아키텍처로, 기존 Blackwell 대비 AI 훈련과 추론 비용 및 연산 효율을 획기적으로 개선합니다. 


e1c3569630566f217dc1c0f615cbd880_1767679589_2792.png
 

✔︎ Rubin 플랫폼: AI 시대의 연산 혁신

Rubin 플랫폼은 NVIDIA가 설계한 6종의 첨단 AI 칩을 하나의 시스템으로 결합한 혁신적인 AI 컴퓨팅 아키텍처입니다.

주요 구성 요소는 다음과 같습니다:

6세대 NVIDIA NVLink: 오늘날 방대한 MoE 모델에 필수적인 빠르고 원활한 GPU 간 통신을 제공합니다. 각 GPU는6 TB/s의 대역폭을 지원하는데, Vera Rubin NVL72 랙은 전체 인터넷보다 큰 260 TB/s의 대역폭을 제공합니다. NVLink 6 스위치는 집합 연산을 위한 내장형 인-네트워크 컴퓨팅(in-network compute) 기능을 탑재했으며, 서비스 용이성과 탄력성을 향상시키는 신규 기능을 갖췄습니다. 대규모 AI 훈련과 추론 작업을 더 빠르고 효율적으로 실행하도록 지원합니다.

NVIDIA Vera CPU: NVIDIA에서는 Vera CPU를 위해 Olympus라는 코드명을 가진 차세대 맞춤형 Arm 아키텍처를 설계했습니다. 에이전틱 추론을 위해 설계된 NVIDIA Vera는 대규모 AI 팩토리를 위한 가장 전력 효율적인 CPU입니다. NVIDIA 맞춤형 올림푸스(Olympus) 코어 88개와 완벽한2 호환성, 초고속 NVLink-C2C 연결성을 갖췄습니다. Vera는 뛰어난 성능, 대역폭, 업계 최고의 효율성을 제공해 다양한 최신 데이터센터 워크로드를 지원합니다.

NVIDIA Rubin GPU각각 다수의 연산 코어와 텐서 코어를 갖춘 두 개의 레티클 다이로 구성되어 있습니다. 이 칩은 AI 집약적인 워크로드에 최적화되어 있으며, NVFP4 추론에서 50 FLOPs, NVFP4 학습에서 35 PFLOPs의 성능을 제공합니다. 이는 Blackwell 대비 각각 5배와 3.5배 향상된 수치입니다. 또한, 이 칩은 HBM4 메모리를 탑재하여 칩당 최대 22 TB/s의 대역폭(Blackwell 대비 2.8배 증가)과 CPU당 3.6 TB/s의 NVLink 대역폭(Blackwell 대비 2배 증가)을 제공합니다.

3세대 NVIDIA 컨피덴셜 컴퓨팅: Vera Rubin NVL72는 NVIDIA 컨피덴셜 컴퓨팅을 제공하는 최초의 랙 스케일 플랫폼입니다. CPU, GPU, NV링크 도메인 전반에 걸쳐 데이터 보안을 유지함과 동시에, 세계 최대 규모의 독점 모델, 훈련, 추론 워크로드를 철저히 보호합니다.

2세대 RAS 엔진: GPU, CPU, NVLink를 아우르는 Rubin 플랫폼은 실시간 상태 점검, 장애 대응, 선제적 유지보수 기능을 통해 시스템 생산성을 극대화합니다. 랙의 케이블 없는 모듈식 트레이 설계는 Blackwell 대비 최대 18배 빠른 조립과 서비스 속도를 구현합니다.

이 모든 요소는 고도의 공동 설계(extreme co-design) 로 통합되어 AI 연산의 병목을 제거하고 성능을 최적화합니다. 


✔︎ 성능 및 비용 효율의 획기적 개선

Rubin 플랫폼은 다음과 같은 AI 연산 성능 및 비용 효율 개선을 제공합니다:

추론 토큰 비용 최대 10배 감소

대규모 모델 훈련에 필요한 GPU 수 4배 절감

AI 연산 성능과 처리 속도 대폭 향상

이러한 성능 혁신은 특히 대형 언어 모델(LLM) 및 혼합 전문가 모델(MoE) 같은 고급 AI 워크로드에 강점을 제공합니다. 


✔︎ Rubin 기반 AI 슈퍼컴퓨터 솔루션

Rubin 플랫폼은 다양한 랙 스케일 솔루션로 구현됩니다:

Vera Rubin NVL72: 72개 Rubin GPU와 36개 Vera CPU를 갖춘 고집적 AI 슈퍼컴퓨터 솔루션

HGX Rubin NVL8: x86 서버 환경에 최적화된 AI 가속 플랫폼

이들 시스템은 데이터센터와 AI 팩토리에 최적화되어 안정적인 AI 연산과 확장성을 제공합니다. 


e1c3569630566f217dc1c0f615cbd880_1767679026_8316.png
 

Rubin 플랫폼은 성능, 효율, 확장성을 갖춘 AI 컴퓨팅 아키텍처로, 대규모 AI 연산 인프라의 핵심 역할을 수행할 것입니다. 고사양 AI 모델 연구 및 실서비스 환경에 있어 Rubin 기반 시스템은 AI 혁신을 가속화하는 솔루션으로 자리잡을 전망입니다. 


관련 키워드: 

#NVIDIA Rubin 플랫폼 #AI 슈퍼컴퓨터 #AI 인프라 #AI 연산 비용 절감 #차세대 AI 서버 #딥러닝 훈련 효율 #AI 토큰 비용

첨부파일