NVIDIA Datacenter GPU > NVIDIA A40™
NVIDIA A40™ 엔비디아코리아 정품
Ampere Architecture
CUDA Cores - 10752
RT Cores - Gen 2 84
Tensor Cores - Gen 3 336
GPU Memory 48 GB GDDR6 ECC
Memory Interface 384-bit
Memory Bandwidth 696 GB/s
NVLink 2-Way, 2-Slot, 112.5 GB/s Bidirectional
System Interface PCIe 4.0 x16
Display Connectors 3x DisplayPort 1.4, Off by Default
Thermal Solutions Passive
Maximum Power Consumption 300 W
데이터시트 다운

리더스시스템즈에서 제공하는 데이터 센터를 위한 맞춤형 솔루션

워크스테이션 딥 러닝 솔루션
딥 러닝 워크스테이션 솔루션을 통해 작업 공간에서 편리하게 AI 슈퍼 컴퓨팅 성능을 활용하고 NGC에서 필요한 모든 딥 러닝 소프트웨어를 사용할 수 있습니다. 이제 딥 러닝을 필요로 하는 누구든지 데스크 사이드 딥 러닝을 시작할 수 있습니다.
딥러닝 솔루션 바로가기 >
GPU 클라우드 컴퓨팅 솔루션
모든 엔터프라이즈에서 물리적 데이터센터를 구축할 필요 없이 손쉽게 대규모 컴퓨팅 성능에 액세스할 수 있습니다. AI, 고성능 컴퓨팅(HPC) 및 의료 영상 활용, 차세대 그래픽 기술 적용 등 워크로드 전반에서 최고 성능을 경험할 수 있습니다.
클라우드 컴퓨팅 솔루션 바로가기 >
온 프레미스 딥 러닝 솔루션
GPU 가속 데이터센터는 원하는 규모와 더 적은 수의 서버로 컴퓨팅 및 그래픽 워크로드에 혁신적인 성능을 제공하여 더 빠르게 정보를 얻고 비용을 획기적으로 절감할 수 있습니다. 가장 복잡한 딥 러닝 모델을 트레이닝하여 가장 심각한 문제를 해결하세요.
온 프레미스 솔루션 바로가기 >
엣지 컴퓨팅 솔루션
현대 기업은 이제 수 십억 개의 IoT 센서를 통해 생성 된 데이터를 활용해 더 빠른 통찰력과 시간과 비용 절감을 할 수 있습니다. 실시간으로 결정을 내리고 강력하고 분산 된 컴퓨팅과 안전하고 간단한 원격 관리 및 업계 최고 기술과의 호환성을 기대할 수 있습니다.
엣지 컴퓨팅 솔루션 바로가기 >

비교할 수 없는 가속화를 제공하는 Ampere 아키텍쳐

NVIDIA Ampere 아키텍처 CUDA® 코어
단정밀도 부동 소수점(FP32) 연산 및 향상된 전력 효율성을 위한 2배 속도 처리는 복잡한 3D CAD(Computer-Aided Design) 및 CAE(Computer-Aided Engineering)와 같은 그래픽 및 시뮬레이션 워크플로우 성능을 크게 향상시킵니다.
가상화 지원
NVIDIA 가상 GPU(vGPU) 소프트웨어를 통한 차세대 개선 기능으로 원격 사용자를 위한 보다 대규모의 더욱 강력한 가상 워크스테이션 인스턴스가 가능하여 하이엔드 원격 디자인, AI 및 컴퓨팅 워크로드가 지원됩니다.
2세대 RT 코어
이전 세대에 비해 2배에 달하는 처리량과 고급 음영 처리 또는 노이즈 제거와 레이 트레이싱을 동시에 실행하는 기능을 갖춘 2세대 RT 코어는 영화 콘텐츠의 사실적인 렌더링, 건축 디자인 평가, 제품 디자인의 가상 프로토타입 제작과 같은 워크로드의 속도를 엄청나게 높여줍니다. 이 기술은 레이 트레이싱 모션 블러의 렌더링 속도도 높여 더욱 뛰어난 시각적 정확도로 더욱 빠른 결과를 얻을 수 있습니다.
3세대 NVIDIA NVLink®
최대 2개의 A40 GPU를 한데 연결하여 48GB의 GPU 메모리를 96GB로 확장할 수 있습니다. GPU 간 인터커넥트 대역폭이 증가되어 그래픽 및 컴퓨팅 워크로드를 가속화하고 보다 규모가 큰 데이터 세트를 처리하는 하나의 확장 가능 메모리를 제공합니다. 보다 컴팩트한 새로운 NVLink 커넥터는 더욱 광범위한 서버에서 기능을 지원합니다.
48GB의 GPU 메모리
NVLink를 통해 최대 96GB로 확장 가능한 초고속 GDDR6 메모리는 데이터 사이언티스트, 엔지니어 및 크리에이티브 전문가에게 데이터 사이언스 및 시뮬레이션과 같은 대규모 데이터 세트 및 워크로드로 작업하는 데 필요한 대용량 메모리를 제공합니다.
데이터센터 효율성 및 보안
듀얼 슬롯, 전력 효율적 디자인을 갖춘 NVIDIA A40은 이전 세대보다 전력 효율성이 2배 높고 전 세계 OEM 광범위한 워크스테이션에 적합하도록 제작되었습니다. GPU 내 하드웨어 RoT(Root of Trust) 기술을 이용한 안전하고 신중한 부팅은 데이터센터에 한층 더 강화된 보안을 제공합니다.
3세대 Tensor 코어
새로운 Tensor Float 32(TF32) 정밀도는 이전 세대에 비해 5배의 트레이닝 처리량을 제공하여 코드를 변경하지 않아도 AI 및 데이터 사이언스 모델 트레이닝을 가속화합니다. 구조적 희소성에 대한 하드웨어 지원은 추론을 위한 처리량을 두 배로 높입니다. Tensor 코어는 또한 DLSS, AI 노이즈 제거 및 일부 애플리케이션에 대한 향상된 편집 기능과 같은 기능을 통해 그래픽에도 AI를 지원합니다.
PCI Express Gen 4
이전 세대 대비 대역폭을 2배로 증가시켜 AI, 데이터 사이언스와 같은 데이터 집약적인 작업을 위한 CPU 메모리의 데이터 전송 속도를 개선하며 더욱 빠른 PCIe 성능으로 GPU DMA 전송을 가속화하여 GPUDirect® for Video 지원 디바이스와 GPU 간 영상 데이터 I/O 통신 속도를 높여 라이브 방송을 위한 강력한 솔루션을 제공합니다. A40는 PCIe Gen 3와 호환되므로 유연한 배포가 가능합니다.

데스크톱 워크스테이션을 위한 차세대 디자인과 몰입감 높은 엔터테인먼트

NVIDIA A40에는 베젤 보정이 포함된 NVIDIA Mosaic, NVIDIA의 Warp 및 Blend SDK가 지원되어 대규모 CAVE(Cave Automatic Virtual Environment), 다중 8K 모니터, 비디오 월 및 위치 기반 엔터테인먼트 배포가 가능합니다. 또한 대규모 디스플레이 경험, VR, 방송 등급 스트리밍 등에 필요한 성능과 기능이 결합되어 있습니다.
몰입감 높은 VR
최고 해상도 헤드 장착 디스플레이(HMD)에서 최고로 몰입감 높은 증강현실(AR) 및 가상현실(VR) 경험을 지원합니다. 4Way VR SLI는 최고 성능을 지원하여 각 눈에 2개의 NVLink 연결 GPU를 할당합니다.
Quadro Sync II
단일 시스템에서 2개의 Sync II 보드로 연결된 8개의 GPU를 통해 최대 32개 디스플레이 및 이미지 출력을 동기화하여, 고급 비디오 시각화 환경 구성에 필요한 기기의 수를 줄여줍니다.
무제한 영상 스트림
전용 영상 인코딩 및 디코딩 엔진을 통해 방송, 보안 및 영상 제공을 위한 멀티 스트림 영상 애플리케이션에 필요한 성능 및 보안을 누릴 수 있습니다. 7세대 NVENC는 가장 까다로운 4K 또는 8K 비디오 인코딩 작업이 가능하며 5세대 NVDEC 엔진을 통해 실시간 디코딩이 가능합니다.
몰입감 높은 VR
가속화된 그래픽 및 증가된 디스플레이 대역폭으로 최고 해상도 헤드 장착 디스플레이(HMD)에서 최고로 몰입감 높은 증강현실(AR) 및 가상현실(VR) 경험을 지원합니다. 4Way VR SLI는 최고 성능을 지원하여 각 눈에 2개의 NVLink 연결 GPU를 할당합니다.
전문 시각화용 NVIDIA EGX 서버
렌더링과 가상화부터 엔지니어링 분석과 데이터 사이언스에 이르기까지 전문 시각화를 위한 NVIDIA® EGX™ 서버를 통해 어느 디바이스에서든 여러 개의 워크로드를 가속화하세요. 이 NVIDIA-Certified System™은 하이엔드 NVIDIA GPU와 NVIDIA vGPU(가상 GPU) 소프트웨어와 NVIDIA 고성능 네트워킹을 결합한 매우 유연한 레퍼런스 디자인으로, 탁월한 그래픽과 컴퓨팅 성능을 제공하므로 아티스트가 CPU 기반 솔루션에 비해 현저히 적은 비용, 공간, 전력으로 어디서든 최고의 결과를 낼 수 있도록 지원합니다.
NVIDIA NVLink 브리지로 메모리와 성능을 쉽게 확장
NVLink는 전문 애플리케이션의 멀티 GPU 구성을 통해 메모리와 성능을 쉽게 확장할 수 있게 합니다. 다양한 시스템에 맞는 로우 프로파일 디자인을 갖춘 NVIDIA NVLink 브리지를 통해 2개의 NVIDIA A40을 연결할 수 있습니다.

최신 데이터센터의 핵심을 확인해보세요. NVIDIA GPU 가속화된 서버 플랫폼

  • AI 트레이닝
    딥 러닝 신경망이 복잡해짐에 따라, AI 트레이닝 시간이 상당히 증가하면서 생산성이 저하되고 비용은 증가하게 되었습니다. NVIDIA GPU는 트레이닝을 가속화하여 보다 짧은 기간에 깊이 있는 정보를 얻음으로써 비용 및 기간을 단축하도록 합니다.
  • AI 추론
    추론은 트레이닝을 마친 신경망이 실질적으로 역할을 수행하는 영역입니다. 이미지, 음성, 비주얼 및 동영상 검색과 같은 새로운 데이터 요소가 등장함에 따라 추론은 수많은 AI 서비스의 중심에서 그에 대한 대답과 추천을 제공합니다.
  • 고성능 컴퓨팅(HPC)
    광범위한 분야에서 700개 이상의 애플리케이션이 GPU 컴퓨팅에 의해 가속화되며 이러한 애플리케이션을 개발, 최적화 및 배포하는데 C, C++, Fortran 및 Python 등의 인기 있는 언어가 사용되어 과학적 발견의 길을 닦고 있습니다.
  • 그래픽스
    AI, 실시간 레이 트레이싱, 그래픽 기술의 발전으로 IT 팀은 CPU 기반 솔루션이 요구하는 가장 효율적인 비용, 공간, 전력 요구 사항에 맞춰 광범위한 워크로드를 처리할 수 있는 서버를 배포할 수 있습니다.

엔터프라이즈급 성능과 최적화된 소프트웨어 환경

NVIDIA® CUDA®
병렬 컴퓨팅 플랫폼
C/C++ 및 Fortran과 같은 표준 프로그래밍 언어와 OpenCL, Open ACC, Direct Compute와 같은 API를 기본적으로 실행하여 레이 트레이싱, 비디오 및 이미지 처리, 유체 역학 계산 등의 기술을 가속화할 수 있습니다.
AI에 최적화 된 소프트웨어
Caffe2, MXNet, CNTK, 텐서플로우 등과 같은 딥러닝 프레임워크는 훨씬 더 빠른 교육 시간과 더 높은 멀티노드 교육 성능을 제공한다. GPU 가속 라이브러리(예: CuDNN, cuBLAS, Tensor)RT는 딥러닝 추론과 고성능 컴퓨팅(HPC) 애플리케이션 모두에서 더 높은 성능을 제공합니다.
가상화를 위한
가상 GPU 소프트웨어
NVIDIA AI Enterprise for VMware 및 NVIDIA Virtual Compute Server(vCS) 지원으로 고성능 컴퓨팅, AI, 데이터 과학, 빅데이터 분석, HPC 애플리케이션 등의 가상화 컴퓨팅 워크로드 가속화합니다.
통합 메모리
단일의 매끄러운 49비트 가상 주소 공간을 통해 CPU와 GPU 메모리의 전체 할당 간에 데이터를 투명하게 마이그레이션할 수 있습니다.

Specifications

Architecture
Ampere
GPU Memory
48 GB GDDR6 with ECC
Memory Bandwidth
696 GB/s
Interconnect interface
NVIDIA® NVLink® 112.5 GB/s (bidirectional) PCIe Gen4 31.5 GB/s (bidirectional)
CUDA cores
10,752
Tensor Cores
336
RT Cores
84
Peak FP32 TFLOPS(non-Tensor)
37.4
Peak FP16 Tensor TFLOPS
with FP16 Accumulate
149.7 | 299.4*
Peak TF32 Tensor TFLOPS
74.8 | 149.6*
RT Core performance TFLOPS
73.1
Peak BF16 Tensor TFLOPS with
FP32 Accumulate
149.7 | 299.4*
Peak INT8 Tensor TOPS
Peak INT4 Tensor TOPS
299.3 | 598.6* / 598.7 | 1,197.4*
Form factor(mm)
111 x 268, Dual Slot
Display ports
3x DisplayPort 1.4** (Supports NVIDIA Mosaic and Quadro® Sync)
Max power consumption
300 W
Power connector
8-pin CPU
Thermal solution
Passive
NVENC | NVDEC
1x | 2x (includes AV1 decode)
Feature
Secure and measured boot with hardware root of trust
NEBS ready
Level 3
NVENC | NVDEC
1x | 2x (includes AV1 decode)
MIG support
No
vGPU profiles supported
See the Virtual GPU Licensing Guide
vGPU Software Support
NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps)
NVIDIA RTX Virtual Workstation (vWS), NVIDIA Virtual Compute Server (vCS)
Graphics APIs
DirectX 12, Shader Model 5, OpenGL 4.6, Vulkan 1.18
Compute APIs
CUDA, DirectCompute, OpenCL™, OpenACC®

Information

상품명
NVIDIA A40 Tensor Core GPU
KC 인증번호
R-R-NVA-PG133C
최대소비전력
165 W
정품 품질 보증
3년 무상보증
출시년월
2021/04
제조사
NVIDIA Corporation
제조국
China
크기
111 x 268, Dual Slot

제품문의

제품과 관련하여 궁금하신 사항을
문의하기를 통해 해결하세요.

문의 바로가기

기술지원 문의

A/S 서비스 및 기술지원 관련하여
궁금하신 사항을 문의하기를 통해 해결하세요.

문의 바로가기

교육문의

딥러닝 교육 및 트레이닝 관련하여
궁금하신 사항을 문의하기를 통해 해결하세요.

문의 바로가기