더 빠른 예측을 통한 더 나은 의사 결정을 위한
가속화된 머신 러닝

Machine learning

머신 러닝은 비즈니스가 고객을 이해하고 더 나은 제품과 서비스를 구축하고 운영을 개선하는 데 도움을 줍니다. 가속화된 데이터 사이언스를 통해 비즈니스에서 그 어느 때보다 빠르게 솔루션을 반복하고 프로덕션화하면서 대규모 데이터세트를 활용하여 모델의 정확도를 개선할 수 있습니다.

비즈니스는 머신 러닝을 사용하여 제품, 서비스 및 운영을 개선합니다. 비즈니스는 대량의 과거 데이터를 활용하여 고객 행동을 예측하고 내부 프로세스를 개선하기 위한 모델을 구축할 수 있습니다. 머신 러닝은 엔터프라이즈에 놀라운 가치를 제공하지만 오늘날의 CPU 기반 방식은 복잡성과 오버헤드를 가중시켜 비즈니스의 투자 수익을 감소시킬 수 있습니다.

최적화된 하드웨어와 소프트웨어가 결합된 데이터 사이언스 가속화 플랫폼을 통해 기존에 존재하던 머신 러닝의 복잡성과 비효율성이 사라집니다. 이제 데이터 사이언티스트는 신속하게 기능을 반복하고, 대규모 데이터세트를 사용하여 고도로 정확한 예측을 도출하고, 프로덕션에 가치 창출 솔루션을 손쉽게 제공할 수 있습니다. 데이터 사이언티스트는 가장 널리 사용되는 Python 또는 Java 기반 API를 통해 GPU 가속화에 손쉽게 액세스할 수 있기 때문에 클라우드든 온프레미스든 상관없이 빠르게 시작할 수 있습니다.

비즈니스에서 가속 머신 러닝의 성능을 활용함으로써 데이터를 최대한 활용하는 데 필요한 도구를 제공하여 데이터 사이언티스트의 역량을 강화할 수 있습니다.

머신 러닝의 과제

모델 반복으로 인한 오버헤드 추가
반복은 결과가 나오기를 기다리며 컴퓨팅 성능을 더 많이 사용하는 것을 의미합니다. 반복이 더 나은 결과로 이어지기도 하지만 데이터 사이언스 팀은 종종 더 빠르게 솔루션을 제공하기 위해 반복 횟수에 제한을 두기도 합니다.
다운샘플링으로 모델의 정확도 감소
데이터 사이언스 팀에서 컴퓨팅 성능의 제한 때문에 데이터세트를 다운샘플링하여 결과의 정확도가 감소되고 차선의 비즈니스 의사 결정을 하게 되는 경우가 자주 있습니다.
모델 프로덕션화의 난제
모델을 프로덕션으로 전달하는 작업은 많은 시간이 걸리며 번거로운 데다 종종 상당한 양의 코드 리팩터링이 수반되어 사이클 시간이 늘어나고 가치 창출이 지연됩니다.

가속 머신 러닝의 이점

  • 대기 시간 감소
    CPU 기반 업계 표준보다 19배 빠른 솔루션으로 프로세스가 끝날 때까지 기다리는 시간은 줄이고 솔루션 반복과 테스트에 더 많은 시간을 할애할 수 있습니다.
  • 더 나은 결과
    고성능 처리 기능을 통해 테라바이트 단위의 데이터세트를 분석하여 더 정확한 결과를 도출하고 더 빠르게 보고할 수 있습니다.
  • 리팩터링 없음
    코드는 최소한만 변경하고 새로운 도구를 배우지 않고도 기존 데이터 사이언스 도구 체인을 가속화하고 확장할 수 있습니다.
  • 비용 절감
    CPU 기반 업계 표준보다 7배 비용 효율적인 솔루션을 갖춘 GPU 가속화로 예산을 최대한 활용할 수 있습니다.
  • 더 나은 의사 결정
    모든 데이터를 활용하여 더 나은 비즈니스 의사 결정을 내리고, 조직의 성과를 개선하고, 고객의 요구를 더 잘 충족할 수 있습니다.
  • 원활한 확장
    일관되고 직관적인 아키텍처로 데스크톱에서 멀티 노드, 멀티 GPU 클러스터로 손쉽게 확장할 수 있습니다.

머신 러닝 에코시스템의 발전

NVIDIA는 처음부터 새로운 모델을 구축하는 경우든, 중요한 비즈니스 지원 프로세스의 성능을 미세하게 조정하는 경우든 상관없이 비즈니스의 머신 러닝 운영을 가속화할 수 있는 솔루션을 제공합니다. NVIDIA는 비즈니스에서 데이터로부터 뛰어난 인사이트를 쉽게 얻을 수 있도록 고성능 머신 러닝에 최적화된 하드웨어와 소프트웨어를 결합하는 솔루션을 선사합니다. RAPIDS와 NVIDIA CUDA를 통해 데이터 사이언티스트는 NVIDIA GPU의 머신 러닝 파이프라인을 가속화하여 데이터 로딩, 프로세싱, 트레이닝과 같은 머신 러닝 작업 시간을 몇일에서 몇 분으로 단축할 수 있습니다. 익숙한 Python이나 Java 기반 언어를 통해 CUDA의 성능을 활용하여 손쉽게 가속 머신 러닝을 시작할 수 있습니다.

RAPIDS는 새로운 고성능 데이터 사이언스 에코시스템을 위한 기반을 제공하며 상호 운용성을 통해 진입 장벽을 낮춥니다. Apache Spark, cuPY, Dask, XGBoost 및 Numba 등의 선두적인 데이터 사이언스 프레임워크와 PyTorch, TensorFlow 및 Apache MxNet 등의 수많은 딥 러닝 프레임워크와의 통합은 채택의 폭을 넓히고 다른 프레임워크와의 통합을 장려합니다. GPU 가속화를 통해 RAPIDS 하이퍼 매개 변수 최적화(HPO) 및 RAPIDS Forest Inferencing Library(FIL)와 같은 머신 러닝 에코시스템 혁신 덕분에 이전에는 오랜 시간이 걸리던 작업이 몇 초면 가능해지고 있습니다.

  • 모든 워크로드 가속화
    NVIDIA A100 Tensor Core GPU는 AI, 데이터 분석 및 HPC를 위해 모든 규모에서 전례 없는 가속을 제공하여 세계에서 가장 어려운 컴퓨팅 문제를 해결합니다.
    자세히 알아보기 >
  • 전례 없는 컴퓨팅 성능
    NVIDIA DGX™ A100은 모든 AI 워크로드를 위한 범용 시스템으로, 세계 최초의 5페타플롭스 AI 시스템에서 전례 없는 컴퓨팅 밀도, 성능 및 유연성을 제공합니다.
    자세히 알아보기 >
  • 대규모 AI 성능
    세계 기록을 경신하는 혁신의 최전선에 있는 AI 프로젝트는 NVIDIA DGX™ 시스템을 기반으로 합니다. 업계의 선도적인 조직은 DGX를 사용하여 AI 이니셔티브를 강화하고 세상을 변화시킵니다.
    자세히 알아보기 >