Fundamentals of Accelerated Computing with CUDA C/C++
(CUDA C/C++를 활용한 가속 컴퓨팅의 기초)

  • 교육시간

    1일 8시간

  • 언어

    한국어, 영어

  • 기술

    nvprof, nvpp

이미지

교육목적

이 교육에서는 CUDA® 기반의 초병렬 GPU에서 실행되도록 C/C++ 애플리케이션을 가속화하는 기본 도구와 기법을 설명합니다. 코드를 작성하고, CUDA를 사용하여 코드 병렬화를 구성하고, CPU와 GPU 가속기 간의 메모리 마이그레이션을 최적화하고, 새로운 작업에서 학습한 워크플로우를 구현함으로써 입자 시뮬레이터(완전하게 기능하지만 오직 CPU 전용)를 가속화하고 확연히 보이는 막대한 성능 향상을 달성하는 방법을 설명합니다. 워크숍을 마치면 새로운 GPU 가속 애플리케이션을 개발할 수 있도록 추가 리소스에 액세스할 수 있습니다.

  • 전제조건
    • 변수 유형, 루프, 조건문, 함수, 어레이 처리 등 기본 C++ 역량
    • CUDA 프로그래밍 사전 지식 필요 없음
  • 인증서

    평가를 성공적으로 완료한 참가자는 관련 분야에 대한 역량을 인정 받고, 전문적 커리어 성장을 지원하는 NVIDIA DLI 인증서를 받게 됩니다.

  • 사전준비 (하드웨어 요구 사항)

    최신 버전의 Chrome 또는 Firefox를 실행할 수 있는 데스크톱 또는 노트북을 준비한 참가자에게는 클라우드 상에서 완전하게 구성된 GPU 가속 서버에 접근할 수 있는 전용 권한이 주어집니다.

교육문의하기

학습목표

  • 01

    GPU 가속기로 실행할 코드 작성

  • 02

    CUDA를 사용하여 C/C++ 애플리케이션에서 데이터 및 명령어 수준 병렬 처리 제공 및 표현

  • 03

    CUDA 관리 메모리를 활용하고 비동기 프리패치를 사용하여 메모리 마이그레이션 최적화

  • 04

    명령 줄과 시각적 프로파일러를 활용하여 작업 안내

  • 05

    명령어 수준 병렬 처리에 동시 스트림 활용

  • 06

    GPU 가속 CUDA C/C++ 애플리케이션을 작성하거나 프로필 중심 접근 방법을 사용하여 기존의 CPU 전용 애플리케이션 리팩토링

NVIDIA | DEEP LEARNING INSTITUTE

교육개요

인트로(15분)
CUDA C/C++를 사용한
애플리케이션 가속화
(120분)
CUDA를 사용하여 GPU 지원 C/C++ 애플리케이션을 작성할 수 있는 필수 구문 및 개념 알아보기
  • · GPU 코드 작성, 컴파일 및 실행하기
  • · 병렬 스레드 계층 제어하기
  • · GPU용 메모리 할당 및 해제하기
휴식 (60분)
CUDA C/C++를 사용하여 가속화 애플리케이션 메모리 관리 (120분)
명령줄 프로파일러 및 CUDA 관리 메모리에 대해 알아봅니다.
관찰에 기반한 애플리케이션 개선 및 관리되는 메모리 동작의 깊이 있는 이해에 초점을 맞춥니다.
  • · 명령 줄 프로파일러를 사용하여 CUDA 코드 프로파일링하기
  • · 통합 메모리를 심층적으로 이해하기
  • · 통합 메모리 관리를 최적화하기
휴식 (15분)
CUDA C/C++를 통한
가속화 애플리케이션의 비동기 스트리밍 및 시각적 프로파일링 (120분)
개선된 메모리 관리 및 명령어 수준의 병렬 처리 기회를 포착합니다.
  • · NVIDIA Visual Profiler를 사용하여 CUDA 코드 프로파일링하기
  • · 동시 CUDA 스트림 사용하기
최종 복습
(15분)
  • · 핵심 내용을 복습하고 질문에 답하기
  • · 평가를 완료하고 인증서 취득하기
  • · 워크숍 설문지 작성하기