Fundamentals of Accelerated Data Science
(가속화된 데이터 과학의 기초)
-
교육시간
1일 8시간
-
언어
영어
-
기술
RAPIDS, cuDF, XGBoost, cuML, cuGraph, Dask, cuPy, pandas, NumPy, Bokeh
교육목적
여러분의 회사가 고객 유지율을 개선해야 하는 소프트웨어 회사인지, 위험을 완화해야 하는 금융 서비스 회사 또는 고객 구매 행동을 예측하는 데 관심이 있는 리테일 회사에 해당되는 지와 관계없이 회사는 중요 리소스를 낭비하지 않으면서 대용량 데이터를 준비하고 관리하고 그로부터 인사이트를 확보해야 합니다. 기존 CPU 중심의 데이터 사이언스 워크플로우는 번거로울 수 있지만 GPU의 성능을 활용하면 팀에서 데이터를 빠르게 파악하여 비즈니스 의사 결정을 내릴 수 있습니다.
이 교육에서는 작업을 빠르게 탐색하고 반복 작업하여 프로덕션으로 투입할 수 있게 만드는 엔드 투 엔드 GPU 가속 데이터 사이언스 워크플로우를 구축하고 실행하는 방법을 설명합니다. RAPIDS™ 가속 데이터 사이언스 라이브러리를 사용하여 XGBoost, cuGRAPH의 단일 소스 최단 경로, cuML의 KNN, DBSCAN 및 로지스틱 회귀를 포함하는 매우 다양한 GPU 가속 머신 러닝 알고리즘을 적용해 원하는 규모로 데이터 분석을 수행합니다.
-
전제조건
Python에 대한 경험 (pandas 및 NumPy를 알면 더욱 이상적)
-
인증서
평가를 성공적으로 완료한 참가자는 관련 분야에 대한 역량을 인정 받고, 전문적 커리어 성장을 지원하는 NVIDIA DLI 인증서를 받게 됩니다.
-
사전준비 (하드웨어 요구 사항)
최신 버전의 Chrome 또는 Firefox를 실행할 수 있는 데스크톱 또는 노트북을 준비한 참가자에게는 클라우드 상에서 완전하게 구성된 GPU 가속 서버에 접근할 수 있는 전용 권한이 주어집니다.
학습목표
-
01
cuDF 및 Apache Arrow 데이터 프레임을 사용하여 GPU 가속 데이터 준비 및 특징 추출 구현
-
02
XGBoost 및 다양한 cuML 알고리즘을 사용하여 광범위한 GPU 가속 머신 러닝 작업 적용
-
03
cuGraph를 사용하여 GPU 가속 그래프 분석을 실행하고 단기간에 방대한 규모의 분석 달성
-
04
cuGraph 루틴을 사용하여 방대한 규모의 그래프 분석을 빠르게 달성
교육개요
인트로(15분) |
|
GPU 가속 데이터 조작 (120분) |
교육 후반의 여러 가지 머신 러닝 실습에서 활용할 몇몇 데이터세트를 가져와서 준비합니다.
(일부는 메모리보다 큼)
|
휴식 (60분) | |
GPU 가속 머신 러닝 (120분) |
첫 번째 섹션에서 준비한 데이터에 몇 가지 필수 머신 러닝 기술을 적용합니다.
|
휴식 (15분) | |
프로젝트: 데이터 분석을 통해 영국 구하기 (120분) |
영국의 전체 인구에 영향을 미치는 시뮬레이션된 유행병을 예방하도록 인구 규모 데이터에
새로운 GPU 가속 데이터 조작 및 분석 기술을 적용합니다.
|
평가 및 Q&A (15분) |