음성 인식에서 언어 이해 및 음성 합성에 이르는
전체 파이프라인 가속화

Conversational AI

가상 비서, 디지털 아바타, 챗봇과 같은 대화형 AI 애플리케이션은 개인화되고 자연스러운 인간-기계 대화로 가는 혁신적인 길을 열어주고 있습니다. 그러나 그들은 엄격한 정확성과 대기 시간 요구 사항에 직면해 있습니다. NVIDIA의 대화형 AI 플랫폼을 통해 개발자는 실시간 상호 작용 속도인 300밀리초 미만으로 훨씬 짧은 시간 내에 높은 정확도를 제공하고 응답하는 최첨단 애플리케이션을 신속하게 구축 및 배포할 수 있습니다.

  • 에이전트 효율성
    고객 대화를 실시간으로 전사하고 분석하고 권장 사항을 제공하여 고객 쿼리를 신속하게 해결함으로써 컨택 센터 상담원을 지원합니다.
  • 디지털 접근성
    청각 장애가 있는 사람들이 오디오 콘텐츠를 소비하고 언어 장애가 있는 사람들이 더 쉽게 자신을 표현할 수 있도록 합니다.
  • 고가용성
    챗봇 및 가상 비서를 사용하여 상담원의 정상 업무 시간 외에 고객 문의를 해결하고 귀중한 정보를 제공합니다.
  • 매력적인 경험
    라이브 캡션, 풍부한 합성 음성 생성, 고객 선호도 이해와 같은 다양한 기능으로 고객에게 매력적인 경험을 제공하십시오.

제품 개발 절차 강화

  • 금융 서비스
    금융 서비스 산업의 모든 조직에서 사기 행위를 감지하는 것은 매우 중요합니다. 챗봇은 금액 및 위치를 포함한 거래 패턴을 식별하고 상호 작용을 개인화하여 지원할 수 있으며 통화 커버리지를 늘리기 위해 상담원 지원 및 통화 기록 전사에도 사용할 수 있습니다.
  • 통신
    컨택 센터는 통신 산업을 생각할 때 가장 먼저 떠오르는 것 중 하나입니다. 이는 모든 통신 사업의 핵심이며 대화형 AI는 상담원 지원, 가상 상담원과 같은 많은 애플리케이션을 가속화하고 감정 분석과 같은 통찰력을 추출하는 데 도움이 될 수 있습니다.
  • 소비자 서비스
    대화형 AI는 회의 요약 생성 및 후속 회의 예약부터 가상 회의 중 실시간 캡션 생성에 이르기까지 여러 프로세스를 개선할 수 있으며 스마트 안경에 음성 명령을 제공하고 소비자 애플리케이션에서 사용하기 위해 사람처럼 들리는 합성 음성을 생성할 수 있습니다.

대화형 AI 애플리케이션을 위한 NVIDIA 솔루션

음성 AI 기술에는 자동 음성 인식(ASR) 및 텍스트 음성 변환(TTS)이 포함됩니다. NVIDIA® Riva는 대화형 AI 애플리케이션에 통합할 수 있는 실시간 음성 AI 파이프라인을 개발하기 위한 GPU 가속 음성 AI SDK입니다. Riva를 최대한 활용하려면 NVIDIA T4, V100 또는 A100 Tensor Core GPU를 사용하십시오. 여기에서 음성 AI가 무엇인지, 이점, 사용 사례 및 과제에 대해 자세히 알아보세요.

자연어 처리(NLP)에는 두 가지 유형이 있습니다. 매개변수가 더 적은 언어 모델과 최대 1조 개의 매개변수가 있는 큰 NLP 모델입니다. NVIDIA NeMo 및 NeMo Megatron은 각각 소형 및 대형 언어 모델을 훈련하기 위한 것입니다. NeMo Megatron 모델은 프로덕션에서 고성능 추론을 위해 NVIDIA Triton™ 추론 서버 로 내보낼 수 있습니다.

  • NVIDIA TAO
    프로덕션 품질의 NVIDIA 사전 훈련 모델과 NVIDIA TAO 툴킷을 사용하여 개발 시간을 10배 단축할 수 있습니다.
  • NVIDIA Riva
    클라우드, 데이터 센터, 임베디드 장치 및 에지에서 최대 성능을 위해 최적화된 음성 AI 서비스를 배포합니다.
  • NVIDIA NeMo
    NVIDIA NeMo 오픈 소스 프레임워크를 사용하여 최첨단 음성 및 언어 모델을 구축, 훈련 및 미세 조정합니다.
  • NeMo Megatron
    NeMo Megatron을 사용하여 훈련 데이터를 선별하고 큰 언어 모델을 최대 1조 개의 매개변수까지 쉽게 훈련 및 확장할 수 있습니다.

AI 기반 기술

  • 다중화자 표기
    기존의 음성-텍스트 알고리즘이 진화하여 이제 회의, 강의 및 사회적 대화의 전사가 가능해지고 여러 명의 화자를 동시에 식별하고 각자의 말에 레이블을 지정할 수 있게 되었습니다. NVIDIA Riva 를 통해 멀티센서 오디오와 영상 데이터가 여러 음성을 실시간으로 구별하는 데 필요한 시각적 화자 구분 등의 고급 전사 구성 요소에 사용되는 단일 정보 스트림에 결합될 수 있습니다.
  • 가상 어시스턴트
    가상 어시스턴트는 연락 센터, 스마트 스피커 및 차량 내 지능형 어시스턴트의 상호작용을 지원하여 거의 인간과 같은 방식으로 고객에게 다가갈 수 있습니다. 음성 인식, 언어 이해, 음성 합성 및 음성 코딩 등의 AI 기반 서비스만으로는 대화 추적 등의 핵심 구성 요소가 빠졌기 때문에 그러한 시스템을 지원할 수 없습니다. Riva는 모든 애플리케이션에 대해 확장할 수 있으며 사용이 쉬운 구성 요소를 통해 이러한 기본 서비스를 보완합니다.

조직 전반의 AI, 데이터 사이언스, HPC 워크로드를 지원하기 위한 인프라 설계 및 관리를 위한 전문가의 실습 교육

NVIDIA DLI (딥 러닝 인스티튜트)는 AI 및 가속 컴퓨팅 분야의 개발자, 데이터 과학자 및 연구원을 위한 실습 교육을 제공합니다. 온라인 자율 학습 과정을 통해 Computer Vision의 기초에 대한 인증을 받으십시오. 또한 디지털 콘텐츠 생성, 의료 및 지능형 비디오 분석에 대한 2시간 선택 과목을 확인하십시오.

모든과정 보러가기 >
NVIDIA | DEEP LEARNING INSTITUTE