한결 수월해진 데이터센터 관리

UFM 플랫폼은 연구 및 산업 데이터센터 운영업체에서 InfiniBand 데이터센터 패브릭을 효율적으로 프로비저닝, 모니터링, 관리하고 예방적으로 보수, 유지하도록 지원합니다. UFM 플랫폼은 다양한 수준의 솔루션과 포괄적인 기능 세트로 구성되어 가장 광범위한 최신 스케일아웃 데이터센터 요구 사항도 너끈히 충족합니다.

UFM을 활용하면 OPEX를 줄이는 동시에 패브릭 리소스의 사용률을 높이고 경쟁 우위를 실현할 수 있습니다. UFM 플랫폼은 견고한 GUI(그래픽 사용자 인터페이스)를 자랑합니다.

UFM 플랫폼 제품군

  • UFM Telemetry 실시간 모니터링 플랫폼 : 소프트웨어 컨테이너 또는 전용 어플라이언스

    UFM Telemetry는 네트워크 성능과 조건을 모니터링하는 네트워크 검증 도구를 제공합니다. 또한 풍부한 실시간 네트워크 원격 측정 정보, 애플리케이션 워크로드 사용량 및 시스템 구성을 구축형 또는 클라우드 기반 데이터베이스로 캡처하고 스트리밍하여 추가 분석을 수행합니다.

    주요 기능
    • - 스위치, 어댑터 및 케이블 원격 측정
    • - 시스템 검증
    • - 네트워크 성능 테스트
    • -

      온프레미스 또는 클라우드 기반 데이터베이스로 원격 측정 정보 스트리밍

  • UFM 엔터프라이즈 패브릭 가시성 및 제어 플랫폼 : 소프트웨어 컨테이너 또는 전용 어플라이언스

    UFM Enterprise는 UFM Telemetry의 장점을 향상된 네트워크 모니터링 및 관리와 결합합니다. 자동화된 네트워크 검색 및 공급, 트래픽 모니터링 및 혼잡도 검색을 수행합니다. 소프트웨어 컨테이너 또는 전용 기기를 통해 사용할 수 있습니다.

    주요 특징 : UFM Telemetry 기능
    • - UFM 원격 측정 기능 포함
    • - 자동화된 네트워크 검색 및 검증
    • - 안전한 케이블 관리
    • - 교통 병목 현상을 식별하기 위한 혼잡 추적
    • - 문제 식별 및 해결
    • - 글로벌 소프트웨어 업데이트
    • - Slurm 및 Platform LSF와 통합된 작업 스케줄러 프로비저닝
    • - 고급 보고 및 포괄적인 표현 상태 전송(REST) API
    • - 풍부한 웹 기반 GUI
  • UFM 사이버 AI 사이버 인텔리전스 및 분석 플랫폼 : 사내 전용 UFM Cyber-AI 어플라이언스

    UFM 원격 분석 및 UFM 엔터프라이즈의 장점을 더욱 강화한 UFM Cyber-AI 플랫폼은 예방적인 유지보수와 사이버 보안으로 슈퍼컴퓨팅 OPEX를 낮추는 데 기여합니다. 이 제품은 전용 UFM Cyber-AI 기기를 통해 구내에서 이용할 수 있습니다.

    주요 기능
    • - UFM Telemetry 및 UFM Enterprise 기능
    • - 시간이 지남에 따라 성능 저하 또는 사용 프로필 변경을 감지
    • - 비정상적인 클러스터 동작을 감지
    • -

      AI를 사용하여 현상 간의 상관 관계를 확인 (무관하게 보일 수 있습니다)

    • - 예방 유지 보수가 필요할 때
    • -

      경고 지속적인 시스템 데이터 수집을 통해 예측 가능성을 최적화

견고한 UFM Cyber-AI 그래픽 사용자 인터페이스

  • 이미지
    Network Validation
  • 이미지
    Telemetry
  • 이미지
    Secure Cable Management
  • 이미지
    Prediction Dashboard
  • 이미지
    Inventory Mapping
  • 이미지
    Anomaly Analysis
이미지

NVIDIA InfiniBand 연결 클러스터를 위한 도구 종합 및 플러그인 제품군

NVIDIA UFM SDK는 Grafana, FluentD, Zabbix, Slurm과 같은 오픈 소스 플랫폼용으로 설계된 광범위한 타사 플러그인을 제공합니다. 이러한 도구와 플러그인은 개발자 생산성을 향상하고, UFM REST API와의 효율적이며 사용자 친화적인 통합을 제공합니다. 애플리케이션 수명 주기 관리(ALM) 및 문제 감지 해결(PDR)의 예측 유지보수 플러그인을 확인해 보세요. 발생하기 전에 문제를 예측하고 네트워크 성능을 최고 수준으로 유지해 보세요.

NVIDIA UFM Platform Product Suite

NVIDIA UFM Telemetry Real-Time Monitoring

UFM Telemetry builds a rich database of realtime network telemetry, workloads, system configuration, and more.

  • - Switches, adapters, and cables telemetry
  • - System validation
  • - Network performance tests
  • -

    Streaming of telemetry information into an on-premises or cloud-based database

NVIDIA UFM Enterprise Fabric Visibility and Control

UFM Enterprise combines the benefits of UFM Telemetry with enhanced network monitoring and management.

  • - Automated network discovery and validation
  • - Secure cable management
  • -

    Congestion tracking to identify traffic bottlenecks

  • - Problem identification and resolution
  • - Global software updates
  • -

    Job scheduler provisioning, integrated with Slurm and IBM Spectrum LSF

  • -

    Advanced reporting and comprehensive REST APIs

  • - Rich, unified, web-based GUI
NVIDIA Cyber-AI Cyber Intelligence and Analytics

UFM Cyber-AI enhances the benefits of UFM Telemetry and UFM Enterprise, providing preventive maintenance and cyber defense.

  • - UFM Telemetry and UFM Enterprise inside
  • - Detects performance degradations
  • - Detects usage profile changes over time
  • - Detects abnormal cluster behavior
  • - Detects link anomalies
  • -

    Issues alerts for required preventive maintenance

  • -

    Optimizes predictive accuracy with continuous system data collection

맨위로가기