슈퍼마이크로, AI 시대에 걸맞은 혁신 서버 AI 슈퍼클러스터 선보여
글/반도체네트워크 편집부 2024.06.11
AI/ML, 클라우드, 스토리지 및 5G/엣지를 위한 토탈 IT 솔루션의 글로벌 리더 슈퍼마이크로컴퓨터(Super Micro Computer)가 생성형 AI 개발 및 구축을 지원하는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼에 최적화된 ‘슈퍼클러스터’를 공개했다.
슈퍼마이크로 슈퍼클러스터는 산업을 막론하고 기업의 생성형 AI 채택을 가속화하는 클라우드 네이티브 솔루션을 위해 설계된 R2D(ready to deploy) 액침 냉각식 AI 데이터센터에서 사용된다. 엔비디아에서 최근 선보인 블랙웰 GPU에는 슈퍼마이크로의 4U 수냉식 냉각 서버가 탑재되어 단일 GPU에서 20 페타플롭스(PetaFLOPS)의 AI 성능을 완벽하게 구현할 수 있다. 또한 기존 GPU 대비 4배 강력한 AI 훈련 및 30배 강력한 추론 성능을 자랑하며, 추가적인 비용 절감 효과를 가져온다. 슈퍼마이크로는 시장 선점 전략에 따라 최근 블랙웰 아키텍처를 기반으로 한, 엔비디아 HGX B100, B200, 그리고 GB200 그레이스 블랙웰 슈퍼칩용 신규 제품군을 선보인 바 있다.
찰스 리앙(Charles Liang) 슈퍼마이크로 사장 겸 CEO는 "슈퍼마이크로는 랙 스케일 액침 냉각식 AI 솔루션을 개발 및 구축하며 지속적으로 업계를 선도하고 있다"며, "수냉식 냉각 데이터선터는 전력 사용량 감축을 통해 사실상 무상으로 제공되며, 이는 고객에게 추가적인 가치를 제공할 수 있다. 슈퍼마이크로의 솔루션은 다양한 산업군의 고객을 위해 엔비디아 AI 엔터프라이즈 소프트웨어에 최적화됐다”고 설명했다.
이어서 “당사는 세계 최고 수준의 효율성과 함께 글로벌 제조 역량을 갖췄다. 그 결과, 엔비디아 HGX H100 및 H200은 물론, 새로 출시된 B100, B200, 그리고 GB200에 수냉식 또는 공냉식 냉각 턴키 클러스터를 배포하는 시간을 단축할 수 있다. 냉각판부터 CPU와 냉각탑에 이르기까지 슈퍼마이크로의 랙 스케일 종합 액체 냉각 솔루션은 데이터센터에서 사용하고 있는 전력량을 최대 40%까지 줄일 수 있다”고 덧붙였다.
슈퍼마이크로는 ‘컴퓨텍스 2024(COMPUTEX 2024)‘에 참가해 곧 출시될 엔비디아 블랙웰 GPU에 최적화된 서버를 공개했으며, 여기에는 엔비디아 HGX B200 기반의 10U 공냉식 및 4U 수냉식 냉각 서버가 포함됐다. 또한, 8U 공냉식 엔비디아 HGX B100 시스템, 엔비디아 NV링크 스위치와 상호 연결된 GPU 72개를 탑재한 슈퍼마이크로의 엔비디아 GB200 NVL72 랙, 그리고 엔비디아 H200 NVL PCLe GOU 및 엔비디아 GB200 NVL2 아키텍처를 지원하는 신규 엔비디아 MGX 시스템을 제공할 예정이다.
여러 업계의 기업들이 빠르게 생성형 AI 사용 사례를 실험하고 있는 가운데, 슈퍼마이크로는 엔비디아와의 긴밀한 협업을 통해 시험 및 파일럿 AI 애플리케이션에서 양산형 배포 및 대규모 데이터센터 AI로의 원활하고 매끄러운 전환을 보장한다. 이는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 통해 랙 및 클러스트 단위의 최적화를 이룬 결과로, 초기 탐색부터 확장 가능한 AI 구현까지 원활한 여정을 지원한다.
관리형 서비스는 인프라 채택, 데이터 공유, 그리고 생성형 AI 전략 제어에 부정적인 영향을 미친다. 하지만 슈퍼마이크로는 엔비디아 AI 엔터프라이즈의 일부인 엔비디아 NIM 마이크로서비스를 통해 관리형 및 생성형 AI 및 오픈소스 배포의 장점만을 제공한다. 마이크로서비스를 활용한 다목적 추론 수행 시간(Versatile inference runtime)은 오픈소스부터 엔비디아 기반 모델에 이르기까지 다양한 모델에서 생성형 AI 구축을 가속화한다. 또한, 엔비디아 NeMo를 지원해 데이터 큐레이션, 고급 커스터마이징 및 RAG(retrieval-augmented generation; 검색 증강 생성)를 통한 엔터프라이즈급 솔루션용 맞춤형 모델 개발이 가능하다. 슈퍼마이크로의 엔비디아 AI 엔터프라이즈용 슈퍼클러스터와 결합된 엔비디아 NIM은 확장 가능하고 가속화된 생성형 AI 프로덕션 구축을 향한 지름길로 안내한다.
현재 슈퍼마이크로의 생성형 AI 슈퍼클러스터 서버는 아래와 같다:
• 슈퍼마이크로 수냉식 냉각 엔비디아 HGX H100/H200 슈퍼클러스터: 전용 네트워킹 랙 1개를 포함해 총 5개의 랙에서 확장 가능한 컴퓨팅 단위로 H100/H200 GPU 256개 탑재
• 슈퍼마이크로 공냉식 냉각 엔비디아 HGX H100/H200 슈퍼클러스터: 전용 네트워킹 랙 1개를 포함해 총 9개의 랙에서 확장 가능한 컴퓨팅 단위로 H100/H200 GPU 256개 탑재
• 슈퍼마이크로 엔비디아 MGX GH200 슈퍼클러스터: 전용 네트워킹 랙 1개를 포함해 총 9개의 랙에서 확장 가능한 컴퓨팅 단위로 그레이스 호퍼 슈퍼칩 256개 탑재
슈퍼마이크로 슈퍼클러스터는 엔드투엔드 생성형 AI 커스터마이징을 위해 엔비디아 NIM 마이크로서비스 및 엔비디아 NeMo 플랫폼 등 엔비디아 AI 엔터프라이즈를 탑재했다. 또한, 400Gb/s의 네트워킹 속도로 수십만 개의 GPU가 있는 대규모 클러스터까지 확장 가능하며, 엔비디아 퀀텀-2 인피니밴드 및 신규 엔비디아 스펙트럼-X 이더넷 플랫폼에 최적화됐다.
슈퍼마이크로 슈퍼클러스터 솔루션은 LLM 학습, 딥러닝, 그리고 대용량 및 대규모 추론에 최적화됐다. 슈퍼마이크로의 L11 및 L12 검증 테스트와 현장 구축 서비스는 고객에게 원활한 경험을 선사한다. 또한, 데이터센터에서 도입이 쉽고, 그 결과를 보다 빠르게 확인할 수 있는 플러그 앤 플레이 확장형 유닛을 제공한다.
버티브, AI 레퍼런스 디자인 포트폴리오가 특징인 새로운 AI 허브 오픈
조회수 54회 / Vertiv
피커링일렉트로닉스, 2024 한국테스트컨퍼런스`에서 최신 고전력 리드릴...
조회수 75회 / Pickering Electronics
Broadcom, VMware Cloud Foundation의 최신 혁신 기술 공개
조회수 72회 / 브로드콤
나노코리아 2024, 최신 소재·부품·장비 기술 트렌드와 솔루션 조망하는 ...
조회수 101회 / 나노코리아
TTTech Auto, 안전하고 안심할 수 있는 모빌리티 구현에 선구적 기여를 ...
조회수 92회 / TTTech Auto
FRACTILIA, EUV 패터닝 제어 및 수율 향상 위해 스토캐스틱 HVM 제어 솔...
조회수 90회 / Fractilia
미르, 최신 자율이동로봇 동향 및 신제품 발표
조회수 128회 / MiR
하이크비전, 성능과 편의성 개선한 5세대 LED 캐비닛 출시
조회수 91회 / 하이크비전코리아
옴디아, 2024년 전반기 중국산 폴더블 OLED 출하량 삼성디스플레이 상회...
조회수 116회 / 옴디아
PDF 다운로드
회원 정보 수정