인텔 가우디2 및 4세대 인텔 제온 최신 MLPerf 테스트 진행
인첼 제온 MLPerf 제공하는 유일한 CPU
MLPerf 제공하는 가속기는 인텔 가우디2 포함해 3개뿐

인텔 가우디2 가속기(왼쪽)와 인텔 제온 프로세서
인텔 가우디2 가속기(왼쪽)와 인텔 제온 프로세서

인텔은 ML커먼스가 인텔 가우디2(Intel Gaudi2) 가속기와 인텔 어드밴스드 매트릭스 익스텐션(AMX)이 탑재된 4세대 인텔 제온 스케일러블 프로세서의 AI 모델 학습에 대한 업계 표준 MLPerf 트레이닝 v3.1 벤치마크 측정 결과를 발표했다고 10일 밝혔다.

MLPerf는 AI 성능을 평가하는 주요 지표 중 하나이다. 벤치마킹은 복잡하고 미묘한 작업이고 특히 AI 훈련과 추론 워크로드의 경우 편차가 더 심하다. 이에 업계 관계자들은 개방형 엔지니어링 컨소시엄인 ML커먼스에 의해 관리되는 MLPerf AI 훈련과 추론 벤치마크를 중요하게 여기고 있다.

인텔 제온 프로세서는 MLPerf 결과를 제출하는 유일한 CPU다. 또한 MLPerf 결과를 제출하는 가속기는 가우디2를 포함해 총 3종의 솔루션 뿐이다. 현재 두 가지 솔루션만 현재 구매할 수 있다.

인텔에 따르면 가우디2는 v3.1 학습 GPT-3 벤치마크에서 FP8 데이터 유형을 적용해 두 배 높은 성능을 보여줬다.

인텔 데이터센터 및 AI 그룹 총괄 산드라 리베라(Sandra Rivera) 수석부사장은 "인텔은 AI 포트폴리오를 지속적으로 혁신하고 있으며, 연이은 MLPerf 성능 결과를 통해 ML커먼스 AI 벤치마크의 기준을 높이고 있다"며 "인텔 가우디 및 4세대 제온 프로세서는 고객에게 뚜렷한 가격 대비 성능 이점을 제공한다"고 말했다. 

가우디2와 4세대 제온 프로세서는 다양한 하드웨어 구성으로 우수한 AI 학습 성능을 입증해 점점 더 다양해지는 고객의 AI 컴퓨팅 요구 사항을 해결할 수 있다고 인텔 측은 설명했다.

가우디2는 FP8 데이터 유형 구현으로 v3.1 학습 GPT-3 벤치마크에서 두 배의 성능 향상을 보였다. 6월 MLPerf 벤치마크 대비 학습 시간이 절반 이상으로 단축됐으며, 384개의 인텔 가우디2 가속기를 사용해 153.38분 만에 학습을 완료하기도 했다. 가우디2 가속기는 E5M2 및 E4M3 형식 모두에서 FP8을 지원하며 필요 시 지연 스케일링 옵션도 제공한다.

가우디2는 BF16을 사용해 20.2분 만에 64개의 가속기로 스테이블 디퓨전(Stable Diffusion) 멀티모달 모델에 대한 학습을 시연했다. 향후 MLPerf 트레이닝 벤치마크에서는 FP8 데이터 유형에 대한 스테이블 디퓨전 성능이 제출될 예정이다. 

8개의 인텔 가우디2 가속기에서 BERT와 ResNet-50에 대한 벤치마크 결과는 각각 BF16을 사용하여 13.27분과 15.92분을 나타냈다. 

인텔은 소프트웨어 업데이트 및 최적화를 통해 향후 MLPerf 벤치마크에서 AI 성능 결과가 더욱 향상될 것으로 예상하고 있다. 인텔의 AI 제품은 고객에게 성능, 효율성 및 유용성을 요구하는 동적인 요구 사항을 충족하는 AI 솔루션에 대한 더 많은 선택지를 제공한다.
 

관련기사
저작권자 © 스마트투데이 무단전재 및 재배포 금지