
중국 GPU 제조업체인 무어 스레드(Moore Threads)는 AI 및 데이터센터 컴퓨팅 워크로드를 위한 최신 그래픽 카드인 MTT S4000을 발표했습니다. 이 회사의 새로운 플래그십 제품은 각각 1,000개의 S4000 GPU 클러스터를 포함하는 데이터 센터인 KUAE 인텔리전트 컴퓨팅 센터에 탑재될 예정입니다. 무어 스레드는 또한 레노버를 비롯한 여러 중국 기업과 협력하여 KUAE 하드웨어 및 소프트웨어 생태계를 구축하기 위해 노력하고 있습니다. |

무어 스레드가 S4000 GPU에 대해 모든 것을 공개하지는 않았지만, S2000과 S3000에 비해 크게 개선된 것은 분명합니다. S4000은 S2000에 비해 FP32 성능은 2배 이상, INT8 성능은 5배 이상, VRAM은 50% 이상 향상되었으며 메모리 대역폭도 훨씬 더 넓어졌을 것으로 추정됩니다. 또한 S2000/S3000이 1세대 아키텍처를 사용했다면, 이 새로운 플래그십은 2세대 MUSA(무어 스레드 통합 시스템 아키텍처) 아키텍처를 사용합니다.
(면책 조항: 무어 스레드는 S2000과 S3000을 모두 “1세대 MUSA”로 표시하고 있지만, 다른 사람들은 S2000과 S80이 “2세대 춘샤오 아키텍처”를 사용했다고 말합니다. 무어 스레드에서는 S3000을 “2세대”라고 부르는 것이 더 합리적일 것입니다(아직 제품 페이지가 없지만, 무어 스레드에서는 S4000을 “3세대”라고 구체적으로 부릅니다).
엔비디아의 모델과 비교했을 때, S4000은 2018년 출시된 튜링 기반 테슬라 서버 GPU보다는 낫지만 2020년과 2022년에 각각 출시된 암페어와 에이다 러브레이스보다는 여전히 뒤쳐져 있습니다. S4000은 특히 원시 마력이 부족하지만 메모리 용량과 대역폭은 여전히 상당하기 때문에 무어 스레드가 주력으로 사용할 것으로 예상되는 AI 및 LLM(대규모 언어 모델) 워크로드에 유용할 수 있습니다.
S4000은 또한 한 카드에서 다른 카드로의 240GB/s 데이터 링크와 RDMA 지원을 통해 중요한 GPU 간 데이터 기능을 제공합니다. 이는 호퍼에서 NVLink의 900GB/s 대역폭과는 거리가 멀지만, S4000은 GPU가 훨씬 약하기 때문에 이렇게 많은 양의 대역폭을 사용하는 것은 과한 것일 수 있습니다. |

무어 스레드는 S4000과 함께 KUAE 인텔리전트 컴퓨팅 센터도 공개했습니다. 무어 스레드는 이 센터를 “소프트웨어와 하드웨어를 통합한 풀스택 솔루션”이라고 설명하며, 모든 기능을 갖춘 S4000 GPU가 그 중심이라고 강조합니다. KUAE 클러스터는 각각 8개의 S4000 카드가 장착된 MCCX D800 GPU 서버를 사용합니다. 무어 스레드에 따르면 각 KUAE 킬로카드 클러스터에는 1,000개의 GPU가 있으며, 이는 클러스터당 총 125개의 MCCX D800 서버를 의미한다고 합니다.
소프트웨어 측면에서 무어 스레드는 KUAE가 GPT와 같은 주류 대형 언어 모델과 딥스피드와 같은 프레임워크를 지원한다고 주장합니다. 무어 스레드와 중국 소프트웨어 업계는 무어 스레드의 뮤시파이 툴을 통해 S4000이 엔비디아 GPU 기반의 쿠다 소프트웨어 에코시스템과 함께 작동할 수 있어, 무어 스레드와 중국 소프트웨어 업계가 재개발을 하지 않아도 된다고 주장합니다.
KUAE 클러스터는 몇 가지 세부 사항에 따라 크게 다르지만 대략 한 달 안에 AI 모델을 훈련할 수 있는 것으로 알려져 있습니다. 예를 들어, 무어 스레드에 따르면 700억 개의 매개 변수가 있는 아퀼라2 모델을 훈련하는 데 33일이 걸리지만, 매개 변수를 1300억 개로 늘리면 훈련 시간이 56일로 늘어납니다.
이러한 종류의 하드웨어 및 소프트웨어 생태계를 지원하는 것은 어느 기업에게나 어려운 일이지만, 특히 많은 직원을 해고해야 했던 무어 스레드가 혼자서 이를 감당하는 것은 거의 불가능합니다. 그래서 무어 스레드와 다른 중국 기업들 간의 파트너십인 인텔리전트 컴퓨팅 및 대형 모델 생태 연합을 설립한 것으로 추정됩니다. 중국의 국내 GPU 제조업체는 특히 국제적으로도 입지를 다지고 있는 레노버의 지원을 받고 있습니다.
무어 스레드가 조만간 엔비디아, AMD, 인텔과 정면 승부를 펼치지는 않겠지만, 중국에게 꼭 필요한 것은 아닙니다. 미국의 제재로 인해 강력한 GPU의 중국 수출이 막히면서 중국의 자국 반도체 산업이 존재할 이유가 생겼을 뿐만 아니라 무어 스레드나 경쟁사인 비렌과 같은 기업의 경쟁력이 약화되었습니다. 엔비디아의 중국 전용 카드와 비교하면 S4000과 KUAE가 유리할 수 있습니다. |