xAI, GPU 10만 장 투입한 '콜로서스' 슈퍼컴퓨터 공개
일론 머스크의 AI 기업, xAI가 야심차게 선보인 '콜로서스' 슈퍼컴퓨터의 내부가 처음 공개되었습니다. 이 프로젝트는 세계 최대의 AI 슈퍼컴퓨팅 클러스터로 자리매김하고 있으며, 그 규모와 속도에서 AI 업계를 크게 놀라게 하고 있습니다.
일론머스크-그룩-3 |
1. 콜로서스의 내부 구성과 특징
콜로서스는 미국 멤피스에 위치하며, 엔비디아의 최신 H100 GPU 10만 장이 투입된 거대 슈퍼컴퓨팅 클러스터입니다. 이 시설은 지난 9월부터 가동을 시작했으며, 조립에 122일이 소요되었습니다.
GPU 서버 구성:
- 각 서버는 8개의 H100 GPU가 포함된 엔비디아 HGX H100 솔루션으로 구성되었습니다.
- 이 서버들은 슈퍼마이크로의 4U 유니버설 액체 냉각 시스템 내부에 패키징되었습니다.
- 하나의 랙(Rack)에는 8대의 서버(총 64 GPU)가 배치되며, 이러한 랙을 8개 그룹으로 묶어 512개의 GPU 배열을 형성했습니다.
- 이러한 배열이 약 200개 배치되었으며, 최종적으로 10만 장 이상의 GPU가 콜로서스에 사용되었습니다.
젠슨 황 엔비디아 CEO는 "마스크가 19일 만에 슈퍼컴퓨터를 구축했다"고 칭찬했는데, 이는 200개의 배열을 빠르게 설치한 것을 가리킵니다.
2. 콜로서스의 성능 확장 계획
현재 콜로서스는 첫 번째 건설 단계가 마무리된 상태로, 향후 5만 개의 H100과 5만 개의 H200을 추가하여 총 20만 개의 GPU를 운용할 계획입니다. 엔비디아는 최근 xAI에 10만 개의 GPU를 추가 지원할 것이라고 발표했습니다.
콜로서스는 엔비디아의 이더넷 기반 네트워킹 기술을 사용해, 대형 칩 클러스터들을 효율적으로 연결하고 있습니다. 이는 대규모 AI 모델을 빠르고 안정적으로 훈련하는 데 중요한 역할을 합니다.
3. 콜로서스에서 훈련 중인 AI 모델 '그록-3'
콜로서스에서 xAI의 차세대 AI 모델 '그록-3'가 훈련되고 있으며, 내년 초 출시될 예정입니다. 그록-3는 머스크가 AI 연구의 새로운 지평을 열기 위해 개발 중인 고성능 AI 모델로, 다양한 산업 분야에서 활용될 것으로 기대됩니다.
결론: AI 슈퍼컴퓨팅의 새로운 시대를 여는 콜로서스
콜로서스는 AI 연구와 개발의 속도를 획기적으로 높일 수 있는 혁신적인 슈퍼컴퓨터입니다. GPU 10만 장에서 시작해, 총 20만 장의 GPU를 활용하는 이 거대 클러스터는 AI 업계의 판도를 바꿀 것으로 예상됩니다.
머스크의 xAI는 콜로서스를 통해 AI 기술 개발을 가속화하며, 미래의 AI 시장을 선도하기 위한 강력한 기반을 다지고 있습니다. 이번 공개는 AI 기술의 발전과 초대형 컴퓨팅 인프라의 중요성을 다시 한번 강조하는 계기가 되었습니다. 그룩-3가 기대가 됩니다. 감사합니다.
댓글 쓰기