세레브라스, 키미 서비스로 GPU 추론 성능 압도
세레브라스가 문샷 AI의 1조 매개변수 오픈웨이트 모델 ‘키미 K2.6’을 기업 고객용으로 서비스하며, 초당 981개 출력 토큰 수준의 추론 속도를 제시했습니다. 회사는 이 수치가 GPU 기반 가장 빠른 경쟁사보다 6.7배, 업계 평균보다 23배 빠르며, 코딩 작업에선 최대 29배 수준의 우위를 보인다고 강조했습니다. 한국 기업들에겐 모델 자체보다도 어떤 인프라에서 얼마나 싸고 빠르게 돌릴 수 있는지가 AI 경쟁력의 핵심이 되고 있다는 신호입니다.













