인텔·삼바노바, AI 추론 '칩 역할 분담' 전략 공개…GPU·RDU·제온6 CPU 이기종 컴퓨팅 구조
인텔과 삼바노바 시스템즈가 대규모 AI 추론 시장에서 효율성을 극대화하기 위한 새로운 하드웨어 아키텍처를 선보였다. 기존의 단일 칩 중심 접근법을 벗어나, GPU, 삼바노바의 RDU(Reconfigurable Dataflow Unit), 인텔 제온6 CPU를 결합한 이기종 컴퓨팅 구조를 제시하며 AI 작업 처리의 새로운 패러다임을 제안했다. 핵심은 각 하드웨어가 가장 잘하는 역할에 특화되어 협업하는 '칩 역할 분담' 전략으로, 성능과 전력 효율을 동시에 높이겠다는 목표다.
구체적인 구조에 따르면, GPU는 입력 데이터를 빠르게 준비하는 '프리필' 단계를 담당한다. 이어 삼바노바의 RDU는 AI 모델의 실제 추론 연산인 '디코드' 단계를 처리하며, 인텔의 제온6 CPU는 시스템의 전반적인 제어와 조정 역할을 수행한다. 이는 하나의 프로세서가 모든 AI 워크로드를 처리하려다 발생하는 병목 현상과 비효율을 해결하기 위한 설계로, 특히 대규모 언어 모델(LLM) 추론과 같은 고강도 작업에서 잠재적인 이점을 가질 수 있다.
이 협업은 AI 인프라 시장에서 GPU의 절대적 지배력에 대한 실질적인 대안 모색으로 읽힌다. 인텔은 CPU 시장의 강자로서, 삼바노바는 특화된 데이터플로우 프로세서를 통해 각자의 영역에서 차별화된 역량을 결합해 NVIDIA에 대응하는 전략적 동맹을 구축한 셈이다. 성공 여부는 이 이기종 구조의 소프트웨어 최적화와 실제 배치에서의 성능 검증에 달려있으며, 결과적으로 AI 데이터센터 시장의 하드웨어 경쟁 구도에 새로운 변수를 투입할 가능성이 있다.