인공지능(AI) 모델의 대형화와 추론 수요의 급증은 데이터센터 인프라의 새로운 패러다임을 요구하고 있다. 연산의 양이 무수하게 늘어나면서 데이터센터의 수십∼수백 개의 그래픽처리장치(GPU)가 마치 하나의 거대한 GPU처럼 동작해야 하는 초대형 클러스터 구조로 진화하고 있다. 이제는 개별 GPU의 성능뿐 아니라 네트워크 패브릭이 전체 성능을 결정하는 구간으로 변화하고 있다. 이 흐름 속에서 가장 주목받는 변화가 바로 동시패키징 광학(CPO·Co-Packaged Optics) 기술이다.
CPO는 차세대 데이터센터의 속도와 전력 효율 문제를 해결하기 위해 광학 부품을 전자 칩과 하나의 패키지 안에 통합하는 것이 핵심이다. 기존 광트랜시버 내부에서 광 신호 처리를 담당하던 디지털신호처리장치(DSP) 칩을 제거하고, 실리콘 포토닉스 기반 광변조기(PIC)를 스위치 주문형 반도체(ASIC)와 함께 한 패키지로 통합한다. 광원은 모듈 내부가 아니라 외부에서 공급하는 ELS(External Laser Source) 방식을 사용한다.
이런 복잡한 구조를 채택하는 이유는 명확하다. 지금까지 대역폭 확장은 파장 수(WDM) 증가나 광섬유 코어 수 확대를 통해 이뤄졌으나, 전기적 신호(DSP)로 처리할 수 있는 전력·발열의 한계가 도달하면서 전기 기반 인터커넥트의 물리적 병목이 더 이상 버틸 수 없는 수준까지 왔기 때문이다.
AI 스케일링의 속도를 따라가기 위해서는 전기 구간을 최대한 제거하고 패브릭 전반을 광화(Opticalize)해야 한다. DSP를 제거한 CPO는 발열을 획기적으로 줄이고, 동일 면적·전력 대비 훨씬 큰 대역폭을 확보할 수 있다. 내년부터는 데이터센터 네트워크 스위치의 업링크 구간에 CPO가 본격 적용되기 시작하며, 이후에는 다운링크에서 서버 단까지 확장될 가능성이 높다. 즉, 지금까지 데이터센터 내부에서 단거리는 구리선으로 연결했던 것을 앞으로는 광이 빠르게 대체하는 전환점이 열린 것이다.
물론 넘어야 할 산도 많다. CPO는 기존 플러그형 광모듈(pluggable) 대비 가격이 매우 높고, 패키지 안에 광소자를 통합하다 보니 미세한 광학 불량만 발생해도 스위치 혹은 서버 전체를 폐기해야 하는 리스크가 존재한다. 제조 난도 또한 지속적으로 상승하고 있어 생태계 전반의 기술 축적이 필요한 상황이다.
그럼에도 불구하고 AI 인프라의 구조적 진화는 이미 방향이 정해져 있다. 전기 기반 인터커넥트의 한계가 명확해진 만큼 GPU 성능 향상이 지속되는 한 데이터센터는 결국 CPO를 포함한 광 패키징 기반 구조로 이동할 수밖에 없다. 지금의 CPO 도입은 바로 그 변화의 첫 번째 본격적인 전환점이라 할 수 있다.
댓글 0