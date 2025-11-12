“AI 인프라 구축을 지원하는 세 가지 주요 구성 요소가 있습니다. GPU를 비롯한 AI 가속기, 패키징, 그리고 메모리입니다. 시간이 지나면서 메모리 공급이 부족한 상황이 올 것이며 패키징이 따라가지 못하는 단계는 지났습니다”
반도체용 웨이퍼 제조 장비 기업 KLA의 릭 월레스 (Richard P. Wallace) 최고경영자는 지난 10월 29일(현지시각) 열린 2026 회계연도 1분기 실적발표에서 메모리 반도체의 수급 문제가 AI 가속기 시장의 주요 화두로 떠올랐다고 말했다. 지난해 젠슨 황 엔비디아 CEO가 고대역폭 메모리(HBM)과 고급 패키징 기술로 인해 GPU(그래픽 처리 장치) 생산에 병목이 있다고 발언했는데, 장비 제조업체에서도 메모리 공급 부족이 GPU 생산에 영향을 주기 시작했음을 확인해 준 것이다. GPU보다 메모리 수급이 관건, 어떤 과정을 거쳐 생산되나?
그래픽 카드는 당초 게임, 3D 그래픽 처리 등을 위한 장치로 설계됐지만, 일반 연산 용도(GPGPU)로 쓰임새가 넓어지며 AI 개발 용도로 쓰이기 시작했다. 그래픽 카드의 구성 요소는 연산을 처리하는 핵심 장치인 GPU(그래픽 처리 유닛)를 중심으로 메모리, 전원부, 냉각 설계, 인쇄회로기판(PCB) 및 외부연결 인터페이스 등이다. 몇 년 전까지만 해도 메모리 수급에 큰 문제가 없어서 GPU가 생산량을 결정하는 핵심 요소였지만 최근에는 상황이 역전됐다.
우선 GPU는 셰이더, 텐서 연산 등에 필요한 트랜지스터와 메모리 컨트롤러, 캐시 등이 집적돼 있다. 엔비디아와 AMD 등의 AI 가속기 제조사는 최신 공정을 기준으로 칩의 기본 설계도를 구상한다. 이 기업들은 반도체를 직접 생산하지 않고 설계를 바탕으로 제조 과정 등은 외부에 위탁하며, 이렇게 설계만 하는 기업을 ‘팹리스’라고 부른다. 설계도가 완성되면 검증 및 물리 설계 등의 구성을 거쳐 칩을 시범 생산하고 제조 단계로 진입한다.
칩 제조 단계는 실리콘 웨이퍼 위에 반도체 설계를 그려 넣는 과정이다. 설계도를 받아 전문적으로 반도체를 위탁 제조하는 기업을 ‘파운드리’라고 부르며 대표적으로 TSMC와 삼성전자가 있다. 이때 웨이퍼에 인쇄되는 트랜지스터의 폭, 두께, 적층 수준은 나노미터 단위에 불과하다. 더 정밀한 값으로 인쇄할수록 반도체 성능, 배선간 저항, 접촉 저항 등이 효율화되고, 웨이퍼에 더 많은 트랜지스터를 그려넣을 수 있다. 즉 나노 공정이 심화될수록 생산 비용은 효율적이고, 성능은 향상된다. 이 때문에 나노공정 수준과 양산 능력이 파운드리 기업을 평가하는 잣대로 쓰인다.
칩이 완성되면 반도체를 기판과 전기적으로 연결하는 패키징 과정으로 넘어간다. 패키징을 통해 인쇄된 반도체와 기판, 보드를 각각 연결하고 신호 및 전력 공급을 가능하게 만든다. 또 발열로 인한 비틀림 등을 방지하고 방열 장치와 연결하기 위한 구조물 등을 설치한다. 일반적인 제품은 반도체 다이를 칩과 충진재, 방열 구조 등과 결합한 뒤 납땜 가능한 상태까지 만들고 끝난다.
서버 등 고성능 반도체는 패키징 과정이 더 복잡하다. 반도체의 중간 기판인 ‘실리콘 인터포저’ 위에 다이와 메모리 반도체 등을 동시에 올린 뒤 접합하고, 그 다음 비틀림 구조나 방열 장치 등을 배치하는 과정은 비슷하다. 이 과정에서 여러 종류의 서로 다른 공정으로 생산된 반도체를 하나의 칩처럼 연결하는 ‘칩렛’ 방식으로 설계됐거나, 반도체를 수평으로 배치한 뒤 관통 전극으로 연결해 칩을 하나처럼 연결하는 2.5D, 수직으로 증축하는 3D 패키징 등의 복잡한 공정이 동원된다.
이렇게 완성된 칩은 보드 공장으로 납품된 뒤 반도체 기판 위에 납땜되고, 히트싱크나 쿨링팬 등 방열 구조물이 설치되면 완제품 형태가 된다. 그다음은 제품을 켜 작동에 필요한 펌웨어 등을 설치하고, 불량 등을 최종 검증한 뒤에 판매 가능한 상태로 포장된다. 반도체 생산, 설계·생산·패키징 삼박자 맞아야
앞서 과정은 어느 한 국가에서 이뤄지는 게 아닌 ‘반도체 공급 사슬’이라고 부르는 전 세계 반도체 기업들의 협력으로 이뤄진다. 따라서 반도체 생산 과정 중 어느 한 가지라도 누락되거나 병목이 발생하면 공급망 전체가 둔화된다. 예를 들어 반도체 인쇄에 필요한 웨이퍼 공급이 불안정하거나, 파운드리에서 생산할 수 있는 반도체의 총량보다 많은 주문이 들어온다거나, 인쇄 과정에서 불량률이 높다거나, 심지어는 지진이나 정전 등 천재지변으로도 전 세계 반도체 생산이 정지될 수 있다.
보통은 공정, 패키징 등이 발목을 잡아왔다. 2023년에서 올해까지 TSMC의 CoWoS(Chip-on-Wafer-on-Substrate) 패키징으로 생산 가능한 물량이 한정돼 있어 엔비디아 H100 등의 주요 반도체가 공급 제한이 걸린 게 대표적이다. 삼성 파운드리 역시 2024년 초 3 나노미터 GAA(Gate-All-Around)의 부진으로 제품 대량생산이 어렵다는 보도가 나온 적이 있다. 다행히 지금은 패키징 공정이 성숙되고 생산 물량도 확대가 거의 끝나 패키징이 발목을 잡는 단계는 지났다. 또 새 공정 도입 초기에 생산 수율 등으로 발목이 잡히는 건 늘 있는 일이다.
그런데 몇 년 전부터 메모리 반도체 부족이 새로운 문제로 떠올랐다. 최태원 SK그룹 회장은 지난 3일 열린 SK AI 서밋에서 “많은 기업들로부터 메모리 반도체 공급 요청을 받고, 오픈AI로부터도 스타게이트 프로젝트에 필요한 고대역폭 메모리를 월 90만 장씩 공급해 달라는 요청을 받았다”라고 말했다. 월 90만 장은 전 세계 모든 기업의 HBM 생산량의 2배가 넘는 수준이다. 지금부터 메모리 반도체 공장을 증설해 대응에 나서겠지만 수요가 많아질수록 ‘메모리’가 없어서 AI 반도체 완제품을 생산할 수 없는 상황이 빚어진다. AI 가속기의 메모리 용량, AI 개발과 밀접한 관련
엔비디아를 비롯한 빅테크 기업들이 메모리 반도체를 쓸어 담는 이유는 메모리 용량이 커야 AI 개발에 용이하기 때문이다. AI 가속기에서 메모리 용량은 한 번에 얼마나 큰 모델을 구동할 수 있는지를 결정한다. 용량이 크면 학습 과정에서 데이터를 많이 쌓아두거나, 긴 대화, 임시 기록을 안정적으로 저장한다. 반면 메모리 용량이 작으면 활성 데이터를 다 담을 수 없어 병목이 발생하고 결과적으로 성능이나 개발 등에 문제가 생긴다.
메모리 속도와 용량 모두 중요하지만 고속의 고대역폭 메모리 대신 일반 소비자용 메모리로 용량을 늘린 제품도 있다. 엔비디아의 데이터센터용 GPU 중 L4, L40, L40S가 HBM 대신 GDDR6 메모리를 탑재한다. 가속기 기업 중에서도 하이퍼엑셀, d-매트릭스처럼 HBM 대신 LPDDR 메모리를 채택해 저전력, 고용량 환경을 경쟁력으로 내세우는 경우도 있고, 삼바노바 SN40L같이 HBM과 DDR 메모리를 모두 탑재하는 제품도 있다. 국내 메모리 반도체 기업엔 호재, AI 가속기 기업엔 글쎄
전 세계가 AI 가속기용 메모리 확보에 나서면서 우리나라 메모리 반도체 기업의 주가도 크게 올랐다. 올해 1월 17만 원선이던 SK하이닉스 주가는 현재 60만 원까지 올랐고, 삼성전자 주가 역시 5만 5000원 대에서 10만 2000원 선으로 올랐다. 미국 마이크론 주가 역시 108달러(15만 8200원)에서 현재 253달러(37만 720원)까지 상승했다. 반도체는 공정 중간에 감축 및 증산이 어렵고, 더 늘리려면 공장을 새로 지어야하니 몇 년은 걸린다. 따라서 재고량만으로 가격이 결정되는데 지금처럼 수요가 많으면 공급 가격이 크게 오른다.
반면 빅테크 기업이 AI 가속기용 반도체를 쓸어가면서 국내 AI 반도체 기업들도 영향을 받고 있다. 퓨리오사AI와 리벨리온 모두 AI 가속기에 HBM3, HBM3E를 탑재하며, 공식적으로 수급 불균형을 언급한 적은 없다. 다만 전 세계적으로 HBM 공급 자체가 병목인 상황이라 안전지대라고 보기는 어렵다. 모빌린트, 딥엑스 등은 D램 메모리 반도체 기반이어서 HBM만큼 영향이 크진 않다. 대신에 2025년 4분기 DDR5 계약 가격이 20%, 현물 가격도 30%씩 오르고 있어서 장기적으로는 영향을 받을 수 있다.
결론적으로 메모리 반도체는 AI 가속기가 구동할 수 있는 AI 모델의 크기와 성능에 영향을 주는 요소며, 많은 제조사가 더 빠르고 큰 용량의 메모리 반도체를 탑재하기 위해 메모리를 수급 중이다.
다만 메모리 반도체의 생산량에는 한계가 있고, 이를 늘리려면 몇 년이 걸린다. 결국 생산량이 고정된 상황에서 수요만 늘어나니 메모리 반도체 가격이 오른다. 수급을 못한다면 결국 AI 가속기 생산 자체가 지연된다. 우리나라가 메모리 반도체 종주국이어서 다른 국가에 비해 수급 등이 유리하다는 점은 안심할만한 부분이다.
