또 하나의 기적의 배터리일까? 케임브리지의 초저전력 AI 멤리스터 칩 심층 분석


Dr Babak Bakhit

최근 AI 인프라를 설계하거나 운영해보신 분들이라면 뼈저리게 공감하실 겁니다. 지금 AI 산업의 가장 큰 병목은 컴퓨팅 파워나 데이터가 아니라 바로 전력(Power) 입니다. 최신 GPU 클러스터를 돌리기 위해 소모되는 전력량은 이미 일개 도시의 전력망을 위협할 수준에 도달했습니다.

이 문제의 근본적인 원인은 폰 노이만 구조의 한계, 즉 메모리와 프로세싱 유닛 사이에서 끊임없이 데이터를 주고받아야 하는 병목(Von Neumann Bottleneck)에 있습니다. 이를 해결하기 위해 연산과 저장을 한 곳에서 처리하는 뉴로모픽(Neuromorphic) 컴퓨팅이 오랫동안 차세대 기술로 거론되어 왔죠.

최근 케임브리지 대학 연구팀이 Science Advances에 흥미로운 논문을 발표했습니다. 인간의 뇌를 모방하여 AI 전력 소모를 획기적으로 줄일 수 있는 새로운 하프늄 산화물(Hafnium oxide) 기반의 멤리스터(Memristor)를 개발했다는 소식입니다. 하지만 15년 넘게 현업에서 수많은 혁신적인 하드웨어들이 소리 소문 없이 사라지는 것을 지켜본 엔지니어로서, 이 기술이 정말 프로덕션 레벨에 도달할 수 있을지 냉정하게 뜯어보겠습니다.

기존 멤리스터의 한계: 랜덤 가챠 게임

멤리스터 기술 자체는 새로운 것이 아닙니다. 기존의 많은 멤리스터들은 금속 산화물 내부에 미세한 전도성 필라멘트(conductive filaments)를 형성하고 끊는 방식으로 작동했습니다.

하지만 시스템 엔지니어 관점에서 이 방식은 치명적인 단점이 있습니다. 바로 동작이 예측 불가능(Random behavior) 하다는 것입니다. 필라멘트가 형성되는 과정 자체가 확률적이기 때문에, 수백만 개의 소자가 균일하게 동작해야 하는 대규모 컴퓨팅 시스템에서는 신뢰성을 보장할 수 없습니다. 또한 이 필라멘트를 형성하고 끊기 위해 높은 전압이 필요해 저전력이라는 본래의 목적도 퇴색되곤 했습니다.

케임브리지의 돌파구: 필라멘트 대신 계면(Interface) 제어

케임브리지 연구팀(Dr Babak Bakhit 주도)은 이 불안정한 필라멘트 방식을 과감히 버렸습니다. 대신 그들은 하프늄 기반 박막에 스트론튬(Strontium)과 티타늄(Titanium)을 첨가하는 2단계 증착 방식을 통해, 산화물 층이 만나는 계면에 미세한 p-n junction(접합) 을 형성했습니다.

이 접근법이 기술적으로 우수한 이유는 저항을 바꾸는 메커니즘이 물리적인 필라멘트의 파괴와 생성이 아니라, 계면의 에너지 장벽(Energy barrier) 높이를 부드럽게 조절 하는 방식으로 바뀌었기 때문입니다.

  • 초저전력: 기존 산화물 소자 대비 스위칭 전류를 약 100만 배 낮췄습니다.
  • 아날로그 컴퓨팅: 단순히 0과 1이 아니라 수백 개의 안정적인 전도도 상태(conductance levels)를 유지할 수 있습니다. 이는 in-memory 컴퓨팅에서 가중치(weight)를 저장하는 데 필수적인 요소입니다.
  • STDP 구현: 생물학적 뉴런이 신호 도착 시간에 따라 연결 강도를 조절하는 스파이크 타이밍 의존 가소성(Spike-timing dependent plasticity)을 하드웨어 레벨에서 재현했습니다.

이론적으로만 보면, AI 하드웨어의 패러다임을 바꿀 수 있는 엄청난 스펙입니다.

엔지니어의 시선: 왜 당장 프로덕션에 쓸 수 없는가?

솔직히 말씀드리면, 논문을 읽으면서 감탄하다가 후반부의 한 문장에서 탄식을 내뱉었습니다.

“The current fabrication process requires temperatures of around 700°C”

현재 이 소자를 제작하려면 약 700°C의 고온 공정이 필요합니다. 반도체 업계에 계신 분들이라면 이게 무슨 의미인지 바로 아실 겁니다. 현대의 표준 CMOS 공정(Back-End-Of-Line, BEOL)에서 허용되는 열 수지(Thermal budget)는 보통 400°C 이하입니다. 이미 만들어진 트랜지스터 위에 이 멤리스터를 올리기 위해 700°C로 가열한다면? 하단에 있는 로직 칩은 다 녹아내리거나 특성이 망가져 버립니다.

논문의 저자도 이를 “가장 큰 과제”라고 인정하며 온도를 낮추기 위해 노력 중이라고 밝혔지만, 재료 공학에서 공정 온도를 300도 이상 낮추면서 동일한 소자 특성을 유지하는 것은 완전히 새로운 논문을 몇 편은 더 써야 할 만큼 어려운 일입니다.

Hacker News의 냉소적인 반응

이 소식이 전해진 Hacker News 커뮤니티의 반응도 저와 크게 다르지 않습니다. 현업 엔지니어들이 모인 곳답게 매우 냉소적입니다.

한 유저는 이렇게 꼬집었습니다.

“이런 논문들은 매주 쏟아지는 ‘새로운 배터리 혁명’이나 ‘새로운 암 치료법’ 기사와 현재로서는 다를 바가 없다.”

또 다른 유저는 “Law of headlines - ‘could happen’ would never happen (‘~할 수도 있다’는 기사 제목은 절대 일어나지 않는다는 법칙)” 이라며 언론의 설레발을 비판했습니다. 3년 전, 5년 전에도 비슷한 멤리스터 혁명 기사가 있었지만 여전히 우리는 폰 노이만 구조의 GPU를 쓰고 있다는 사실이 이를 방증합니다.

Conclusion: 지켜볼 가치는 있지만, 아직은 랩(Lab) 수준의 장난감

케임브리지 팀의 이번 연구는 재료 과학(Materials Science) 측면에서는 분명 훌륭한 성과입니다. 필라멘트 방식의 고질적인 한계를 계면 에너지 장벽 제어로 우회한 아이디어는 매우 우아(elegant)합니다.

하지만 이를 당장 내년이나 내후년의 AI 인프라에 적용할 수 있는 엔지니어링 프로덕트로 기대한다면 큰 오산입니다. 700°C라는 공정 온도 문제가 해결되어 기존 CMOS 공정과 통합(Integration)될 수 있다는 것을 증명하기 전까지, 이 기술은 안타깝게도 실험실 밖을 나오기 힘든 랩 수준의 장난감에 불과합니다.

AI 전력 문제를 해결할 실버 불렛(Silver Bullet)을 찾고 계셨다면, 당분간은 기존처럼 모델 경량화(Quantization), 효율적인 커널 작성, 그리고 데이터센터 쿨링 최적화에 엔지니어링 리소스를 쏟는 것이 훨씬 현실적인 접근일 것입니다.


References: