Goodbye RHIC: 25년의 여정과 Big Science가 남긴 기술적 유산


엔지니어로서 커리어를 쌓다 보면, 우리가 매일 사용하는 기술 스택의 기원이 어디인지 잊어버릴 때가 많습니다. 단순히 ‘오픈소스 커뮤니티’ 어딘가에서 뚝딱 만들어졌다고 생각하기 쉽지만, 사실 우리가 누리는 많은 혁신은 극한의 상황을 타개하려는 Big Science(거대 과학) 프로젝트에서 시작되었습니다.

최근 브룩헤이븐 국립연구소(BNL)의 RHIC(Relativistic Heavy Ion Collider) 가 25년 간의 가동을 마치고 마지막 충돌 실험을 끝냈다는 소식이 들려왔습니다. 단순히 물리학계의 뉴스로 치부하기엔, 이 거대한 기계가 우리 IT 업계에 남긴 레거시와 운영 노하우가 너무나 큽니다. 오늘은 RHIC의 은퇴를 맞아, ‘물리학 실험’이 아닌 ‘극한의 엔지니어링’ 관점에서 이 사건을 뜯어보려 합니다.

1. 분당 1,000달러의 Downtime: 극한의 SRE 환경

Hacker News의 한 스레드에 전직 대학원생이 남긴 코멘트는 우리 같은 인프라 엔지니어들에게 시사하는 바가 큽니다. 그는 RHIC의 STAR 제어실에서 ‘Graveyard shift(새벽 12:30~7:30)‘를 보냈던 경험을 공유했습니다.

“초전도체(Superconductors)를 냉각 온도로 내리는 것은 엄청난 비용이 듭니다. 일단 온도를 맞췄다면, 그때부터는 24/7 무조건 돌려야 합니다. 빔 타임(Beam time) 1분당 비용이 약 1,000달러였습니다.”

우리가 클라우드에서 High Availability(고가용성) 를 외치며 99.999%를 추구하는 것과 본질적으로 같습니다. 하지만 여기서는 서버 재부팅이 단순히 서비스 지연을 의미하는 게 아니라, 막대한 물리적 비용과 다시는 돌아오지 않을 ‘실험 시즌’의 손실을 의미합니다.

재미있는 점은 ‘실험 시즌(Experimental Season)’ 이라는 개념입니다. 왜 1년 내내 돌리지 않을까요? 바로 전력 비용(Electricity Cost) 때문입니다. 가속기는 도시 하나가 쓸법한 전력을 소모합니다. 일본의 RIKEN이나 유럽의 CERN 같은 경우, 전력 수요가 가장 낮은 봄/가을에 전력 회사와 협약을 맺고 집중적으로 가동합니다. 여름철 에어컨 부하가 걸리는 시기에는 아예 셧다운을 하죠.

이는 마치 우리가 클라우드 비용 절감을 위해 Spot Instance 를 스케줄링하거나, 트래픽이 적은 시간대에 배치 작업을 몰아서 처리하는 것의 ‘물리적 하드코어 버전’이라고 볼 수 있습니다.

2. 데이터가 낳은 뜻밖의 유산: Cloudant와 CouchDB

많은 개발자들이 간과하는 사실이 하나 있습니다. World Wide Web(WWW) 이 CERN에서 정보 공유를 위해 탄생했다는 건 유명하지만, NoSQL 생태계에도 물리학의 DNA가 흐르고 있다는 점입니다.

RHIC와 LHC 같은 실험은 초당 페타바이트급의 충돌 데이터를 쏟아냅니다. 이 거대한 비정형 데이터를 처리하고 분석하기 위해 물리학자들은 기존 RDBMS의 한계를 일찍이 깨달았습니다. 실제로 RHIC와 CERN 실험 데이터를 처리하기 위해 몇몇 물리학자들이 CouchDB 기반의 솔루션을 개발했고, 이것이 나중에 스핀오프되어 Cloudant 가 되었습니다. (Cloudant는 이후 IBM에 인수되어 DBaaS의 선구자가 되었죠.)

우리가 지금 편하게 쓰는 ‘확장성 있는 데이터베이스’ 기술 중 상당수는, 우주의 기원을 찾으려는 물리학자들의 ‘데이터 파이프라인 삽질’ 덕분에 탄생했습니다.

3. “돈 낭비 아닌가?”에 대한 엔지니어의 대답

Hacker News 댓글 창은 언제나 그렇듯 “이런 거대 가속기가 실생활에 무슨 도움이 되느냐”는 회의론과 옹호론이 팽팽했습니다. 한 유저는 “산업적 제품으로 연결된 발견이 있느냐”고 물었죠. 이에 대한 답변들이 꽤 인상적입니다.

  • EUV 리소그래피: 우리가 쓰는 최신 반도체 칩을 만드는 EUV 광원은 가속기 기술(Synchrotron radiation 등)에서 파생되었습니다. 즉, 가속기가 없었다면 지금의 아이폰도, 엔비디아 GPU도 없었을 겁니다.
  • MRI: 페르미랩의 Tevatron 건설 당시 초전도 자석의 대량 생산 수요가 발생했고, 이것이 산업계의 생산 능력을 키워 MRI가 보급되는 결정적 계기가 되었습니다.
  • 의료용 동위원소 & 암 치료: 양성자 치료나 PET 스캔에 쓰이는 기술 역시 가속기 연구의 직접적인 산물입니다.

개인적으로, “가장 작은 것을 보기 위해 가장 큰 기계를 만들어야 한다” 는 역설이 엔지니어링의 정수라고 생각합니다. 댓글 중 한 명이 지적했듯이, 트랜지스터는 처음엔 컸지만 작아질 수 있었던 반면, 입자 가속기는 물리법칙의 에너지 스케일(Electroweak scale) 때문에 거대해질 수밖에 없는 숙명을 가집니다. 이것은 최적화의 문제가 아니라, 물리적 제약 조건(Constraints) 그 자체입니다.

4. RHIC의 퇴장, 그리고 eRHIC의 등장

RHIC는 이제 역사 속으로 사라지지만, 그 터널은 버려지지 않습니다. 그 자리에 Electron-Ion Collider (EIC) 가 들어설 예정입니다. 기존 인프라(터널, 실험실)를 재사용하면서 새로운 기능을 탑재하는, 말하자면 대규모 Legacy Refactoring 프로젝트인 셈입니다.

BNL 주변의 환경 오염 이슈(Cesium-137, 삼중수소 등)에 대한 우려 섞인 목소리도 있었지만, 과학자들은 이를 엄격히 통제하며 데이터를 축적해왔습니다. (물론 90년대의 관리가 지금 기준으로는 미흡했을 수 있다는 점은 인정해야 합니다.)

Verdict: 순수 과학은 최고의 R&D 샌드박스다

엔지니어로서 저는 RHIC의 셧다운을 보며 경외감을 느낍니다. 25년 전 설계된 시스템이 지금까지 현역으로 뛰며 노벨상급 발견을 쏟아내고, 그 과정에서 파생된 데이터 기술이 IT 업계를 먹여 살렸습니다.

우리는 종종 당장의 ROI(투자 대비 수익) 만을 따지며 기술을 평가하곤 합니다. 하지만 Cloudant가 그랬듯, 가장 혁신적인 기술은 때로 ‘수익’이 아닌 ‘순수한 호기심’을 해결하려는 과정에서 부산물로 튀어나옵니다.

RHIC는 멈췄지만, 그들이 남긴 데이터와 인프라 운영의 교훈은 여전히 유효합니다. “RHIC is dead. Long live eRHIC.”