후각의 디지털화: 냄새의 RGB를 찾는 엔지니어링 여정


서론: 우리는 왜 아직도 냄새를 ‘전송’하지 못할까?

엔지니어로서 우리는 지난 수십 년간 시각과 청각을 완벽하게 정복했습니다. 카메라는 픽셀(RGB)로 세상을 캡처하고, 마이크는 주파수로 소리를 샘플링합니다. 이 데이터들은 0과 1로 변환되어 지구 반대편으로 전송되고, 거의 손실 없이 재생됩니다. 하지만 ‘후각’은 어떤가요?

우리는 여전히 “오늘 비 냄새가 나네”라는 텍스트 메시지 외에는 그 경험을 공유할 방법이 없습니다. 냄새는 여전히 아날로그의 영역에 갇혀 있습니다. 엔지니어링 관점에서 보자면, 후각은 ‘Standardization(표준화)‘과 ‘Digitization(디지털화)‘이 전혀 이루어지지 않은 레거시 시스템 이나 다름없습니다.

최근 구글 리서치에서 스핀오프한 Osmo 와 같은 스타트업들이 이 난제에 도전하고 있습니다. 그들이 사용하는 도구는 바로 GNN(Graph Neural Networks) 입니다. 오늘은 이들이 어떻게 ‘냄새’라는 비정형 데이터를 벡터 공간으로 매핑하고 있는지, 그리고 그 과정에서 우리가 배울 수 있는 기술적 통찰은 무엇인지 깊게 파고들어 보겠습니다.

1. 문제의 정의: 구조-냄새 관계(SOR)의 역설

시각은 파장(Wavelength)이라는 명확한 물리적 기준이 있습니다. 하지만 냄새는 화학(Chemistry) 입니다. 분자가 코 속의 수용체(Receptor)와 결합하여 뇌로 신호를 보내는 과정이죠. 여기서 엔지니어들이 겪는 첫 번째 멘붕 포인트가 옵니다. 바로 SOR(Structure-Odor Relationship) 역설 입니다.

  • 비슷한 구조, 다른 냄새: 분자 구조가 거의 똑같은 거울상 이성질체(Chiral pair)인 카르본(Carvone)의 경우, 하나는 스피어민트 향이 나고 다른 하나는 캐러웨이(향신료) 향이 납니다.
  • 다른 구조, 같은 냄새: 머스크(Musk) 향을 내는 분자들은 구조적으로 거대 고리형(Macrocycles)부터 니트로 벤젠 계열까지 완전히 다르게 생겼지만, 우리는 이를 비슷하게 인식합니다.

이건 마치 해시 함수(Hash Function)의 충돌(Collision) 문제와 비슷합니다. 입력값(분자 구조)과 출력값(인지된 냄새) 사이의 매핑 함수가 비선형적이고, 다차원적이며, 노이즈가 심하다는 뜻입니다. 기존의 방식(Rule-based)으로는 도저히 풀 수 없는 문제입니다.

2. 해결책: 분자를 그래프로, 냄새를 벡터로

과거에는 분자의 특성(원자 개수, 분자량 등)을 엑셀 시트처럼 나열해서 머신러닝을 돌렸습니다(Random Forest 같은 방식). 하지만 구글 브레인(현 DeepMind) 팀은 접근 방식을 바꿨습니다. 분자를 그래프(Graph) 로 취급한 것입니다.

GNN (Graph Neural Networks)의 적용

이들이 사용한 모델은 분자의 원자를 노드(Node) 로, 화학 결합을 엣지(Edge) 로 정의합니다. 여기서 핵심은 Message Passing 메커니즘입니다.

  1. 각 원자(노드)는 자신의 정보(탄소인지 산소인지 등)를 가지고 시작합니다.
  2. 레이어를 거칠 때마다 이웃 노드와 정보를 교환합니다.
  3. 이를 통해 모델은 단순히 “탄소가 있다”는 사실을 넘어, “이 탄소는 이중 결합된 산소 옆에 있고, 벤젠 고리의 일부다”라는 Contextual Information 을 학습합니다.
  4. 최종적으로 이 정보들은 63차원(또는 그 이상)의 고정된 벡터, 즉 Odor Embedding 으로 압축됩니다.

이것이 바로 POM(Principal Odor Map) 입니다. 자연어 처리(NLP)에서 Word2Vec이 ‘왕’과 ‘여왕’을 벡터 공간상 가깝게 배치하듯, POM은 구조가 달라도 냄새가 비슷한 분자들을 벡터 공간상 가깝게 배치합니다. 이제 우리는 냄새를 좌표(Coordinate) 로 다룰 수 있게 된 것입니다.

3. 실제 응용: 향수를 넘어선 가능성

많은 분들이 “그래서 AI로 향수 만드는 게 전부야?”라고 생각할 수 있습니다. 물론 Osmo 같은 기업은 새로운 향료(Glossine, Fractaline 등)를 생성하고 있습니다. 하지만 엔지니어로서 제가 흥미를 느끼는 부분은 따로 있습니다.

  • DEET 대체제 발견: 이 모델은 냄새의 ‘지각’뿐만 아니라 생물학적 반응도 예측합니다. 모기가 싫어하는 분자 구조를 역설계하여, 독성이 있는 DEET보다 안전하고 효과적인 방충제를 찾아냈습니다.
  • 디지털 질병 진단: 파킨슨병이나 암 환자에게서 나는 특유의 휘발성 유기 화합물(VOCs)을 감지하는 ‘디지털 코’의 가능성입니다.

이것은 단순한 생성형 AI(Generative AI)의 유희가 아니라, 물질 탐색(Material Discovery) 의 영역으로 확장되는 것입니다.

4. 비판적 시각: 스피커는 있는데 마이크는 어디에?

하지만 Hacker News의 한 유저(anon)가 지적했듯, 여기에는 중요한 비대칭성이 존재합니다. 이 기술은 ‘생성(Generation)’ 에 치우쳐 있습니다. 즉, 냄새를 합성하는 ‘스피커’ 기술은 발전하고 있지만, 현실 세계의 복잡한 냄새를 감지하고 분석하는 ‘마이크(Detection)’ 기술은 여전히 갈 길이 멉니다.

실험실 환경(Clean Lab)에서 단일 분자를 예측하는 것과, 수천 가지 냄새가 섞인 지하철역에서 특정 위험 가스를 감지하는 것은 차원이 다른 문제입니다. 우리는 아직 “이 공기 중에 0.001%의 벤젠이 섞여 있어”라고 정확히 말해주는 저렴한 센서가 없습니다.

또한, “안전성(Safety)” 에 대한 우려도 있습니다. AI가 “이 분자는 장미 향이 나고 안전할 확률이 99%입니다”라고 예측했다 하더라도, 실제 생체 내에서의 장기적인 영향(알레르기, 독성 등)은 시뮬레이션만으로는 100% 검증할 수 없습니다. “자연(Nature)보다 과학(Science)이 더 안전하다”는 주장은 엔지니어링 오만(Hubris)이 될 수도 있다는 점을 명심해야 합니다.

결론: 냄새의 API가 열리고 있다

우리는 지금 후각이라는 감각의 API 가 만들어지는 순간을 목격하고 있습니다. 아직은 v0.1 알파 버전이고, 버그도 많으며, 센서(하드웨어) 생태계는 부족합니다. 하지만 분자 구조를 입력하면 그 냄새의 벡터값을 리턴해주는 함수가 생겼다는 것은, 화학이 정보공학(Information Technology)의 영역으로 들어왔음을 의미합니다.

CTO나 시니어 엔지니어라면 이 흐름을 주목해야 합니다. 단순히 향수 산업의 변화가 아니라, 바이오(Bio)와 AI의 융합 이 어떻게 물리적 세계(Atoms)를 디지털 세계(Bits)로 치환하고 있는지 보여주는 가장 최전선의 사례이기 때문입니다.

여러분은 냄새를 디지털로 전송할 수 있는 미래가 온다면, 가장 먼저 무엇을 보내고 싶으신가요? 저는 일단 서버실의 ‘타는 냄새’를 모니터링 시스템에 연동하고 싶네요.