코딩의 종말? '생각하는 돌'과 1인 R&D 랩의 시대
최근 Hacker News와 기술 블로그 스피어를 뜨겁게 달군 글이 하나 있습니다. 바로 1X Technologies의 VP of AI인 Eric Jang이 쓴 As Rocks May Think 라는 글입니다. 제목부터 심상치 않습니다. 1945년 Vannevar Bush의 전설적인 에세이 ‘As We May Think’를 오마주한 것인데, 핵심은 “이제 돌덩어리(Silicon)들이 생각(Reasoning)을 하기 시작했다” 는 것입니다.
Principal Engineer로서 이 글을 읽으며 등골이 서늘해지기도 했고, 한편으론 엄청난 흥분을 느꼈습니다. 오늘은 이 글이 던지는 충격적인 메시지와 기술적 함의, 그리고 우리 엔지니어들이 당장 무엇을 준비해야 하는지 딥다이브 해보겠습니다.
1. 더 이상 코드를 직접 짜지 않는다
저자는 지난 두 달간 Claude Code 에 빠져 살면서, “더 이상 손으로 코드를 짤 필요가 없다”는 사실을 받아들이느라 고군분투했다고 고백합니다. 단순히 GitHub Copilot이 자동완성 해주는 수준이 아닙니다. 그는 AlphaGo를 바닥부터 다시 구현하는 프로젝트를 진행했는데, 여기서 Claude를 ‘자동화된 과학자(Automated Scientist)’ 로 활용했습니다.
그가 구축한 워크플로우는 충격적일 정도로 효율적입니다. /experiment라는 명령어를 통해 에이전트에게 다음과 같은 루프를 실행시킵니다:
- 실험 설계: 날짜와 슬러그로 된 실험 폴더 생성
- 코드 작성 및 실행: 단일 Python 파일로 실험 루틴 작성 후 실행
- 데이터 저장: 결과물(Artifacts)을 CSV 등으로 저장
- 분석 및 보고: 결과를 분석하고 결론을 도출하여
report.md작성 - 다음 실험 제안: 무엇이 밝혀졌고 무엇이 불확실한지 판단하여 다음 실험 계획 수립
이것은 단순한 ‘코딩’이 아니라 ‘연구(Research)‘의 자동화 입니다. 예전 같으면 구글의 Vizier 같은 복잡한 하이퍼파라미터 튜닝 시스템을 셋업해야 했지만, 이제는 에이전트가 코드를 스스로 수정해가며 가설을 검증합니다.
“소프트웨어 엔지니어링은 시작일 뿐이다. 진짜 핵심은 우리가 이제 컴퓨터를 사용하여 거의 모든 짧은 디지털 문제를 해결할 수 있는 범용 사고 기계를 갖게 되었다는 것이다.”
2. 프롬프트 엔지니어링의 죽음과 Reasoning의 부상
기술적으로 가장 흥미로운 부분은 Reasoning(추론) 모델의 발전 과정에 대한 분석입니다. 2023년까지만 해도 우리는 ‘Chain-of-Thought’나 ‘Self-Reflection’ 같은 프롬프트 엔지니어링 기법(저자는 이를 “운 좋은 회로를 찾아내는 탐광 작업”이라고 폄하합니다)에 매달렸습니다. 하지만 이는 모델 자체의 추론 능력을 키우는 근본적인 해결책이 아니었습니다.
DeepSeek R1 과 OpenAI o1 이 증명한 것은, 적절한 RL(강화학습) 이 있으면 모델이 스스로 ‘생각하는 법’을 배울 수 있다는 점입니다. 특히 DeepSeek R1-Zero의 사례는 엔지니어들에게 큰 충격을 주었습니다.
- 기존 통념: 중간 추론 단계(Intermediate steps)를 사람이 일일이 감독(Process Supervision)해야 모델이 논리적으로 변할 것이다.
- 새로운 발견: 결과만 좋으면 보상을 주는 Outcome-based RL 만으로도, 충분히 강력한 Base Model은 스스로 논리적인 사고 과정을 ‘발견’해낸다.
저자는 이를 행성의 움직임(결과)만 보고 물리학 법칙(중간 과정)을 스스로 깨우치는 것에 비유합니다. 즉, 우리는 이제 ‘프롬프트 깎는 노인’이 아니라, 모델이 올바른 사고 회로를 형성하도록 데이터와 보상 체계를 설계하는 아키텍트 가 되어야 합니다.
3. 생각의 시가총액 (The Market Cap of Thought)
이 글에서 가장 인상 깊은 비유는 “에어컨과 컴퓨트(Compute)” 입니다. 리콴유 싱가포르 전 총리는 에어컨이 열대 지방의 생산성을 혁명적으로 바꿨다고 말했죠. 저자는 Automated Thinking 이 전 세계적인 Inference Compute(추론 연산) 수요 폭발을 일으킬 것이라 예측합니다.
지금은 우리가 ChatGPT에 질문 하나 던지고 답변을 기다리지만, 미래의 워크플로우는 다릅니다.
- 엔지니어가 퇴근하면서 에이전트에게 “이 아키텍처의 최적 파라미터를 찾아줘”라고 명령.
- 밤새 수백 개의 에이전트(병렬 Claude 세션)가 수천 번의 실험과 실패, 재시도를 반복.
- 아침에 출근하면 에이전트가 작성한 최종 보고서 와 완성된 코드 가 도착해 있음.
이런 시나리오라면, 지금의 GPU 부족 현상은 예고편에 불과합니다. 기업들은 ‘생각하는 돌’들을 24시간 돌려 기술 부채를 줄이고, 전략을 짜고, 경쟁사를 분석할 것입니다. 저자의 표현을 빌리자면 “007(0시부터 0시까지 주 7일)이 새로운 996” 이 되는 셈입니다.
4. 엔지니어의 역할 변화: Coder에서 Director로
Hacker News 댓글들을 보면 “이건 과장이다”, “결국 1X 홍보 아니냐”는 냉소적인 반응도 있습니다. 물론 저자가 AI 로봇 회사 임원이니 편향이 있을 수 있습니다. 하지만 기술적 트렌드는 명확합니다.
과거 우리가 Linked List나 Hash Map을 배웠다면, 이제는 “자연어 이해(Natural Language Comprehension)” 가 새로운 CS의 Primitive가 되었습니다. 복잡한 자료구조를 직접 구현하는 대신, LLM에게 “전체적인 맥락을 보고 해결책을 찾아봐”라고 지시하는 것이 더 효율적인 알고리즘이 되고 있습니다.
저자가 제안하는 조언은 뼈아픕니다:
- 소프트웨어 조직: 당신의 팀이 아직도 수동으로 코드를 짜고 있다면, ‘디지털 천재들’을 활용하는 조직에게 필패할 것이다.
- 연구자: 자동화된 연구(Automated Research)가 새로운 메타다. 슬럼(Slurm)에 잡 하나씩 던지는 연구자는 도태된다.
5. 결론: 개인적인 견해
솔직히 고백하자면, 저도 처음엔 “AI가 코딩을 해봤자 얼마나 하겠어”라고 생각했습니다. 하지만 최근 Cursor나 Claude 3.7 같은 도구들을 써보며 생각이 완전히 바뀌었습니다. 이제 ‘주니어 개발자’의 역할은 AI가 거의 완벽하게 대체 할 수 있는 수준에 도달했습니다.
하지만 이것이 ‘개발자의 종말’을 의미하진 않습니다. 오히려 1인 개발자가 거대 테크 기업의 R&D 랩(Lab) 수준의 아웃풋을 낼 수 있는 시대 가 열린 것입니다. 이제 중요한 건 ‘코드를 얼마나 빨리 치느냐’가 아니라, ‘무엇을 만들 것인가’, ‘어떤 가설을 검증할 것인가’를 결정하는 판단력(Judgment) 입니다.
Hacker News의 한 댓글처럼, 이것은 “MMO 게임의 대규모 업데이트”입니다. 서버 룰이 바뀌었습니다. 기존 방식대로 플레이하면 집니다. 이제 우리는 코더(Coder)가 아니라, 수십 명의 AI 에이전트를 지휘하는 테크니컬 디렉터(Technical Director) 가 되어야 합니다.
Verdict: 이 기술은 더 이상 Toy가 아닙니다. Production Level의 워크플로우를 완전히 재편하고 있습니다. 당장 여러분의 IDE와 터미널 워크플로우에 AI 에이전트를 통합하지 않는다면, 2년 뒤엔 정말로 따라잡기 힘들지도 모릅니다.