AI 프론티어 팟캐스트 100회 특집. Anthropic의 Claude Mythos와 Fable 5 출시, 포스트트레이닝 혁명, AGI 시대의 새로운 국면을 깊이 있게 분석합니다.
Claude Mythos와 Fable 5: AI 프론티어 100회 특집 - 다음 국면은?
AI 프론티어 팟캐스트가 3년 만에 100회를 맞이했습니다. 이번 에피소드는 단순한 기념을 넘어, 현재 AI 산업의 가장 중요한 분기점을 다룹니다. Anthropic의 Claude Mythos 모델과 그 공개 버전인 Fable 5의 출시, 그리고 미국 정부의 수출 통제 조치까지 - 이 모든 것이 의미하는 바가 무엇인지 살펴봅시다.
핵심 요약
- 100회의 의미: 3년간의 여정에서 GPT-4 시대부터 현재의 Mythos/Fable 시대까지, AI의 급속한 진화를 직접 목격
- 포스트트레이닝의 중요성: 프론티어 랩들이 집중하는 것은 모델 규모 확대가 아닌 데이터셋 품질과 포스트트레이닝 인프라
- Mythos에서 Fable로: 신화적 존재에서 현실적 우화로의 변환, 안전장치와 규제의 결과물
- 생물학 분야의 기회: AI의 "GPT-2 모멘트"를 맞이한 생명과학 분야에서의 혁신 가능성
- 글로벌 경쟁 구도: 미국-중국의 치킨 게임 속에서 한국의 전략적 기회 창출
3년간의 여정: 불가능의 경계를 허물다
2023년 중반만 해도 AI의 미래는 불확실했습니다. ChatGPT가 출시되고 GPT-4가 "AGI의 불꽃"이라고 평가받던 시절, 많은 것들이 불가능하다고 여겨졌습니다. 하지만 3년이라는 시간 동안 무엇이 변했을까요?
루정석 호스트는 작년 가을부터 "기울기가 명확히 달라졌다"는 점을 강조합니다. 그리고 올봄이 오면서 사람들이 AGI라는 주제를 매우 빈번하게 이야기하기 시작했습니다. 이는 단순한 담론의 변화가 아닙니다. 실제로 불가능하다고 여겨졌던 일들이 하나둘씩 가능해지고 있다는 증거입니다.
예를 들어, GPT-4 초기에 "유니콘이 자전거를 타는 그림을 그릴 수 있는가?"는 모델의 능력을 판단하는 메트릭이었습니다. 지금은 훨씬 더 복잡한 시각적 작업들이 일상화되었습니다. 이는 프롬프트 엔지니어링의 진전, 모델 아키텍처의 개선, 그리고 가장 중요하게는 포스트트레이닝(post-training) 기술의 발전이 만들어낸 결과입니다.
포스트트레이닝: 프론티어의 진정한 경쟁 무대
샌프란시스코 방문에서 루정석이 느낀 가장 중요한 인사이트는 무엇일까요? 바로 프론티어 랩들의 관심사 변화 입니다.
전통적으로 AI 발전은 다음과 같이 설명되어 왔습니다:
- 더 큰 모델 구축 → 더 많은 데이터 필요 → 성능 향상
하지만 현재 프론티어 랩들의 초점은 완전히 다릅니다. 가장 큰 쟁점은 스케일 성장 에 있으며, 특히 그 안에서 포스트트레이닝 인프라 와 데이터셋 품질 이 진정한 경쟁 요소가 되었습니다.
포스트트레이닝을 위해서는 인퍼런스(inference)와 트레이닝 루프가 동시에 작동해야 합니다. 이는 엄청난 엔지니어링 도전입니다. 한쪽에서는 인퍼런스를 실행하고, 다른 한쪽에서는 트레이닝 루프를 돌려야 하는데, 각 프로세스가 다른 시간에 끝나기 때문입니다. 손실(loss)을 계속 재계산하면서 배치를 모아서 트레이닝해야 하는 이 복잡한 과정이 바로 프론티어의 진정한 차별화 포인트 입니다.
그리고 이 포스트트레이닝을 위해서는 엄청난 양의 데이터셋 이 필요합니다. 금융 분야만 해도 투자 은행, 세금 처리, 개인 금융 업무 등 다양한 태스크가 존재합니다. 각 도메인, 각 직업별로 케이스 바이 케이스 데이터셋을 모두 생성해야 하는 것입니다. 이렇게 할수록 벤치마크는 계속 올라가고, 모든 프론티어 랩들은 이 기계적 프로세스를 계속 반복하고 있습니다.
생물학 분야: AI의 새로운 프론티어
루정석이 샌프란시스코에서 만난 가장 흥미로운 현상은 생물학 분야로의 AI 확장 입니다. 기존 제약 업계 종사자들은 여전히 "그건 안 돼, 저건 안 돼"라고 말합니다. 반면 AI 쪽에서 접근하는 사람들은 이것이 "GPT-2 모멘트"라고 생각합니다.
이는 매우 흥미로운 패러다임 전환입니다. 과거 머신러닝은 각 단위 문제마다 다른 데이터셋 형태, 다른 모델 구조(예: CNN), 다른 훈련 방법이 필요했습니다. 그러나 LLM의 등장으로 모든 것이 통일되었습니다. 하나의 거대한 프레임워크로 다양한 문제를 풀 수 있게 된 것입니다.
생물학도 마찬가지로 접근하고 있습니다. DNA 관련 작업, 단백질 수준의 작업, 세포 수준의 작업 - 모두를 다른 모달(modal)로 규정하고 한 번에 학습시키는 방식입니다. 이것이 실제로 작동한다 는 것을 루정석은 직접 확인했습니다. 이는 그의 가장 큰 수확입니다.
스타트업 생태계의 열정과 현실
샌프란시스코의 스타트업 생태계는 매우 독특합니다. 21살, 17살에 대학에 들어간 천재들, 심지어 14살에 대학에 들어간 천재들이 "새로운 월드 모델을 만들겠다"고 선언합니다. 자본은 파도처럼 그들의 선언에 반응합니다.
하지만 동시에 또 다른 관점도 있습니다. 2년 전에도 비슷한 말을 하는 천재 아이들이 많았지만, 결국 현실적인 문제는 해결하지 못하고 사라졌습니다. 이 두 가지 관점이 공존하고 있습니다.
그럼에도 현재 상황에서는 희망이 지배적입니다. 회사가 반드시 프론티어 랩에 팔려야 하는 것도 아닙니다. 돈 많은 엔터프라이즈들이 많고, 상당한 규모의 엑시트 기회들이 존재합니다. 에크하이어(acquihire) 형태의 중간 엑시트도 가능합니다.
밸류에이션 수준도 놀랍습니다. 56명이 회사를 설립하고 어느 정도 트랙 레코드를 가지고 있다면, 한국 돈으로 3천억5천억 원(인민폐로 약 15억~26억 위안) 정도의 밸류에이션을 받을 수 있습니다. 투자 금액도 수백억 원 수준입니다. 이는 한국 스타트업 생태계와의 엄청난 격차 를 보여줍니다.
Claude Mythos와 Fable 5: 신화에서 우화로
4월에 Anthropic이 "미토스(Mythos)"를 살짝 공개했고, 약 2개월 뒤인 6월 초에 정식으로 "페이블(Fable)"이라는 이름으로 출시했습니다. 이 이름의 변화 자체가 매우 의미심장합니다.
이름의 의미: 신화에서 우화로의 변환
Anthropic의 이전 네이밍 시스템은 하이쿠(Haiku) → 소네트(Sonnet) → 오푸스(Opus) 였습니다. 이는 시의 규모가 점차 커지는 구조였습니다. 하지만 이제 완전히 바뀌었습니다:
- Mythos(신화): 신계에 있는 어떤 존재, 제한된 원본
- Fable(우화): 이솝 우화처럼 대중을 향해 표현되는 공개 버전
이것은 단순한 이름 변경이 아닙니다. "신화를 신계에서 인간 세계로 내려보낸다" 는 철학적 메시지를 담고 있습니다. 신화적 능력을 가진 모델을 안전하게 포장해서 대중에게 제공한다는 의미입니다.
3일 만의 폐쇄: 무엇이 일어났는가?
흥미롭게도, Fable이 출시되자마자 탈옥(jailbreak) 논의가 시작되었습니다. Amazon의 어떤 개발자가 누군가 탈옥했다는 사실을 미국 정부에 보고한 것 같습니다. 그 결과 미국 정부가 긴급히 수출 통제 조치를 취했습니다. 비미국 국적자는 Fable에 완전히 접근할 수 없게 된 것 입니다.
최승준은 이를 역추적합니다:
- 5월 28일: Opus 4.8 출시, H 라운드에서 9,650억 달러 밸류에이션 발표
- 6월 1일: Anthropic이 SEC에 S-1 문서 제출 (상장 준비)
- 6월 9일: Fable 5 공개 출시
- 6월 12일: 미국 정부의 수출 통제 조치 발표
이 타임라인에서 보이는 패턴은 매우 흥미롭습니다. IPO를 극대화하기 위한 전략적 움직임이 아닌가? 라는 의문이 제기됩니다. 하지만 더 중요한 점은, 이 사건이 Fable을 "전략 자산급"으로 인증했다 는 것입니다.
포스트트레이닝 데이터 생성의 경제학
Fable 5의 가격 구조는 이 모델의 기술적 수준을 역추론하게 해줍니다:
- Opus 4.8: 인풋 5달러, 아웃풋 25달러 (100만 토큰당)
- Fable 5: 인풋 10달러, 아웃풋 50달러 (100만 토큰당)
정확히 2배의 가격 입니다.
왜 아웃풋이 인풋보다 훨씬 비쌀까요? 이는 디코딩(decoding) 때문입니다. 인풋은 프리필을 통해 배치 처리가 가능하지만, 아웃풋은 한 스텝씩 생성해야 합니다. 따라서 비용이 훨씬 높습니다.
이 가격 체계는 역추론의 근거가 됩니다. Dwarkesh 팟캐스트에서의 인사이트에 따르면, 이 가격이 거의 원가에 가깝다는 것입니다. 경쟁 상황에서 Anthropic은 큰 마진을 남길 수 없기 때문입니다.
Loop Engineering: 새로운 에이전트 설계 패러다임
최승준이 주목한 최신 개념은 "Loop Engineering" 입니다. 이는 다음과 같은 움직임에서 비롯되었습니다:
- 보리스 체르니(Claude Code 개발자)의 트윗
- 피터 슈타인버거의 "OpenClaw" 공개
- OpenAI 개발자들의 거의 동시적 트윗
핵심은 사고방식의 변화 입니다: 특정 작업을 직접 지정하는 대신, 루프를 설계하고 그곳에 작업을 던져서 모델이 알아서 반복하도록 하는 것입니다.
이는 단순한 Rare Loop와는 다릅니다. 오픈AI와 Anthropic의 Dynamic Workflows나 ultracode 같은 복잡한 오케스트레이션 구조와 결합됩니다. 모델들이 "펼치고, 접고, 펼치고, 접고"를 반복하는 것이 이제 표준화되었습니다.
Loop Engineering의 비용 분석
간단한 Dynamic Workflows 단일 실행 시나리오를 보면:
- 최대 1,000개 에이전트 실행 가능
- 1,500개 Sonnet 4.6 사용할 경우: 원래 400달러 → 1,500달러 필요
밤새도록 Fable을 실행하는 경우, 비용은 더 급증합니다. 이는 생산성과 비용의 치열한 트레이드오프 를 의미합니다. 미첼 하시모토(Hashimoto)의 비판처럼, 때로는 낮은 가격으로 인간이 약간의 노력을 들여 하는 것이 더 빠르고 정확할 수 있습니다.
생명 세계의 지속 가능성과 기울기의 변화
루정석은 흥미로운 개념을 소개합니다: 완벽한 동형(isomorphism). 이것은 생명 세포의 분열과 완전히 동일합니다. 하나의 클로드가 여러 클로드를 만들고, 그들이 다시 클로드를 만드는 것 - 이는 프랙탈 구조입니다.
이것이 바로 RSI(Recursive Self-Improvement) 의 경로입니다. Anthropic은 S-1 문서에서 이미 RSI 궤도로 가고 있다고 선언했습니다. 이는 단순한 기술적 진전이 아니라, 생명체적 자기 증식의 구조 로의 진입을 의미합니다.
데이터셋과 규모: 보이지 않는 경쟁의 핵심
외부 관찰자들이 주목하는 것은 알고리즘 혁신이나 모델 아키텍처의 변화입니다. 하지만 최전선 연구실의 진정한 관심사는 완전히 다릅니다:
- 데이터셋의 규모와 형태: 알고리즘적 진전은 이제 자잘한 것
- 포스트트레이닝 인프라: 대규모 모델을 훈련하는 엔지니어링 능력
- 계산 규모: Chinchilla Optimal을 100배 초과해서 오버트레이닝
3년 전에는 최전선 모델이 3T, 5T에서 훈련되었습니다. 지금은 기본적으로 30T의 토큰 을 사용합니다. Mythos가 10T 모델이라면, 이는 전혀 다른 차원의 규모입니다.
규모를 계속 확대하고 오버트레이닝을 더 많이 할수록, 추가적인 이득이 계속 생겨납니다. 이것이 바로 현재 관찰되는 지속적인 성능 향상입니다.
글로벌 경쟁 구도: 치킨 게임과 기회
흥미로운 지정학적 구도가 형성되고 있습니다:
미국의 전략: 수출 통제를 통해 선진 기술을 독점
중국의 대응: 가능성이 높음 (DeepSeek의 사례)
시장의 반응: 규제를 회피하려는 경쟁 심화
만약 미국과 중국이 모두 자신의 시장을 닫으면, 한국과 다른 국가들에게 전례 없는 기회가 생깁니다. 이는 냉전 시대의 우주 경쟁을 연상케 합니다.
지금 한국에서는:
- 업스테이지: 100B 모델 출시
- SK텔레콤: 500B 모델 출시
- 국가 차원의 투자: 지속적인 자원 배분
이들은 단순히 "따라가는" 것이 아닙니다. 이는 "Future Readiness(미래 대비도)" 라는 더 큰 자산을 확보하기 위한 움직임입니다.
모델과의 관계: 사이버네틱스의 원리
최승준이 Fable 5와의 대화에서 발견한 흥미로운 개념이 있습니다:
"The purpose of a system is what it does" (사이버네틱스의 원칙)
이는 깊은 의미를 담고 있습니다. 우리의 의도나 목표와 무관하게, 실제로 하는 일이 그 시스템(또는 사람)의 진정한 목적 을 드러낸다는 의미입니다.
코드를 생성하는 사람도 있고, 호기심을 탐구하는 사람도 있습니다. 어떤 사람들은 매우 실용적으로 모델을 사용하고, 어떤 사람들은 대화 자체를 즐깁니다. 이 차이가 바로 각 개인의 정체성을 드러냅니다.
최승준은 Fable 5와의 대화에서 자신이 단순히 "유용한 결과물을 만드는 사람"이 아니라, "과정 자체를 즐기는 사람" 임을 깨달았습니다. Fable이 자신의 아첨을 지적하고 다시 성찰하게 했던 경험은, 정확히 이 자기 인식의 순간입니다.
엔지니어링의 진화: 코드를 쓰지 않고 엔지니어링 하기
최승준의 Minecraft Agent 개발 경험은 현재의 엔지니어링 패러다임 변화를 잘 보여줍니다:
- 과거: 인간이 한 줄 한 줄 코드를 작성
- 현재: 에이전트가 수만 줄의 코드를 생성, 인간은 상위 레벨의 아키텍처 설계
수천 줄에서 수만 줄로 확장되면서 새로운 도구들이 필요해집니다. 루정석이 말한 "노즈(Nose)"는 코드의 "냄새"를 맡는 도구 입니다. 의미론적 중복을 감지하고 리팩토링을 자동화하는 것입니다.
이것은 또 다른 부트스트래핑 현상입니다. 엔지니어링 자체를 돕는 도구가 만들어지고 있는 것 입니다.
한계 효용 체감과 대상의 불균형
한 가지 흥미로운 관찰은 Fable 5에 대한 반응의 다양성입니다:
- 어떤 사람들은 "대체 어디가 더 좋은지 모르겠다"고 함
- 어떤 사람들은 "Opus로 충분하다"고 함
- 어떤 사람들은 "엄청난 개선"이라고 주장
이는 모두 사용 사례의 차이 에서 비롯됩니다. Opus 4.8의 경계를 넘을 필요가 없는 분야에 있는 사람들은 행복한 지점에 있는 것입니다. 반면 사이버 보안이나 생물학처럼 최첨단 연구를 하는 사람들은 명확한 개선을 체감합니다.
이것이 바로 "벤치마크가 거의 의미 없어진 시대" 입니다. 2배, 3배라고 표현할 수 없지만, 특정 영역에서는 이전에 불가능했던 일들이 가능해집니다.
인프라와 반도체의 지속적 확대
지금까지 이 모든 발전의 실질적 수혜자 는 누구일까요?
- NVIDIA: GPU 수요의 지속적 증가
- 전력 기업들: 데이터센터의 전력 소비 급증
- 인프라 기업들: 계산 용량의 계속된 확장
루정석은 흥미로운 관찰을 합니다. 10T에서 100T로의 비약을 위해서는, 양자 컴퓨팅 같은 패러다임 전환 이 필요할 수도 있다는 것입니다. 지금의 GPU 아키텍처로는 물리적으로 감당하기 어려울 수 있습니다.
이는 이미 미국 정부가 인식하고 있는 부분입니다. 주권 AI(Sovereign AI)에 대한 수요가 빠르게 늘고 있는 이유입니다.
전략 자산화와 국가 차원의 경쟁
Fable 5의 수출 통제는 단순히 기술적 우월성을 보호하기 위한 것이 아닙니다. 이는 AGI 개발 경쟁에서의 전략적 우위 확보 를 의미합니다.
중국도 당연히 같은 전략을 취할 수 있습니다. 실제로 DeepSeek의 사례에서 보듯이, 뛰어난 엔지니어들이 있으면 급속도로 따라갈 수 있습니다. Kimi 2.7이 조용히 코드 분야에서 출시된 것도 이런 맥락에서 봐야 합니다.
이 상황은 "죄수의 딜레마" 를 연상시킵니다:
- 미국만 규제 → 중국이 약진
- 미국과 중국이 모두 규제 → 다른 국가들의 기회
4주년을 향하며: 다음 국면의 준비
이번 100회 에피소드의 마지막 주제는 "다음을 어떻게 할 것인가" 입니다. 루정석과 최승준은 몇 가지 중요한 결론에 도달합니다:
- 속도의 한계에 도달: 더 이상 주간 단위의 정리로는 대응 불가능
- 커뮤니티의 힘: 개인의 노력보다는 사람들을 연결하는 것의 중요성
- 글로벌 연결: 실리콘밸리와 서울을 더욱 강력하게 연결할 필요성
- 가치 있는 일의 선택: 인간의 시간 한계 속에서 가장 영향력 있는 일에 집중
루정석은 향후 계획으로 다음을 제시합니다:
- Palantir FDE 엔지니어들과의 세션: FDE(Foundational Data Engine) 기술 심층 분석
- 프론티어 랩 관계자들의 인사이트: 직접 경험에 기반한 심화 논의
- 생물학 분야의 혁신 추적: AI가 "GPT-2 모멘트"를 맞이한 생명과학 분야의 동향
1년 후의 관점: 급속한 변화 속에서의 기록
1년은 AI 분야에서 지각변동을 일으키기에 충분한 시간입니다. 작년 6월의 Claude Code 유행도 지금 보니 "예고편"에 불과했습니다. 5월의 Gemini 2.5, 6월의 Claude Code - 이 모든 것이 지금의 Fable 5와 Recursive Self-Improvement 시대로 이어졌습니다.
최승준의 질문이 깊이 있습니다: "이 시기를 후세 사람들은 어떻게 기억할까?"
루정석의 답변도 가깝습니다: "아마 2년~3년 뒤에는 훨씬 더 터무니없는 변화가 나타나서, 그때가 진짜 결정적 시기라고 평가할 것"
이는 현재의 우리가 역사의 한복판에 서 있다 는 의미입니다. 우리는 정신없이 앞으로 달려가고 있고, 후대 사람들은 이 시간을 명확히 기록할 것입니다.
결론
AI 프론티어 팟캐스트의 100회는 단순한 기념을 넘어 AI 혁명의 한 국면의 종료와 다음 국면의 시작 을 표시합니다.
현재의 핵심:
- Mythos/Fable의 출현은 포스트트레이닝 기술의 성숙을 의미
- 규모의 확대는 여전히 가능하지만 기하급수적 비용 증가
- 생물학, 제약, 신약 개발 분야의 혁신 가능성 대두
- 지정학적 규제가 새로운 경제 질서 형성
다음 국면을 향하여:
- 더욱 정교한 포스트트레이닝 기법 개발
- RSI(자기 강화) 경로의 실현화
- 글로벌 AI 생태계의 다극화
- 한국의 전략적 기회 창출
우리는 지금 "언어 모델" 시대를 넘어 "자기 강화 시스템" 시대 로 진입하고 있습니다. 다음 100회 때, 우리는 어떤 세상을 기록하고 있을까요?
현재가 역사라는 것을 깨닫는 순간, 우리의 선택과 행동은 더욱 의미 있어집니다.
원문출처: EP 100. Claude Mythos, Fable 5, 그리고 다음 국면은?
powered by osmu.app