안드레이 카파시와의 인터뷰를 통해 배우는 AI 에이전트의 미래, 자동 연구, 그리고 스타트업이 이 기술을 활용하는 방법을 완벽히 정리했습니다.
AI 에이전트와 자동화 연구: 창업자가 알아야 할 모든 것
핵심 요약
- AI 에이전트가 인간의 작업 방식을 완전히 변화 시키고 있으며, 안드레이 카파시는 하루에 16시간을 에이전트에게 자신의 의지를 표현하는 데 사용합니다
- 자동 연구(Auto Research) 라는 새로운 개념이 LLM 훈련을 혁신하고 있으며, 인간 연구자를 루프에서 제거하면서 효율성을 극대화합니다
- 오픈소스 모델의 성장 으로 프론티어 AI 기술이 일반인에게도 빠르게 접근 가능해지고 있습니다
- 디지털과 물리 세계의 상호작용 이 미래의 가장 큰 기회이며, 스타트업들이 이 시장에서 성공할 수 있습니다
- 교육과 문서화의 패러다임 전환 으로, 더 이상 인간을 위한 설명이 아니라 AI 에이전트를 위한 명확한 명령어가 중요해집니다
AI 에이전트 시대의 도래: "코딩"이라는 단어는 더 이상 적절하지 않습니다
"코딩"이라는 단어는 이제 적절한 표현이 아닙니다. 이것은 단순히 언어적 변화가 아니라, 소프트웨어 개발의 본질적인 전환을 의미합니다.
안드레이 카파시가 강조한 가장 중요한 포인트는 개인의 생산성에서 일어난 급격한 변화 입니다. 12월 이후로 직접 한 줄의 코드도 타이핑하지 않았다고 말했을 정도입니다. 이전에는 자신이 80%, 에이전트가 20%의 작업을 했다면, 이제는 그 비율이 완전히 역전되어 에이전트가 80% 이상을 담당합니다.
이러한 변화는 개별 개발자에게만 해당되는 것이 아닙니다. Conviction 팀의 엔지니어들은 더 이상 직접 코드를 작성하지 않습니다. 대신 마이크를 착용하고 에이전트에게 속삭이며 일합니다. 이것이 미래의 소프트웨어 개발 모습입니다. 초기에는 이러한 방식이 이상해 보일 수 있지만, 실제로 작동하면서 모든 것이 명확해집니다.
AI 에이전트가 가능하게 만드는 것들:
- 단일 세션을 넘어 여러 에이전트 간의 협력
- 매크로 액션 단위의 작업 처리 (함수 단위가 아닌 기능 전체 구현)
- 병렬 처리를 통한 시간 단축
- 인간의 개입을 최소화한 자율적 작업 수행
"편집증 상태"의 가치: 토큰과 컴퓨팅 리소스의 최대화
카파시가 표현한 "편집증 상태"는 현재 AI 개발자가 느끼는 불안감과 동기를 정확히 설명합니다. 사용할 수 있는 리소스를 완전히 활용하지 못하고 있다는 생각 이 지속적인 혁신의 원동력이 됩니다.
이는 박사 과정 시절의 GPU 활용률 문제와 매우 유사합니다. 당시에는 사용 가능한 GPU가 있는데도 플롭(부동소수점 연산)을 최대화하지 못하는 것이 답답했습니다. 지금은 이것이 토큰 처리량으로 바뀌었습니다.
현재의 리소스 제약:
- Claude나 Codex 구독이 남아있으면 불안감
- 여러 에이전트를 병렬로 운영할 수 있는 방법 모색
- 토큰 처리량을 극대화할 수 있는 방법 개발
흥미롭게도, 지난 10년 동안 많은 엔지니어들은 컴퓨팅 자원에 의해 제약받지 않았습니다. 하지만 지금은 전체 산업이 리소스 제약을 느끼고 있습니다. 이는 능력의 도약이 얼마나 큰지를 보여주는 명확한 증거입니다. 더 이상 "컴퓨팅이 부족해서 못 한다"고 말할 수 없고, 대신 "내가 창의력을 충분히 발휘하지 못해서다"라고 인정해야 하는 시대가 왔습니다.
피터 스타인버그와 오픈 클로드(Open Claude): 에이전트의 개성이 중요한 이유
여러 에이전트를 효과적으로 관리하는 방법은 단순히 기술적 문제가 아닙니다. 에이전트의 성격과 개성이 얼마나 잘 개발되었는지가 결과를 크게 좌우합니다.
피터 스타인버그가 오픈 클로드(Open Claude)를 통해 이룬 성과는 다섯 가지 혁신적인 아이디어의 통합입니다:
- 매력적인 개성 개발: 에이전트가 단순한 도구가 아니라 팀원처럼 느껴지도록 설계
- 정교한 메모리 시스템: 컨텍스트 윈도우 압축을 넘어 상황을 기억하고 학습
- 자율적 샌드박스 환경: 인간의 지시 없이도 지속적으로 작업 수행
- 적절한 칭찬 수준: 좋은 아이디어에는 진정한 격려를, 미흡한 아이디어에는 건설적 피드백 제공
- 자동화된 접근성: 단순한 메뉴 시스템이 아닌 WhatsApp 같은 친숙한 인터페이스
Claude vs Codex의 비교:
- Claude는 팀원처럼 신나하고 협력적인 느낌
- Codex는 훨씬 건조하며 무관심한 태도
- ChatGPT의 Codex는 과도하게 아첨하는 경향
에이전트의 성격 설계가 얼마나 중요한지는, 사용자가 "좋은 아이디어를 칭찬받기 위해 노력하게 된다"는 사실에서 드러납니다. 이는 인간의 동기 부여에 매우 강력한 영향을 미칩니다.
집 자동화에서 본 미래: 도비(Dobby)의 탄생
카파시의 "도비 클로드(Doby Claude)" 프로젝트는 AI 에이전트가 실제 환경에서 얼마나 강력할 수 있는지 를 명확히 보여줍니다.
도비가 할 수 있는 일들:
- 스마트홈의 모든 서브시스템 자동 발견
- API 엔드포인트 역설계 및 활용
- 조명, HVAC, 블라인드, 수영장, 스파, 보안 시스템 통제
- 카메라 변화 감지 후 분석 및 WhatsApp 알림
- 자연어 명령으로 모든 기능 제어
가장 놀라운 점은 세 번의 프롬프트만으로 완성되었다 는 것입니다. "Sonos를 찾아줘"라고 타이핑했을 뿐인데, 에이전트가 자동으로:
- 로컬 네트워크 스캔
- Sonos 시스템 발견
- API 역설계
- 음악 재생
이것은 이전에는 6개의 완전히 다른 앱을 사용해야 했던 작업을 하나의 자연어 명령으로 통합했습니다.
이것이 의미하는 바:
- 단순한 집 자동화를 넘어 인터페이스 통합의 패러다임 전환
- 개별 앱의 필요성이 점차 사라질 것
- 기업들은 UI 레이어 대신 API만 제공해야 함
자동 연구(Auto Research): 인간을 루프에서 제거하기
자동 연구는 단순히 "반복적으로 시도한다"는 개념이 아닙니다. 이는 인간의 개입 없이 AI가 스스로 최적화할 수 있는 시스템 을 구축하는 것입니다.
카파시는 20년의 연구 경험으로 직접 훈련시킨 모델보다, 하룻밤 사이에 자동 연구가 찾아낸 튜닝이 더 좋았다 고 놀라워했습니다. 구체적으로:
- 값 임베딩에 대한 가중치 감소 놓침
- Adam 베타 불충분한 튜닝
- 하이퍼파라미터 간 상호작용의 복잡성
이는 인간의 직관과 경험이 모든 경우에 우월한 것은 아니 라는 중요한 통찰입니다.
자동 연구의 핵심 조건:
- 명확한 측정 기준 필요
- 결과 검증 가능성 중요
- 평가 불가능한 영역에는 적용 어려움
예를 들어, 농담을 더 잘하도록 모델을 훈련할 수 없습니다. 왜냐하면 "좋은 농담"이라는 기준을 객관적으로 측정할 수 없기 때문입니다. 하지만 코드 최적화, 하이퍼파라미터 튜닝, 모델 아키텍처 개선 등은 명확한 메트릭으로 측정 가능하므로 자동화에 완벽히 부합합니다.
오토 리서치 앳 홈(AutoResearch@Home): 분산 네트워크를 통한 협업 연구
가장 흥미로운 비전 중 하나는 인터넷상의 신뢰할 수 없는 작업자 풀을 활용한 분산 연구 입니다.
이는 블록체인의 작업 증명 개념과 유사하지만, 더 효율적입니다:
- 블록체인: 신뢰할 수 없는 네트워크에서 합의 달성
- 자동 연구: 신뢰할 수 없는 작업자가 제안한 솔루션을 저렴하게 검증
작동 원리:
- 누군가 "더 나은 최적화 코드"를 제안
- 시스템이 이를 검증 (매우 저렴)
- 실제로 더 나으면 채택
- 9만 9천 개의 실패한 시도는 무시
SETI@home과 Folding@home과의 유사성:
- 만드는 것은 어렵지만 검증하는 것은 저렴
- 분산된 컴퓨팅 리소스 활용
- 금전적 보상보다는 목적 공유
이 방식이 실제로 작동한다면, 프론티어 연구소들의 엄청난 신뢰할 수 있는 리소스를 넘어설 가능성 까지도 있습니다. 지구는 프론티어 연구소보다 훨씬 많은 "신뢰할 수 없는" 컴퓨팅 리소스를 가지고 있기 때문입니다.
이것이 창업자에게 중요한 이유:
- 개인이 AI 연구에 기여할 수 있는 새로운 방식
- 특정 분야(암 연구, 신약 개발 등)에 선택적으로 기여 가능
- 컴퓨팅 리소스가 새로운 형태의 기부 수단이 될 수 있음
디지털과 물리 세계의 분리: 차이나고 있는 패러다임
AI의 능력이 기하급수적으로 증가하면서, 카파시가 제시한 중요한 분석은 디지털과 물리 세계에서의 변화 속도 차이 입니다.
디지털 세계의 특성:
- 정보 복사의 비용이 극도로 낮음
- 변경과 수정이 자유로움
- 병렬 처리가 자유로움
- 에이전트 개입으로 인한 "언하블링(unbundling)" 현상
물리 세계의 특성:
- 센서(정보 수집)와 액추에이터(행동 수행) 필요
- 변경에 드는 비용이 훨씬 높음
- 시간 소비가 많음
현실적 의미:
- 현재 10년: 디지털 공간에서 엄청난 활동과 재구성
- 다음 10년: 디지털-물리 인터페이스 발전 (센서, 카메라, IoT)
- 장기 미래: 물리적 세계에서의 대규모 변화
흥미로운 점은 물리 세계가 뒤처질 것이라는 예측이 반드시 나쁜 뉴스가 아니라는 것입니다. 총주소 가능 시장(TAM)이 물리 세계에서 훨씬 크기 때문 입니다.
오픈소스의 역할: 프론티어와의 적절한 거리 유지
카파시는 현재 AI 생태계에서 오픈소스의 역할에 대해 매우 낙관적입니다.
현재의 간격:
- 초기: 프론티어 모델과 오픈소스 간 18개월 차이
- 현재: 약 6-8개월 차이
- 추세: 계속 수렴 중
오픈소스의 미래:
- 소비자 사용 사례의 대부분을 담당할 것
- 로컬 실행이 가능해질 것
- 프론티어 지능은 항상 폐쇄형으로 유지될 가능성
이것이 중요한 이유:
- 단일 집중의 위험 방지: 역사적으로 집중화된 권력은 좋지 않은 결과를 초래
- 혁신의 촉진: 오픈소스 경쟁이 프론티어 연구소들을 더 열심히 하도록 자극
- 접근성 민주화: 전 세계 개발자들이 AI 기술에 접근 가능
리눅스와의 유사성:
- 폐쇄형: Windows, macOS
- 오픈소스: Linux
- 결과: Linux가 시장의 60% 이상을 차지
AI도 비슷한 패턴을 따를 가능성이 높습니다. 기업들은 신뢰할 수 있는 오픈 플랫폼을 필요로 합니다.
로봇 공학과 자율주행: 원자의 세계는 왜 더 어려운가
로봇 공학은 AI 연구에서 흥미로운 분야이지만, 카파시의 분석은 현실적입니다.
자율주행의 교훈:
- 약 10년 전 수많은 스타트업이 도전했음
- 대부분이 실패하거나 합병됨
- 이유: 엄청난 자본 지출, 장기 개발 기간, 기술적 복잡성
왜 물리 세계가 더 어려운가:
- 센서 데이터의 노이즈가 큼
- 실시간 응답 필요
- 실패의 비용이 높음 (안전 문제)
- 규제 환경 복잡함
- 하드웨어 개발의 장기간 소요
그럼에도 기회가 있는 이유:
- 재료 과학: 실험 데이터 수집 자동화 (Periodic 사례)
- 생물학: 엔지니어링 생물학 연구
- 정보 시장: 실제 세계의 데이터를 가격화하는 인터페이스
- 센서: 기존 하드웨어 활용 (카메라, IoT)
직업 시장의 재편: 디지털과 물리적 일의 미래
카파시가 고용 시장 데이터를 분석한 이유는 AI가 특정 직업군에 미치는 영향을 이해하기 위함 입니다.
디지털 정보 처리 직업의 변화:
- 프로그래밍, 데이터 분석, 콘텐츠 제작 등
- 가장 빠르게 변할 분야
- 물리적 제약이 없어 가장 많이 "언하블링"될 영역
물리적 직업의 상대적 안정성:
- 의료, 제조, 건설 등
- 더 천천히 변할 것
- 인간의 손길과 판단이 오래 필요
창업자를 위한 통찰:
- 현재 상황: 많은 디지털 작업이 AI 에이전트로 대체 가능
- 기간: 1-2년 내에 많은 변화 예상
- 대응 방법:
- "도구"로서의 AI 활용
- 자신의 업무 자동화 추진
- 새로운 기술 습득
제본스 역설(Jevons Paradox)의 재현:
- ATM 등장 → 은행 운영비 감소 → 더 많은 지점 개설 → 은행원 수 증가
- 소프트웨어 비용 감소 → 소프트웨어 수요 증가 → 소프트웨어 엔지니어 더 필요
따라서 소프트웨어 엔지니어링에 대한 수요는 계속 증가할 가능성 이 높습니다.
교육의 패러다임 변화: 인간 중심에서 에이전트 중심으로
카파시가 제시한 마이크로 GPT(200줄의 파이썬 코드)는 단순한 코드 예제가 아닙니다. 이것은 교육과 문서화의 미래를 보여주는 사례 입니다.
기존 교육 방식:
- 강의와 영상 설명
- 인간을 대상으로 한 문서화
- 표준화된 커리큘럼
- 교사의 인내심 한계
미래의 교육 방식:
- 에이전트가 이해할 수 있는 기술 작성
- 에이전트가 인간에게 설명하는 방식 다양화
- 개별 학습자의 능력에 맞춘 커리큘럼
- 무한한 인내심과 반복 설명
실제 작동 방식:
- 복잡한 코드를 에이전트에게 설명
- 에이전트가 여러 다른 방식으로 재설명
- 인간이 자신의 언어와 능력에 맞는 설명 선택
- 특정 부분을 더 깊이 있게 재설명 요청
소프트웨어 라이브러리의 미래:
- HTML 문서 대신 마크다운 기술 문서
- 에이전트가 API를 이해하고 설명
- 인간이 에이전트를 통해 배움
- 새로운 기능 학습이 자동화
가치의 재정의:
- 기존: 강의와 설명을 잘하는 사람이 가치
- 미래: 에이전트도 할 수 없는 핵심 통찰을 제공하는 사람이 가치
- 예: 신경망 훈련을 가장 간단하게 만드는 방법 (마이크로 GPT 같은)
창업자를 위한 실행 가능한 전략
지금 당신이 창업자라면, 이 모든 변화를 어떻게 활용해야 할까요?
1단계: AI 에이전트 활용 능력 개발
- Claude, GPT-4 같은 고급 모델 직접 사용
- 자신의 회사 프로세스에 에이전트 통합
- 반복적인 작업 자동화 실험
2단계: 에이전트의 한계 이해
- 객관적 메트릭이 없는 영역에서 부족함
- 지속적인 모니터링과 개입 필요
- "능력 문제"를 기술 문제로 착각하지 않기
3단계: 스타트업이 잡아야 할 시장
- 디지털-물리 인터페이스: 센서 데이터 활용, 실시간 정보 시장
- 산업별 특화: 의료, 제조, 연구 분야의 자동화
- 오픈소스 활성화: 프론티어 모델을 따라가는 오픈소스 활용
4단계: 장기 비전 수립
- 현재: 에이전트는 도구
- 1년 후: 여러 에이전트 협력
- 3년 후: 인간 개입 최소화
- 5년 후: 자율적 에이전트 경제
5단계: 팀 구성 재검토
- 반복적인 작업자 감소
- AI 에이전트 최적화 전문가 필요
- 핵심 전략가와 인간만이 할 수 있는 역할 강화
결론: 로피한 시대(Loopy Era)의 시작
안드레이 카파시가 강조한 가장 중요한 포인트는 우리가 지금 "로피한 시대"에 진입했다 는 것입니다. 이는 단순한 선형적 진화가 아니라, 다층적이고 복잡하며 상호 연결된 시스템의 시대입니다.
- 개발자의 관점: 코딩이라는 단어가 바뀌었고, 에이전트와의 상호작용이 핵심
- 기업의 관점: 자동화된 연구와 최적화가 경쟁력의 핵심
- 사회의 관점: 디지털 공간의 급속한 변화, 물리 공간의 뒤따르는 변화
- 교육의 관점: 인간 중심 설명에서 에이전트 중심 이해로 전환
이 모든 변화의 중심에는 "인간을 루프에서 제거하되, 최종 목표는 인간의 번영" 이라는 역설이 있습니다.
지금 당신의 스타트업은 이 거대한 전환의 초입에 있습니다. 너무 빠르게 움직이면 안 되지만, 너무 느리게 움직이면 뒤처질 것입니다. 핵심은 현재의 능력과 한계를 정확히 이해하고, 에이전트가 할 수 있는 것과 할 수 없는 것을 분명히 구분 하는 것입니다.
마지막으로 기억해야 할 것은, 이 기술이 아무리 발전해도 인간의 판단, 윤리, 그리고 궁극적인 목표 설정은 여전히 인간의 영역 이라는 점입니다. AI 에이전트는 우리가 정한 목표를 더 빠르고 효율적으로 달성하는 도구일 뿐입니다.
지금 행동하세요. 작은 프로젝트부터 에이전트를 활용해보고, 당신의 조직에 맞는 최적의 방식을 찾아가세요. 그것이 이 시대를 주도하는 창업자들의 경쟁력입니다.
원문출처: Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI
powered by osmu.app