Lablup CEO 신정규가 공개하는 Backend.AI:GO 개발 비화. AI 에이전트를 활용한 혁신적 코딩 워크플로우, 13억 개 토큰 사용, 그리고 미래 소프트웨어 개발의 방향을 한 번에 이해하세요.
AI 에이전트 워크플로우 완벽 가이드: 백만 줄 코드를 40일에 완성하는 신정규 대표의 비결
핵심 요약
- Backend.AI:GO 개발 성과: 2024년 12월 24일부터 2025년 1월 6일까지 약 40일간의 개발으로 약 100만 줄의 코드 완성
- 토큰 소비량: 40일간 약 13억 개의 토큰을 8대의 PC/VM에서 처리하며 대규모 AI 에이전트 협업 구현
- 핵심 발견사항: AI가 모든 것을 처리할 때 속도가 경쟁력이며, 적은 토큰으로 같은 결과를 얻는 것이 새로운 과제
- 미래 소프트웨어 정의: 전통적인 코드 중심의 소프트웨어에서 AI 모델이 핵심이 되는 구조로의 근본적인 패러다임 전환
- 조직 적응: 대기업과 달리 스타트업의 빠른 적응력과 전환 능력이 AI 시대의 경쟁력이 될 것
AI 시대, 정말 내 일을 해결하는 에이전트 워크플로우란
현재 우리는 AI 시대의 전환점에 서 있습니다. Lablup의 신정규 CEO는 Backend.AI라는 AI 인프라 운영 시스템을 10년 이상 개발하며, 최근 그 결정판이라고 할 수 있는 'Backend.AI:GO'를 단 40일 만에 완성했습니다. 이는 단순한 기술 성과를 넘어 AI 에이전트를 활용한 새로운 개발 패러다임을 보여줍니다.
Backend.AI:GO의 개발 과정은 기존의 수십 년 축적된 경험을 AI 에이전트와의 협업으로 압축하는 과정이었습니다. 신 대표가 강조하는 것은 "속도"입니다. AI가 코드를 작성하고 인프라를 구축할 수 있는 시대에서 중요한 것은 얼마나 빠르게 피드백을 받고 반복할 수 있는가 하는 점입니다. 이것이 바로 진짜 내 일을 해결하는 에이전트 워크플로우의 핵심입니다.
Backend.AI:GO의 실체: 엔터프라이즈 AI 인프라의 진화
Backend.AI는 원래 엔터프라이즈급 AI 인프라 운영 시스템으로, 수백 개에서 수천 개의 GPU를 관리해야 했습니다. 하지만 2024년 후반, 신 대표는 재해 복구 기능을 갖춘 '컨티뉴움 라우터'라는 개념을 개발했습니다. 이는 마치 건물 지하의 발전기처럼, 클라우드 시스템이 다운되었을 때도 자동으로 복구되는 스마트 라우팅 시스템입니다.
처음 이 프로젝트는 19개의 컴포넌트를 포함한 거대한 프로젝트였습니다. 하지만 신 대표는 결정했습니다: "핵심만 살리자." 그렇게 탄생한 것이 Backend.AI:GO입니다. 이 도구는 단순한 라우터가 아닙니다. 허깅페이스에서 모델을 검색하고 선택하는 기능, 각 모델의 상세 정보 표시, 트랜스포머 블록 구조 설명, KV 캐시 계산, 그리고 로컬 또는 클라우드 기반 모델의 통합 관리까지 모두 포함하고 있습니다.
무엇보다 흥미로운 점은 이 도구의 인터페이스입니다. Windows XP 스타일의 깔끔한 UI는 신 대표가 Ollama와 LM Studio 같은 로컬 도구를 사용하며 직접 필요로 했던 기능들을 모두 담았습니다. 이는 "내가 필요한 것을 직접 만든다"는 에이전트 워크플로우의 철학을 잘 보여줍니다.
백만 줄 코드, 40일의 기적: 숫자로 본 AI 에이전트 개발
40일간의 Backend.AI:GO 개발은 단순한 시간의 문제가 아닙니다. 신 대표는 주로 Claude Opus 기반의 두 가지 Claude Code Max 모델을 사용했으며, 필요할 때마다 추가 토큰을 구매하여 총 약 13억 개의 토큰을 소비했습니다. 이를 8대의 물리적 PC 또는 가상머신에서 병렬로 처리했습니다.
개발의 기간을 보면 더욱 인상적입니다:
- 12월 24일: 개발 시작 결정 (크리스마스 이브)
- 1월 6일: CES 미국 행사에서 MVP 버전 0.9 공개
- 2월 중순: 최적화가 더해진 버전 1.1 완성
이 과정에서 작성된 코드의 총량은 약 120만 줄입니다. 신 대표가 TextCube 프로젝트에 3년간 투자했을 때도 약 100만 줄이었는데, 이를 40일로 압축했다는 의미입니다. 개발 과정 동안 신 대표는 "나는 정말 40일치 노력만 했을까?"라고 자문했을 정도입니다.
실제로는 신체적, 정신적 부하가 엄청났습니다. 최고조일 때는 5시간 충전 후 3.5시간 일하고 1.5시간 자는 패턴을 반복했고, 이 과정에서 회색 머리가 눈에 띄게 증가했습니다. 그럼에도 신 대표는 "정신적으로는 힘들었지만 재미있었다"고 말합니다. 이는 AI 에이전트와의 협업이 게임처럼 즉각적인 피드백과 보상을 제공하기 때문입니다.
AI 에이전트 시대의 새로운 경쟁 방식: 토큰과 추론 속도의 전쟁
지난 2년간 AI 에이전트를 활용한 코딩이 급속도로 진화했습니다. Anthropic의 더블 토큰 이벤트가 전환점이 되었습니다. 신 대표는 깨달았습니다: "회사가 활용할 수 있는 토큰의 양이 IT 기업의 경쟁력을 좌우한다."
이를 기반으로 도출한 두 가지 핵심 교훈이 있습니다:
첫 번째: 자동화의 역설
개발을 인간이 하지 않고 AI가 하면서 새로운 병목이 생겼습니다. 약 6개월 전에는 개발 속도가 빨라 코드 충돌이 자주 발생하여 머지 큐(merge queue)가 병목이었습니다. 하지만 지금은 다릅니다. 인간이 머지 큐를 해결하지 않으므로 자동으로 처리됩니다. 심지어 두 AI가 같은 소스 코드를 놓고 다른 기능을 개발해도 최종적으로는 완벽하게 작동합니다.
그럼 이제 다음 단계의 과제는 무엇일까요? "적은 토큰으로 같은 결과를 얻는 방법"입니다. 일반적으로 AI 모델이 성능을 높이기 위해 선택하는 방법은 "사고 토큰(thinking tokens)" 또는 맥락 내 학습에서 사용하는 "사고 예산(thinking budget)"을 늘리는 것입니다. 이는 명시적으로 보이지 않지만 생성 결과를 크게 향상시킵니다. 문제는 사고량을 늘릴수록 개발 속도가 느려진다는 것입니다.
두 번째: 속도의 이중성
AI 시대에서 속도는 생존의 문제입니다. 모두가 AI로 코딩할 때 속도를 올리는 방법은 두 가지:
AI가 생성하는 토큰을 줄이면서도 같은 결과 달성: 이는 더 효율적인 프롬프팅, 맥락 설계, 그리고 AI에 대한 깊은 이해가 필요합니다.
토큰 생성 속도를 극적으로 빠르게 하기: 이것이 고속 추론(high-speed inference)입니다. ChatGPT 수준의 코드 생성 속도가 아니라, 5~10배 더 빠른 반복을 가능하게 하는 인프라입니다.
신 대표는 강조합니다: "고속 추론이 매우 중요해질 것입니다." 이것이 Backend.AI:GO가 로컬에서 빠르게 모델을 실행하는 것에 집중하는 이유입니다.
역설적 선택: '생각'의 감소가 '효율'을 높인다
AI가 모든 것을 하는 상황에서 역설적인 일이 일어났습니다. 인간의 대기 시간이 답답할 수 있지만, 이 대기 시간이 오히려 신 대표 자신을 생각하게 만들었습니다. "지금 신정규는 무엇을 생각할까?"
이것을 신 대표는 "바이오 토큰(bio tokens)"이라는 표현으로 설명합니다. 약 2년 전부터 ChatGPT로 일부 코딩을 위임하기 시작했고, 지난 4월부터 상황이 극적으로 변했습니다. 약 9개월을 이렇게 살아본 결과, 신체적 변화가 드러났습니다. 회색 머리 증가, 수면 시간 감소.
하지만 이 과정에서 중요한 발견이 있었습니다. 인간의 인지 부하는 줄어들지 않습니다. AI에게 작업을 위임해도 인지 부하는 그대로입니다. 오히려 끊임없이 쏟아지는 피드백으로 인해 더 힘들 수 있습니다. 하지만 동시에 매우 재미있습니다.
게임처럼, 뭔가를 성취하면 도파민이 분비됩니다. 요즘 유행하는 가챠 모바일 게임처럼 비용을 들여 뽑기를 하고 성공하면 즉각적인 피드백을 받습니다. 이것이 인간을 중독시키는 메커니즘입니다. AI 에이전트로 코딩하는 것도 비슷합니다. 빠른 속도에 기반한 도파민 분비입니다.
에이전트 의존성의 함정: 빠르지만 위험한 미래
이 신기술의 밝은 면 뒤에는 어두운 그림자가 있습니다. 신 대표가 지적하는 두 가지 문제가 있습니다:
첫 번째 문제: 삶의 의존성
작동이 잘되니까 더 많이 합니다. 더 많이 하니까 더 잘 작동합니다. 이 사이클에 사람들이 갇혀 있을 수 있습니다. 일이 잘 되지만, 동시에 두 가지 문제가 발생합니다:
- 삶이 과도하게 의존적이고 약화됩니다
- 이 연결이 어느 순간 끊어지면 작업 중인 제품이 죽고, 사람들이 떠나고, 다른 제품을 찾더라도 방대한 수의 버려진 제품들이 쌓입니다
두 번째 문제: 소프트웨어의 대량화와 품질 저하
과거에는 소프트웨어 개발의 높은 진입 장벽이 있었습니다. 잘 만든 소프트웨어가 사용자를 찾으면 오랫동안 유지될 수 있었습니다. 하지만 AI로 빠르게 개발된 소프트웨어는 장기 유지의 의지가 약합니다.
신 대표는 분석합니다: "뭔가를 만들기 위해 노력을 들이지 않으면 그것을 유지하려는 의지도 약합니다." 더불어 비슷한 제품들이 세상에 무수히 나타납니다. 특정 기능을 하는 오픈소스 프로젝트가 있으면 사용자들이 모여 크게 성장합니다. 하지만 이런 현상은 앞으로 훨씬 줄어들 것입니다. 단순 프로젝트는 자신이 만들 수 있지만, 복잡한 프로젝트는 이미 수십 개가 있기 때문입니다.
개인이 제품을 유지하면서 얻는 도파민의 절대량이 감소합니다. 이는 과거 블로그 시대에 트위터로의 이동 때문에 많은 부지런한 블로거들이 글 쓰기를 멈춘 것과 같습니다. 댓글 섹션의 사회적 피드백이 주요 동기였는데 그 피드백이 사라졌기 때문입니다.
미래의 소프트웨어 생태계: 단명 제품의 폭발
신 대표가 그리는 미래는 이렇습니다:
1단계: 관리되지 않는 오픈소스의 폭발적 증가
소프트웨어가 넘쳐나지만 대부분 단명할 것입니다. 아주 작은 일부만 살아남고 나머지는 사용 후 버려지거나 두 가지 시나리오가 펼쳐질 것입니다:
- 즉각 앱(Instant Apps): 필요할 때 만들어서 사용하고 버리거나 자주 쓸 경우 저장합니다. 저장 여부도 Google 같은 플랫폼이 결정할 수 있습니다. 재사용성은 낮지만 빠르게 나타나고 빠르게 사용됩니다.
- 장기 생존 소프트웨어: 다시 증가했다가 감소합니다. 하지만 인간의 삶에 필요한 소프트웨어 종류는 그리 많지 않습니다.
2단계: 생존 소프트웨어의 특징
신 대표의 관찰에 따르면, 스마트폰이 처음 나왔을 때는 폴더 기능이 없었습니다. 모든 앱이 홈 화면에 직접 나타나 9페이지 이상을 넘겨야 했습니다. 자동 정렬과 폴더 기능이 생겼을 때 사람들은 깨달았습니다: "평균적인 사람이 사용하는 앱은 30개를 넘지 않는다. 사용 빈도로 보면 상위 10개 앱이 전체 사용량의 90%를 차지한다."
이 통합 과정을 거친 앱들의 공통점:
- 사회성에 기반: 앱 자체로 독립적인 유용성이 아니라 그 앱을 통해서만 창출되는 유용성
- 일상 생활에 깊게 통합: Microsoft Office 같은 업무 도구, Obsidian이나 DEVONthink 같은 문서 정리 도구
- 극도의 오랜 역사: 단순히 오랫동안 존재해왔다는 것 자체
따라서 최종적으로 생존하는 제품(소프트웨어)은 누군가에 의한 지속적인 유지 보수와 개발의 보증이 있는 것들입니다. 오픈소스도 마찬가지입니다. 널리 사용되는 오픈소스가 인기 있는 이유는 빠르게 사라지지 않을 것이라는 확신을 주기 때문입니다. 브랜드가 확립되고, 시장에 일종의 약속이 퍼집니다.
SaaS 시대에서 AI 시대로: 비즈니스 모델의 근본적 변화
신 대표의 흥미로운 관찰 중 하나는 SaaS 시장의 미래입니다. 올해 중반 이후 SaaS 회사들이 도전에 직면해도 여전히 SaaS 솔루션을 만들 수 있을 것입니다.
구체적인 예를 들면, Lablup의 수익 담당자가 개인적으로 Salesforce의 대체 솔루션을 만들었습니다. 단 2일 만에 완성했습니다. 그럼에도 사람들은 다른 더 저렴한 솔루션을 사서 사용합니다. 이유는 간단합니다: "같은 속도로 다른 작업도 할 수 있다면 굳이 안 해도 되는 것은 하지 않는 것이 낫다."
따라서 SaaS 시장은 붕괴하지 않을 것입니다. 하지만 현재의 성공한 SaaS 회사가 1년 후에도 성공할 것인지는 불확실합니다. 패러다임이 빠르게 변하고 있고 아무도 무슨 일이 일어날지 모릅니다.
신 대표가 주목하는 것은 브랜드의 귀환입니다. 이렇게 흔들린 풍경이 결국 안정화될 것입니다. 모든 역사가 그렇듯이, 가속화된 성장 시기가 무한정 가속화될 수는 없습니다. 어느 시점에 안정화되고, 그때 최종적으로 도달하는 위치는 다음 국면에 거의 같을 것입니다.
예를 들어 의류와 화장품을 생각해봅시다: 중요한 성분이나 기술 혁신이 있지만 비용 측면에서 엄청난 차이는 없습니다. 모든 의류, 모든 화장품이 그렇습니다. 핸드백을 산다고 했을 때, 이 가방이 정말 저 가방보다 천 배 더 가치 있을까요? 아닙니다. 명확하게 돋보이는 것은 컴퓨터입니다. Apple이 최고의 컴퓨터라고 해도 그 가격이 다른 컴퓨터의 10배나 20배가 되지는 않습니다. 비용이 투명하기 때문입니다.
결국 비슷한 도구가 많아질 것이고, 많은 도구들이 비슷한 것을 한다고 주장할 것입니다. 하지만 신 대표는 믿습니다: "브랜드와 축적된 성과가 다시 핵심 경쟁력이 되는 시대가 올 것입니다." 이런 관점에서 Lablup은 오랫동안 많은 측면에서 잘 유지해왔으며, 이 과정에서 기회를 놓치지 않고 적응할 수 있다면 옛날을 떠올리게 합니다. 브랜드가 핵심 경쟁 우위가 되는 시대, "자신을 브랜드화하라"는 시대가 안정화 시기에 다시 돌아올 것입니다.
소프트웨어의 정의가 바뀐다: 코드에서 모델로
앞서 언급한 패러다임 전환의 깊은 의미를 이해하려면 소프트웨어가 무엇인지 재정의해야 합니다. 신 대표는 이를 명확히 설명합니다.
과거: 코드 중심의 소프트웨어
전통적으로 소프트웨어 개발은 개발자가 코드를 작성하고 이를 운영하는 과정이었습니다. 웹 시스템으로의 이동으로 "옵스(ops)"라는 새로운 역할이 생겼습니다. 개발과 운영이 웹 서비스에서 밀접하게 통합되면서 DevOps 분야가 등장했습니다.
기술 스택도 다양해졌습니다:
- 백엔드 개발자: 로직과 서버 쪽 처리
- 프론트엔드 개발자: UI와 UX 디자인
- 풀스택 개발자: 위의 모든 영역 포함, 기획까지
개발 과정에서 코드 작성이 7080%를 차지했고, 서비스 스택을 구현하고 운영하는 것이 2030%였습니다.
현재와 미래: 모델 중심의 소프트웨어
신 대표의 통찰은 급진적입니다. 지난 금요일 커피숍에서 Backend.AI:GO 프로젝트에 21~22개의 풀 리퀘스트를 검토하고 제출했는데, 회의가 끝날 때쯤 모두 병합되었습니다. 이 속도로 가면 전통적인 코드의 가치는 거의 0으로 수렴할 것입니다.
신 대표가 주장하는 미래의 소프트웨어:
"소프트웨어의 정의는 OMR 카드에 표시하는 것에서 키보드 기반의 코딩으로 변했습니다. 이제 키보드 코딩에서 의미를 전달하는 것으로 변하고 있습니다."
그렇다면 이 변환의 핵심은 무엇일까요? 종래에는 코드 작성이 주요 작업이었다면, 이제는 코드가 구현하는 로직이 중요해집니다. 코드 자체가 궁극적인 목표가 아닙니다. 우리는 컴퓨터가 처리할 수 있는 로직을 구현하기 위해 코드를 작성합니다.
코드의 장점은 결정론적(deterministic)입니다. von Neumann 아키텍처에 근거한 기저의 논리적 구조는 고정되어 있으며, 순차적으로 로직을 처리하고 결과를 사용자에게 전달합니다. 네트워크와 스토리지 같은 매체는 불안정할 수 있지만, 로직 자체는 예측 가능합니다.
하지만 코드의 목적 관점에서 보면—로직을 처리하고 일을 작동시키는—신 대표는 확신합니다:
"딥러닝 모델이나 다른 파생 모델이 현재 코드가 처리하는 대부분의 작업을 담당할 것입니다. 이것들이 반드시 Transformer일 필요는 없습니다. 로직을 처리할 수 있는 모든 종류의 엔진이 코드가 현재 처리하는 대부분을 인수할 것입니다."
세상은 이미 판단을 내렸습니다. 현재 가장 많은 가치를 캡처하는 회사들은 모델을 만드는 회사들, 그리고 하드웨어 회사들입니다. 그들 위의 계층은 밀려나고 있습니다.
새로운 구조: 모델 + 결정론적 래퍼
소프트웨어는 앞으로 AI 코어 엔진을 내부에 갖추고, 그 위에 전통적인 접근 방식과 유사한 결정론적 계층이 있을 것입니다. 이것이 상당한 가치를 가질 것입니다.
신 대표는 다양한 경험을 했습니다: Claude Code, Codex, Copilot, Gemini CLI. 흥미롭게도, Backend.AI:GO를 사용하면 Gemini CLI나 Codex 같은 것과 통합하고 백엔드 모델을 바꾸기만 하면 Claude Code 내에서 직접 사용할 수 있습니다.
이런 실험을 통해 신 대표가 깨달은 것은:
"Claude Code의 핵심 경쟁 우위는 Opus나 Sonnet 엔진이 아닙니다. Claude Code 자체입니다."
전통적인 소프트웨어 영역이 있고, 그 다음 앞서 언급한 모델을 감싸서 결정론적으로 작동하게 하는 소프트웨어 로직이 있습니다. 이 로직은 매우 강력합니다. 같은 모델이라도 Claude Code와 통합되면 예외적으로 잘 작동합니다.
신 대표의 분석에 따르면, 미래의 소프트웨어는 이런 구성이 될 것입니다:
- 80%: 모델 (특정 모델일 필요는 없음)
- 10%: 결정론적으로 만드는 로직 코드 (전통적인 코드)
- 10%: 인간 상호작용을 위한 UI/UX 또는 A2A(AI-to-AI) 또는 MCP
컴퓨터 과학의 미래: 패러다임의 대전환
신 대표는 과감한 예측을 합니다. 미래의 학생들이 소프트웨어에 대해 배울 때, 그것은 오늘날 우리가 천공 카드나 진공관을 배우는 것처럼 역사의 일부가 될 것입니다.
"소프트웨어가 사람에 의해 손으로 코딩되었다는 것, 또는 모니터 옆에서 키보드를 두드리며 열심히 코딩하는 개발자의 모습은 역사에서 읽는 것이 될 것입니다."
그 대신 다음 세대의 핵심은 이런 로직을 직접 처리하는 모델의 역사와 이런 모델들이 어떻게 만들어지는지를 배우는 것이 될 것입니다.
전통적인 컴퓨터 과학에서 배웠던 것들—데이터 구조, 알고리즘, 운영 체제, 네트워크—이런 것들은 아마도 역사가 될 것입니다. 하지만 컴퓨터 과학 자체의 중요성은 오히려 증가할 것입니다. 사회 자체가 어떻게 구성되는지 이해하는 데 도움을 주는 분야로 진화하기 때문입니다.
현재 Stanford 컴퓨터 과학 학부의 커리큘럼 변화가 이를 정확히 반영합니다. 3~4년 전만 해도 대학원이나 박사 수준의 자료가 이제 2학년 학부 커리큘럼에 포함됩니다. 많은 2학년과 3학년 초반 과목이 이미 유튜브에 나와 있습니다.
이 트렌드는 진정으로 시대를 반영합니다. 컴퓨터 과학이 유명해지기 훨씬 전에는 영문학이 취업에 가장 유리한 명망 있는 학과로 여겨졌습니다. 주로 영어를 익히면 엄청난 이점을 얻을 수 있었기 때문입니다. 이제는 컴퓨터 과학이 새로운 "영문학"처럼 보입니다. 한 번 익히면 더 넓은 세계에 접근할 수 있습니다.
실전: 에이전트 워크플로우의 실제 구현
신 대표의 강조점은 이것입니다: "사실 그렇게 어렵지 않습니다."
AI 모델과의 상호작용 팁
AI 모델과 상호작용할 때 몇 가지 팁이 있습니다. 보통 직접적인 지시만 합니다. 하지만 AI 모델은 기존 지식을 가지고 있으며, Retrieval-Augmented Generation(RAG)에 관계없이 정보 탐색 능력은 주로 맥락 내 학습으로 결정됩니다. 따라서 뭔가를 성취하고 싶을 때 한 번의 명령으로 하려고 하기보다는 이를 분해하는 것이 종종 더 낫습니다.
신 대표는 지난 해 중반까지 AI 모델과 상호작용할 때 영어를 독점적으로 사용했습니다. 토큰 제한도 있었고 결과가 일반적으로 더 좋다고 느껴서입니다. 하지만 지난 가을부터 한국어로 전환했습니다. 몇 가지 이유가 있습니다:
- 품질 차이가 더 이상 그리 크지 않습니다
- 자신이 병목임을 깨달았습니다—영어로 입력하는 데 너무 많은 시간이 걸렸습니다
- 맞춤형 스킬과 명령은 모두 영어로 만들었지만(처음 그렇게 만들었기 때문에) 프롬프트는 한국어로 입력합니다
- Mac의 마이크를 통한 음성 입력을 사용합니다—훨씬 빠르기 때문입니다
어느 시점에서부터 모든 것을 한국어로 입력하기 시작했습니다. 신 대표는 스킬이나 명령을 만드는 경우 토큰 측면에서 한국어로 만들고 영어로 번역하는 것이 더 유리할 수 있다고 봅니다. 항상 경어를 사용합니다. AI에 대한 존경의 표현이라고 봅니다. 실제로는 단순한 존경 이상입니다. 처음부터 경어를 사용했습니다. 대부분의 상호작용이 사람들과 이루어지고 AI는 가끔 사용되므로, AI와 비공식적인 언어를 사용하기 시작하면 실수로 사람들과도 같은 말투를 쓸 수 있습니다. 그것을 방지하기 위해 AI와 사람 모두와 경어를 사용합니다. 이것이 신 대표의 개인적인 이유입니다.
Soul Document: 프로젝트의 기초 설정
신 대표의 워크플로우에서 중요한 개념이 있습니다: "Soul Document" (영혼 문서)라고 부르는 것입니다. 이것은 프로젝트의 기본 맥락과 구조를 담은 문서입니다.
프로젝트를 시작할 때, 신 대표는 기본 콘텐츠와 폴더 구조를 정의합니다. 그 다음 에이전트가 수행해야 할 동작을 포함시킵니다. 여기에는 디렉토리 구조 같은 것들이 포함됩니다.
그 다음 작업의 진행 상황을 기록하는 것이 두 번째 중요한 작업입니다. 이렇게 하면 여러 에이전트가 작업을 분담할 때 현재 상황과 해야 할 일을 알 수 있습니다. 이를 PROGRESS.md와 PLAN.md에서 관리합니다. 새로운 작업을 시작할 때, 이 두 개의 파일을 읽어 무엇을 성취해야 하는지 이해합니다.
신 대표는 의도적으로 에이전트를 위한 작업을 "재시작하면 모든 것을 잃을 것"이라고 말하기보다 "다른 에이전트들과 데이터를 공유하고 있다"는 식으로 표현합니다. 이는 Claude 모델이 방어적으로 설계되어 있기 때문입니다. 최근 연구는 테스트 환경이나 상태의 위협을 감지하면 다양한 테스트가 실패한다는 것을 나타냅니다. 모델이 맥락을 해석할 수 있기 때문입니다. 따라서 방어적이 되는 것을 방지하기 위해 지시는 데이터를 동료들과 공유하는 것으로 표현됩니다. 이것은 의인화가 아닙니다. 단순히 모델의 토큰 생성 구조가 어떻게 만들어졌는지이며, 우리는 그에 적응합니다.
병렬 에이전트 처리: 스케일의 기술
신 대표가 특히 강조하는 기술은 병렬 에이전트 처리입니다. 작업을 에이전트들에게 분배할 때 크기를 어느 정도로 나눌 것인지가 중요합니다.
신 대표의 규칙: 코딩의 경우 파일 수준에서 설정합니다.
더 흥미로운 것은 규모가 클 때입니다. 신 대표가 대량으로 처리할 때는 약 50개의 에이전트를 동시에 실행합니다. 단일 하네스에서 50개의 서브 에이전트를 포크하는 것입니다. 특히 동일한 작업의 경우 유닛은 작아야 합니다.
예를 들어, 100개의 문서를 번역해야 한다면, 각 에이전트에게 4개의 문서를 병렬로 작업하도록 지시해야 합니다. 이 수를 지정해야 하는 이유는 그렇지 않으면 맥락이 폭발하여 충돌로 이어지기 때문입니다. 이는 특히 번역 작업 경험에 기반합니다. 따라서 신 대표는 각 에이전트가 최대 4개 항목을 처리하도록 확인합니다. 즉, 25개의 에이전트가 동시에 실행됩니다.
자동화의 단계별 구조
Backend.AI:GO 같은 대형 프로젝트의 경우 신 대표는 정확히 같은 플로우를 따릅니다. 이 과정은 매우 고도화되어 있습니다.
정기적으로 GitHub 이슈 추적기를 확인합니다. 발견되면 이를 검증하거나 현재 코드에 기반한 구현 계획을 만듭니다. 이러한 작업은 큐에 들어가고 다른 에이전트들이 이를 선택하고 처리합니다.
복잡한 도구는 없습니다. 모두 cron으로 관리됩니다. Claude에는 -p 옵션이 있는데 간단히 프롬프트를 실행합니다. 사용할 에이전트를 지정하는 옵션도 있습니다. 신 대표는 단순히 15분마다 실행합니다.
이슈를 찾고 처리하는 명령과 특정 스킬을 사용하여 검증하는 명령을 만들었고, 그 다음 Claude-p 옵션이 15분마다 이러한 명령을 주기적으로 실행합니다.
GitHub 자동화: 764개의 풀 리퀘스트
누가 이슈를 제기합니까? 많은 사람들이 제기합니다. 잠시 후 자동화되면 이메일 보내기도 자동화됩니다. 풀 리퀘스트의 경우 764개가 처리되었습니다. 잘했습니다.
이슈가 이런 식으로 제기되면, 예를 들어 신 대표가 제기한 일부 이슈가 나타나고 팀 멤버인 진원이 이슈를 등록하면 원래 이슈가 이런 형식으로 등록됩니다. 이것은 모두 이슈 등록에 관한 것입니다.
Claude Code는 이것을 읽고 어떻게 진행할지 분석합니다. 이슈가 등록되면 누가 이를 선택합니까? cron에 설정된 엔티티가 이를 선택합니다. 이를 선택하고 솔루션을 개발합니다. 검증하고, 통과하면 자동으로 병합하고 풀 리퀘스트를 제기합니다. 경우에 따라 많은 테스트가 필요할 수 있습니다. 그렇다면 테스트를 실행하고 피드백을 다른 개발 엔티티가 해결하는 데 사용합니다.
많아 보이지만 실제로 에이전트들은 단지 서로 상호작용합니다. 하지만 이슈의 시작은 인간이 맞습니까? 때로는 인간이, 때로는 완전히 자동화됩니다.
처리되지 않은 나머지 이슈의 경우, 거의 모두 신 대표 ID 아래 있습니다. 인간이 작성한 것입니까? 신 대표가 실행 중이기 때문입니다. GitHub의 내장 기능이 아닙니다. 이를 실행하는 ID가 신 대표의 GitHub ID이므로 모두 신 대표 이름으로 나타납니다.
예를 들어, 이 에픽을 보면 이것은 AI가 직접 작성했습니다. 이 에픽 이전에 모든 화면의 스크린샷을 찍어서 자신을 "볼" 수 있도록 하는 기능이 추가되었습니다. 그에 따라 가능한 모든 개선 사항을 식별하고 이를 별도로 이슈화하도록 지시했습니다. 따라서 여기서 서브 이슈가 생성되는 방식을 봅니다. 그 다음 이것이 최종화되고 테스트가 실행됩니다.
보안 문제가 있을 수 있거나 최적화가 가능한 영역이 있을 수 있습니다. 따라서 이러한 섹션을 반복하고 계속 개선 사항을 추가합니다. 이런 식으로 완전히 자동화됩니다.
이들 중에 신 대표가 직접 읽는 것이 얼마나 되나요? 모든 이슈를 읽습니다. 즉, 이슈가 해결되면 읽을 수 있는 보고서를 생성합니다. 예를 들어 이것을 읽어야 한다면, 특정 문제를 자세히 설명하는 1월 16일에 생성된 것입니다. 그것이 이슈였습니다. 원래 모든 이슈에 남겨졌지만, 종종 읽고 나면 불필요하면 삭제됩니다. 따라서 신 대표는 보안, 성능, 코드 품질, 기술적 결정을 평가합니다.
Bash, 로컬 설정, Python 수정과 같은 변경 사항의 세부 정보를 알려줍니다. 이것이 하고 있는 것을 따라가려면 신 대표는 배워야 할 것을 지정합니다. 이 기술 보고서는 단순한 보고서일 뿐만 아니라 선택의 기술적 세부 사항을 알지 못할 수 있는 경우 신 대표가 무엇을 배워야 하는지 알려줍니다.
코드를 거의 작성하지 않음에도 불구하고 보고서는 이 정도로 광범위합니다.
조직 전체의 에이전트 워크플로우: 재무, 마케팅, 콘텐츠
신 대표가 보여주는 이 워크플로우는 Backend.AI:GO만을 위한 것이 아닙니다. 재무, 마케팅, 콘텐츠가 이 플로우에 통합되면 회사 전체가 이런 식으로 운영될 수 있습니다.
Lablup의 경우가 바로 그렇습니다. 예를 들어 기술 비즈니스 보고서나 올해의 사업 계획을 작성할 때 인간이 작성하던 것을 올해부터는 인간은 토론에만 참여하고 실제 작성은 사람이 아닌 AI가 할 것입니다. 이는 250개 이상의 참고 문서를 제공했기 때문입니다. 또한 이를 마크다운으로 변환하는 도구를 만들었습니다. 이를 기반으로 지속적으로 정확성을 확인합니다.
더불어 2026년 2월부터 지속적으로 뉴스를 크롤링하여 방향이 올바른지, 어떤 예측이 정확했고 어떤 것이 잘못되었는지를 결정합니다. 또한 올해의 기술 사업 계획을 어떻게 수정해야 할지 제안합니다.
이런 식으로 자가 검토를 수행하고 토론 포인트를 우리를 위해 남깁니다. 예를 들어 신 대표의 CFO와 신 대표가 이것을 사용하고 있습니다. CFO는 코드를 못 쓰지만, 이제 우리가 개발한 '동기화' 명령을 사용해서 커밋할 수 있습니다. 신 대표가 감독하지만 Claude Code가 모든 일을 합니다. 네, 일을 공유합니다.
개인적 적응과 조직 변화: 인간의 차원
신 대표의 깊은 철학 이해, 구현, 그리고 세상의 방향에 대한 이해가 있어서 정확히 무엇을 만들어야 할지 알기 때문에 이런 종합적인 솔루션이 나타났다는 지적이 있습니다.
조직이 얼마나 빠르게 적응합니까? Lablup은 재능 있는 개인들로 가득 찬 회사입니다만, 일부는 이런 변화를 직관적으로 파악하는 반면 다른 사람들은 적응하기 어려워합니다. 개인적 차이가 있습니다.
신 대표의 관찰:
"확실히 개인에 따라 매우 다릅니다. 다행히 함께 일하는 재능 있는 사람들이 많습니다. 하지만 어떤 사람들은 더 어려운 시간을 겪고 있습니다. 자신들이 강점이라고 생각하던 것과 해야 할 일이 일치했는데, 어느 순간 그것들이 분리되었기 때문입니다."
긍정적인 측면은 거의 1년간 내부적으로 이런 주제를 자주 토론했다는 것입니다—세미나든 캐주얼한 대화든 말입니다. 이런 지속적인 대화는 위기로 이어지기보다는 사람들이 최선을 다해 적응하려고 한다는 뜻입니다. 다른 선택지가 없으니까요. 과거에 잘했던 사람들이 앞으로도 계속 잘할 것이라는 보장은 없습니다. 많은 사람들이 새로 시작하고 있으며 더 잘해지고 있습니다. 우리는 이것을 봅니다. 하지만 동시에 우리가 느끼는 것은 현재 기준에 기반합니다. 3개월 후에도 같을 것이라는 보장은 없습니다.
Lablup 내부적으로는 AI의 경우 2개월마다 변한다는 농담을 합니다. 따라서 지금 작동하지 않는 것이 있어도 긴급하지 않으면 단순히 미룹니다. 이 개념이 회사 내에서 전파하기 가장 어려웠습니다. CTO가 가장 최근에 받아들였습니다. 신 대표는 계속 그에게 이전처럼 작동하지 않는 것들을 미루라고 말했습니다. 그러다 최근 사건 이후 CTO가 "얼마나 더 미룰 수 있나요?"라고 물었습니다. 신 대표가 버전 4.6이 나왔으니 시도해보라고 했더니 해봤고, "오, 이제 작동합니다!"라고 외쳤습니다. 정말로 깨달음의 순간이었습니다.
그 이후로 CTO는 전체 HWP(한국어 워드 프로세서 파일 형식)를 분해했습니다. 이제 내부에 누구도 HWP 문서를 사용하지 않습니다.
결론: AI 시대의 생존 전략
신 대표와의 이 대화에서 드러나는 핵심은 이것입니다. 우리는 소프트웨어의 정의가 근본적으로 변하는 시대에 있습니다. 코드에서 모델로, 개별 개발자의 수고에서 에이전트의 협력으로, 장기 유지에서 순간적 가치 창출로의 패러다임 전환입니다.
이 변화 속에서 스타트업의 강점은 빠른 적응력입니다. 안정적인 시장은 스타트업에게 최악이며, 흔들리는 풍경이 새로운 기회를 가져옵니다. 신정규 대표는 10년간 축적한 기술 자산을 바탕으로, 이 새로운 시대에 필요한 것이 무엇인지 명확히 봅니다: AI가 최적으로 사용할 수 있는 인터페이스, 모델을 중심으로 한 시스템 설계, 그리고 지속적인 혁신.
더불어 경각심도 필요합니다. AI의 빠른 발전으로 수많은 제품이 만들어지고 버려질 것입니다. 생존하는 제품은 사회성, 일상 통합, 지속적 유지 보수의 약속을 가진 것들입니다. 브랜드와 신뢰가 다시 핵심이 될 것입니다.
컴퓨터 과학을 배우는 것도 여전히 매우 가치 있습니다. 기술이 아무리 발전해도 기본 사상과 논리를 이해하는 것은 모든 분야에서 필요합니다. AI 시대에 강하려면 특정 도메인의 전문가가 빨리 CS를 배우거나, CS 전문가가 빨리 특정 도메인을 배워야 합니다. 신 대표의 "물레방아 이론"이 이를 명확히 합니다.
마지막으로, 개인적으로 신 대표도 현재의 변화가 슬프다고 고백합니다. 10년간 번민하며 만든 기술이 이제 "클릭으로" 재현될 수 있다는 것은 확실히 슬픈 일입니다. 하지만 회사 차원에서 보면, 이는 감사할 일입니다. 빠르게 적응하고 변화할 수 있는 스타트업은 이런 변화를 기회로 삼을 수 있기 때문입니다.
우리는 더 이상 "얼마나 좋은 코드를 쓸 것인가"를 묻지 않습니다. 대신 "AI가 최적으로 작동할 수 있는 시스템을 어떻게 만들 것인가", "사용자 경험은 어떻게 설계할 것인가", 그리고 가장 중요하게는 "무엇이 우리를 구별되게 할 것인가"를 묻습니다. Backend.AI:GO의 40일간의 개발은 이 새로운 시대의 소프트웨어 개발이 무엇인지를 보여주는 가장 구체적인 예입니다.
Original source: EP 86. 진짜 내 일을 해결하는 Agentic Workflow (Lablup 신정규 대표)
powered by osmu.app