기업들이 저가 AI 모델로 전환하면서 발생하는 비용 절감과 성능 향상의 실제 사례를 분석합니다. 2025년 AI 구매 전략을 완벽 가이드하세요.
AI 비용 구조의 대변혁: 기업들이 오픈소스 모델로 전환하는 이유
핵심 요약
- 기반 모델 연구소들이 애플리케이션 영역으로 진출 하면서 AI 시장 판도가 재편되고 있습니다
- 최첨단 모델의 가격은 상승, 오픈소스 모델의 성능은 대폭 개선 되어 기업들의 선택지가 넓어지고 있습니다
- 코인베이스, 린디, 하비 등 주요 기업들이 저가 모델로 전환하면서 수백만 달러를 절약 하고 있습니다
- 절감된 비용을 더 많은 토큰 처리에 재투자 함으로써 AI 서비스의 질과 규모를 동시에 향상시키고 있습니다
- 단위 경제성(Unit Economics)의 변화가 2025년 AI 투자 의사결정의 핵심 기준 이 되고 있습니다
AI 비용 구조를 재편하는 세 가지 핵심 요인
현재 AI 업계는 근본적인 변화의 소용돌이 속에 있습니다. 이 변화를 주도하는 세 가지 핵심 요인이 있습니다.
첫째, 기반 모델 연구소들의 전략적 이동입니다. 과거에는 기반 모델을 개발하는 회사와 이를 활용하는 애플리케이션 개발사가 명확히 구분되었습니다. 그러나 OpenAI, Anthropic, 그리고 새로운 강자들이 스택 상위로 올라가 직접 애플리케이션 영역으로 진출하기 시작했습니다. 이는 과거의 수직 분업 구조를 깨뜨리고 있으며, 기존 애플리케이션 개발사들에게 새로운 경쟁 압력을 만들고 있습니다.
둘째, 최첨단 모델의 가격이 계속해서 상승하고 있다는 점입니다. GPT-4, Claude 3 Opus와 같은 가장 똑똑한 최신 모델들의 토큰 가격이 지속적으로 인상되고 있습니다. 이는 고성능 모델의 추론 비용이 늘어나면서 대규모 운영을 하는 기업들의 부담이 커지고 있음을 의미합니다. 특히 마진율이 높지 않은 애플리케이션 기업들에게는 심각한 비용 부담이 되고 있습니다.
셋째, 오픈소스 모델의 비약적인 성능 향상입니다. DeepSeek, Kimi, Llama 같은 오픈소스 모델들이 기하급수적으로 발전하면서, 대부분의 실무 사용 사례에서 '충분히 좋은' 수준을 넘어섰습니다. 더 이상 오픈소스 모델을 "저성능의 저가 대체제"로만 볼 수 없게 되었습니다. 많은 작업에서 최첨단 유료 모델과 유사하거나 심지어 더 나은 결과를 제공하고 있습니다.
이 세 가지 요인이 만나면서, AI를 구매하는 기업들의 자연스러운 반응은 "대체"(substitution)입니다. 비용이 높아지고 있는데 성능 좋은 저가 대안이 있다면, 기업들이 선택할 수 있는 길은 명확합니다.
기업들의 실제 전환 사례: 수백만 달러의 절감 효과
이론이 아닌 현실에서 일어나고 있는 변화를 살펴보겠습니다. 전 세계의 주요 기업들이 이미 저가 모델로의 대규모 전환을 시작했습니다.
코인베이스: 비용 절감을 토큰 투자로 재할당
암호화폐 거래소 코인베이스는 매우 전략적인 접근을 취하고 있습니다. 코인베이스 CEO 브라이언 암스트롱은 공개적으로 다음과 같이 밝혔습니다:
"코인베이스에서는 적절한 경우 더 저렴한 모델로 프롬프트를 라우팅하는 데 적극적으로 노력하고 있으며, 일부 경우에는 비용을 거의 동일하게 유지할 수 있었습니다. 동시에 토큰 사용량은 기하급수적으로 증가하고 있습니다."
이 발언의 의미는 매우 중요합니다. 코인베이스는 단순히 비용을 절감하는 것이 아니라, 절감된 비용을 다시 AI 서비스에 투자하고 있다는 뜻입니다. 절감된 비용 = 추가 기능 개발과 서비스 품질 향상 으로 이어지고 있다는 의미이기도 합니다. 이는 "비용 절감만을 추구하는" 재정 관리가 아니라, "전략적 재투자를 통한 경쟁력 강화"라는 새로운 경영 패러다임을 보여줍니다.
린디(Lindi): 100% 모델 전환으로 수백만 달러 절감
문서 협업 플랫폼 린디의 CEO는 매우 과감한 결정을 내렸습니다. 그 내용은 다음과 같습니다:
"오늘 결단을 내리고 린디 트래픽의 100%를 DeepSeek v4로 전환했습니다. 앤트로픽 모델에서 갈아탄 것입니다. 이로 인해 수백만 달러를 절약할 수 있었고, 실제로 많은 핵심 사용 사례에서 성능이 _향상_되는 것을 확인했습니다. 이는 사업에 혁신적인 변화를 가져왔습니다."
린디의 사례는 매우 상징적입니다. 단순한 비용 절감을 넘어서 성능의 향상까지 경험 했다는 점이 중요합니다. 이는 과거의 "저가 = 저성능"이라는 등식이 더 이상 성립하지 않음을 명확히 보여줍니다. 더욱 주목할 점은 "100% 전환"이라는 과감한 결정입니다. 이는 DeepSeek v4가 단순한 대안이 아니라 Claude를 완전히 대체할 수 있는 수준에 도달했음을 의미합니다.
하비(Harvey): 법률 AI에서 11배 비용 절감, 성능은 향상
법률 AI 플랫폼 하비가 제시한 벤치마크 결과는 더욱 놀랍습니다:
"저희 법률 에이전트 벤치마크(LAB)의 100개 작업 샘플에서, SFT는 Kimi 2.6의 전체 통과율을 11%에서 15%로 끌어올려, Opus의 14%를 넘어섰습니다. 하지만 비용 격차는 훨씬 더 놀라웠습니다. 동일한 100개 작업에서 84달러 대 954달러로, 약 11배 더 저렴했습니다."
하비의 벤치마크는 AI 구매자들이 직면한 현실을 가장 명확하게 보여줍니다. 11배 비용 절감에 성능까지 우수 하다는 것입니다. Claude Opus는 업계 최고 수준의 모델로 평가받아왔는데, 중국의 Kimi 2.6이 비용은 1/11 수준이면서 오히려 성능에서 앞서간다는 것은 AI 업계의 근본적 변화를 의미합니다. 이러한 결과가 나타나면, 기업의 CFO 입장에서는 선택의 여지가 없습니다.
커서(Cursor): 내부 모델 미세조정으로 10배 효율성 달성
커서는 한 걸음 더 나아갔습니다. 단순히 저가 모델로 전환하는 것에 그치지 않고, 저가 모델을 자체 프로덕션 코드 생성 모델인 Composer로 후속 학습(fine-tuning)시켰습니다:
"Composer 2.5는 탁월하게 지능적이며 유사한 성능의 모델보다 최대 10배 더 효율적입니다."
커서의 접근 방식은 새로운 트렌드를 제시합니다. 이는 오픈소스 기반 모델을 자신의 용도에 맞춰 미세조정하는 전략 입니다. 과거에는 기업들이 기성 모델을 그대로 사용했다면, 이제는 자신의 특정 작업에 맞춰 모델을 튜닝하고 있습니다. 이렇게 되면 기업은 막강한 경쟁 우위를 확보하게 됩니다. 비용도 저렴하고, 자사의 요구사항에 최적화된 모델을 소유하게 되기 때문입니다.
AI 비용 구조의 급변이 의미하는 바
코인베이스의 인용문은 현재 일어나고 있는 변화의 본질을 명확하게 설명합니다. 절감된 비용이 기업의 주머니로 들어가지 않는다 는 것입니다. 대신, 그 비용은 더 많은 토큰 처리량과 더 나은 서비스로 재투자 되고 있습니다.
이것이 과거와 다른 점입니다. 과거 기업들이 비용을 절감했을 때는 그것이 순수한 이익(profit margin)이 되었습니다. 하지만 현재는 다릅니다. AI 경쟁에서 이기려면 더 많은 연산이 필요하고, 더 나은 모델 출력이 필요합니다. 따라서 기업들은 절감된 비용을 다시 AI에 쏟아붓고 있습니다.
이러한 변화는 AI 업계의 경제학을 근본적으로 변화시키고 있습니다:
첫째, 최첨단 폐쇄형 모델의 프리미엄이 급속도로 사라지고 있습니다. 과거에는 OpenAI나 Anthropic의 최신 모델을 사용하는 것이 일종의 "표준"처럼 여겨졌습니다. 하지만 이제는 특정한 경우를 제외하고는 더 이상 프리미엄을 정당화할 수 없게 되었습니다. 오픈소스 모델이 충분히 좋아졌고, 가격 차이도 너무 크기 때문입니다.
둘째, 오픈소스 모델의 가격은 계속해서 내려가고 성능은 올라가고 있습니다. 이는 단기적인 추세가 아니라 장기적인 구조적 변화입니다. 더 많은 기업이 오픈소스 모델에 투자할수록, 이들 모델은 더욱 좋아질 것입니다. 동시에, 이들 모델에 대한 수요가 증가할수록 가격 경쟁은 심화될 것입니다.
셋째, 기업들의 의사결정 기준이 "최고 성능"에서 "단위 경제성(Unit Economics)"으로 이동하고 있습니다. 더 이상 "가장 똑똑한 모델"을 선택하는 것이 자동적인 선택이 아닙니다. 대신 기업들은 "주어진 비용으로 얼마나 많은 작업을 할 수 있는가"를 묻고 있습니다. 이는 매우 실질적이고 재정적인 관점의 변화입니다.
기업들이 직면한 선택: 어떤 기울기를 적용할 것인가?
현재 상황을 간단한 그래프로 나타낼 수 있습니다. 한쪽 축에는 모델의 성능이 있고, 다른 한쪽 축에는 비용이 있습니다.
과거의 상황: 성능이 높을수록 비용이 높았습니다. 마치 가파른 램프(ramp) 같았습니다. 최고의 성능을 원하면 최고의 비용을 감수해야 했습니다. 기업들의 선택은 제한적이었습니다.
현재의 상황: 오픈소스 모델의 발전으로 이 램프의 기울기(slope)가 평탄해지고 있습니다. 더 낮은 비용으로도 충분히 좋은 성능을 얻을 수 있게 되었습니다. 기업들의 선택지가 급격히 늘어났습니다.
앞으로의 상황: 기업들은 자신의 단위 경제성에 맞는 기울기를 선택해야 합니다. 일부 기업은 최고의 성능이 필수적인 경우가 있습니다. 예를 들어, 고도의 추론이 필요한 과학 연구나 복잡한 법률 분석 같은 특수한 분야에서는 여전히 최첨단 모델이 필요할 수 있습니다. 하지만 대부분의 기업들은 충분히 좋은 성능을 제공하면서도 비용을 대폭 절감할 수 있는 중간 지점을 선택할 것입니다.
2025년 AI 구매 의사결정의 새로운 기준
이러한 변화는 2025년 AI 투자를 고려하는 모든 기업에게 중요한 교훈을 제공합니다.
첫째, 자신의 사용 사례를 정확히 파악해야 합니다. 모든 작업이 최고의 모델을 필요로 하지는 않습니다. 텍스트 분류, 간단한 요약, 기본적인 데이터 추출 같은 작업은 오픈소스 모델로도 충분히 처리할 수 있습니다. 반면 매우 복잡한 추론이 필요한 경우는 여전히 최첨단 모델이 필요할 수 있습니다.
둘째, 비용만이 아니라 전체 단위 경제성을 고려해야 합니다. 모델 비용이 낮더라도, 더 많은 리소스를 필요로 한다면 총 운영 비용은 높을 수 있습니다. 반대로 모델 비용이 높더라도, 더 정확한 결과로 인해 전체 비용이 더 낮을 수도 있습니다.
셋째, 내부 역량 개발을 고려해야 합니다. 커서의 사례처럼, 오픈소스 모델을 자신의 특정 작업에 맞춰 미세조정하면 강력한 경쟁 우위를 확보할 수 있습니다. 이는 단기적으로는 추가 비용이 들지만, 장기적으로는 매우 가치 있는 투자입니다.
넷째, 정기적으로 모델 성능을 재평가해야 합니다. 오픈소스 모델의 발전 속도가 매우 빠르기 때문에, 과거의 결정이 지금도 최선인지 확인해야 합니다. 3개월 전에 선택한 모델이 지금도 최적인지 검증하는 것이 중요합니다.
결론
AI 비용 구조의 급변은 단순한 시장 변동이 아니라 구조적 전환입니다. 기반 모델 연구소들의 애플리케이션 진출, 최첨단 모델의 가격 상승, 그리고 오픈소스 모델의 비약적 성능 향상이 만나면서, 기업들이 직면한 선택의 폭이 급격히 넓어지고 있습니다.
코인베이스, 린디, 하비, 커서 같은 선도적 기업들은 이미 이러한 변화에 적응했습니다. 그들은 저가 모델로의 전환을 통해 수백만 달러를 절감하면서도 서비스 품질을 유지하거나 오히려 향상시키고 있습니다. 이는 더 이상 이론적 가능성이 아니라 현실입니다.
2025년 AI 전략을 수립하는 기업이라면, 자신의 단위 경제성에 맞는 "기울기"를 선택해야 할 때입니다. 최고의 모델만이 최고의 선택이 아니라, 자신의 사용 사례와 예산에 가장 맞는 모델을 선택하는 것이 현명한 전략입니다. 이러한 전환은 이미 시작되었으며, 뒤처지는 기업들은 경쟁에서 밀려날 가능성이 높습니다.
Original source: The Substitution Wave in AI
powered by osmu.app