FAL이 데이터 인프라에서 생성형 AI 플랫폼으로 피벗해 1년간 2백만 달러에서 1억 달러로 성장한 스토리. 창업자 겸 CTO 거르켐의 전략 공개
FAL의 폭발적 성장 전략: 피벗 성공과 AI 생성 미디어의 미래
핵심 요약
- 급진적 피벗의 성공: 유료 고객이 있는 데이터 팀 제품에서 생성형 AI 플랫폼으로 전환해 연 2백만 달러에서 1억 달러 이상으로 급성장
- 시장 타이밍의 중요성: Stable Diffusion 출시가 전체 AI 패러다임을 변화시켰고, FAL은 이를 빠르게 포착하여 추론 최적화에 집중
- 개발자 중심 전략: 전통적 마케팅 대신 밈, 해커톤, 커뮤니티 활동으로 개발자 200만 명 확보
- 기술적 차별화: 600개 모델 동시 호스팅, 콜드 스타트 최적화, 28개 데이터센터 운영으로 경쟁사와 차별화
- 확장성 있는 조직 문화: 엔지니어 45명으로 1억 달러 매출 달성, 엔지니어링 매니저 직책 폐지 등 독특한 운영 방식
비즈니스 피벗: 성공의 터닝 포인트
창업자 겸 CTO 거르켐은 공동창업자 부르카이와 함께 데이터 인프라 회사로 시작했습니다. 당시 그들은 대기업의 데이터 변환 작업을 돕는 제품을 개발 중이었는데, 데이터브릭스와 스노우플레이크의 발자취를 따르며 클라우드 컴퓨팅을 수익화할 수 있을 거라 예상했습니다. 하지만 2022년 Stable Diffusion이 출시되면서 전체 AI 산업의 패러다임이 급변했습니다.
"Stable Diffusion이 등장했을 때, 우리는 유료 고객을 포기하고 피벗이라는 어려운 결정을 내렸습니다."라고 거르켐은 회상합니다. 이는 단순한 방향 전환이 아닌 진정한 피벗이었습니다. 이미 고객이 있었고, 투자자들도 원래 아이디어에 투자한 상태였기 때문입니다.
처음에는 두 제품을 동시에 개발하려 했습니다. 그들은 서로를 설득하면서 "이건 그렇게 급진적인 피벗은 아닐 거야. 우리 여전히 클라우드에서 컴퓨팅을 하고 있으니까"라고 자위했습니다. 하지만 2개월 정도 지나면서 AI 추론의 성장이 데이터 변환보다 훨씬 빠르다는 것을 깨달았고, 결국 기존 고객들에게 작별을 고했습니다.
이러한 결정에 도움이 된 프레임워크가 있었습니다. 투자자는 "어떤 아이디어가 먼저 100만 달러 수익을 달성할 것 같고, 어떤 아이디어가 먼저 1,000만 달러 수익을 달성할 것 같냐"고 물었습니다. 비록 그들의 예측은 틀렸지만, 이 질문은 의사결정 과정에서 큰 도움이 되었습니다. 결과적으로 생성형 AI 아이디어가 더 빨리 1,000만 달러에 도달했고, 현재 1억 달러 이상의 ARR을 달성했습니다.
시장 타이밍과 기술적 혁신
FAL이 성공할 수 있었던 가장 큰 요인은 정확한 시장 타이밍이었습니다. Stable Diffusion이 출시되면서 AI 제품 개발이 갑자기 민주화되었습니다. 더 이상 거대한 데이터셋이 필요 없었고, 기성 모델을 활용하면 누구나 AI 제품을 만들 수 있게 된 것입니다.
"기성 모델이 있다면 모든 것이 달라집니다. 이 전체 데이터 준비 단계는 건너뛸 수 있고, 가장 큰 기업들만이 그 작업을 할 것입니다."라고 거르켐은 설명합니다. 다른 모든 사람들은 상용 제품을 사용하게 될 것이고, 이것이 FAL을 추론 쪽으로 이끌었습니다.
당시 Together AI나 Base 10 같은 경쟁사들이 있었지만, 그들은 언어 모델과 텍스트에 집중하고 있었습니다. FAL은 이미지 생성 모델에 집중하기로 결정했는데, 이는 전략적 선택이었습니다. "이미지가 먼저 나왔으니까요. Stable Diffusion이 Llama 2보다 먼저 나왔거든요."
더 중요한 결정은 GPU 인프라를 단순히 제공하는 것이 아니라 사용하기 쉬운 API를 구축하기로 한 것입니다. 이것이 진정한 차별화 요소가 되었습니다. "API 엔드포인트를 구축해서 사람들이 API 엔드포인트만 호출하도록 하는 방식을 선택했습니다."
기술적 차별화: 600개 모델의 최적화
FAL의 가장 큰 기술적 업적은 600개가 넘는 모델을 동시에 호스팅하면서도 최고의 성능을 유지하는 것입니다. 이는 단일 모델을 호스팅하는 것과는 완전히 다른 문제입니다.
"단일 모델을 호스팅하고 최적화하여 서비스하는 것과 600개의 다른 모델을 동시에 호스팅하는 것은 완전히 다른 문제입니다. 모두 다양한 아키텍처와 다양한 문제를 가지고 있으며, 각기 다른 트래픽 패턴을 보입니다."
이를 구현하기 위해 FAL은 여러 가지 복잡한 최적화를 수행해야 했습니다. 첫째, 콜드 스타트 최소화입니다. 완전히 새로운 모델을 시작할 때 가능한 한 빨리 가동해야 합니다. "초 또는 밀리초 단위로 이야기하고 있습니다."
둘째, 지능적인 캐싱 전략입니다. FAL은 28개의 데이터센터에서 운영 중이므로, 요청이 들어오면 해당 모델이 로컬에 캐시되어 있거나 최소한 충분히 가까운 노드로 라우팅되어야 합니다. 때로는 당장 사용되지 않더라도 다른 모델을 서비스하는 동안 캐시된 상태를 유지합니다.
셋째, 동적 스케일링입니다. 새로운 요청이 들어올 때마다 매우 빠르게 자동 확장 및 축소될 수 있어야 합니다. 이를 통해 GPU 활용률을 최대화하고 비용을 절감할 수 있습니다.
거르켐의 설명에 따르면, "우리는 600개의 모델을 호스팅하면서도, 마치 당신이 모델 하나를 호스팅하는 것과 같은 수준, 아니 그보다 더 나은 성능을 제공해야 합니다."
개발자 중심의 마케팅 전략
FAL의 성장을 가능하게 한 또 다른 중요한 요소는 개발자 중심의 마케팅 전략입니다. 전통적인 마케팅은 개발자들에게 통하지 않습니다. "전통적인 마케팅은 개발자들에게 통하지 않습니다. 사람들은 그것을 오글거린다고 생각합니다."
대신 FAL은 밈과 커뮤니티 활동을 활용했습니다. 가장 유명한 예가 "GPU 부자" "GPU 빈자" 모자입니다. Semi Analysis 블로그의 기사에서 Google을 제외한 모든 사람이 GPU 부족이라는 내용이 트위터 밈이 되자, FAL은 즉시 이에 편승했습니다. "GPU 부자 모자보다 GPU 가난 모자가 훨씬 빨리 동났어요. 모두가 GPU 가난 모자가 정말 웃기다고 생각했죠."
이외에도 FAL은 해커톤을 개최하고, 개발자 컨퍼런스를 준비하며, 500개가 넘는 슬랙 채널을 통해 개발자들과 소통하고 있습니다. "저희는 함께 일하는 회사들의 모든 엔지니어들과 500개가 넘는 슬랙 채널을 운영하고 있습니다. 그리고 그 슬랙 채널들의 응답률을 매일 측정하며, 그것에 대해 집착합니다."
거르켐은 창업자 아담 호(Adam Ho)와 함께 훌륭한 브랜드를 구축했으며, 지금도 이 브랜드에 매우 만족하고 있습니다. 중요한 것은 개발자들이 원하는 것이 무엇인지 이해하는 것입니다. 개발자들은 미묘하고 세련된 마케팅을 원합니다.
제품 개발과 시장 대응
FAL의 빠른 성장률을 관리하기 위해서는 급변하는 시장에 신속하게 대응해야 합니다. 새로운 모델이 출시될 때마다 FAL은 즉시 이를 통합하려고 노력합니다.
"모델이 처음 출시될 때, BAN이 몇 번 그랬던 것 같아요. 제가 화면을 공유하고 이 모델을 파일에 배포하는 것을 스피드런으로 진행했는데, 사람들이 그걸 지켜봤죠."
이를 가능하게 하는 것은 응용 ML 팀이 가지고 있는 높은 수준의 집착과 헌신입니다. 약 15명으로 구성된 이 팀은 매일 모델들을 배포하고 최적화하며 가지고 논다고 해도 과언이 아닙니다. "마치 이것이 그들의 취미인 것처럼, 파일에서 일하지 않았더라도 어차피 이 일을 하고 있었을 겁니다."
또한 FAL은 연구실과 긴밀한 관계를 유지하고 있어서, 새로운 모델이 출시되기 전에 정보를 얻을 수 있습니다. "모두가 우리와 이야기하고 싶어 하고, 0일차에 자신들의 모델을 파일로 출시하려고 합니다."
비디오 모델: 차세대 성장 동력
2024년은 FAL에게 매우 중요한 해였습니다. 비디오 생성 모델의 등장으로 새로운 성장 기회가 나타났습니다. "10월쯤이 API에서 상업적으로 이용 가능한 첫 비디오 모델이었던 것 같아요. 그 이후로 우리는 정말 미친 듯이 성장해 왔습니다."
비디오 모델은 이미지 모델보다 훨씬 더 큰 컴퓨팅 파워를 필요로 합니다. 이는 FAL이 여러 GPU에서 병렬 처리를 더욱 효율적으로 수행해야 한다는 의미입니다. "어떤 작업이 1분 걸리는데 20%를 단축할 수 있다면, 아마 충분히 많은 사람들이 신경 쓰지 않을 겁니다. 하지만 어떤 작업이 1분 걸리는데 비슷한 비율을 단축할 수 있다면, 갑자기 그것은 훨씬 더 의미가 커집니다."
거르켐은 2027년의 세상을 이렇게 그립니다: "이제 스튜디오들은 이 기술이 충분히 좋고, 이를 활용하여 실제로 돈을 절약할 수 있다는 것을 이해했습니다. 크리에이티브 인력들도 이것을 자신들을 단순히 대체하는 것이 아니라 창의성을 향상시키는 것으로 보고 있습니다."
영업 전략과 수익 모델
FAL의 성장은 단순한 기술 우수성만으로는 불가능했습니다. 올바른 영업 전략이 필수적이었습니다. 초기 투자자들은 이 수익이 지속 가능하지 않을 수 있다고 비판했기 때문입니다.
거르켐과 부르카이는 기업 영업을 매우 진지하게 받아들였습니다. "우리는 경쟁사들보다 일찍 영업팀을 구축했고, 종량제(pay-as-you-go) 방식보다는 연간 약정 형태로 최대한 많은 수익을 확보하려고 노력했습니다."
흥미로운 점은 대부분의 기업 고객이 인바운드로 유입된다는 것입니다. 개발자가 제품을 사용하다가 지출이 증가하면, FAL은 자동으로 신호를 포착하고 연락합니다. "기본적으로 우리는 Salesforce에 몇 가지 신호를 가지고 있습니다. 예를 들어, 하루에 300달러 정도를 지출한다고 가정해봅시다. 만약 그 이상을 지출하면 Salesforce에 기회가 생성됩니다."
조직 문화와 인재 채용
FAL은 매우 독특한 조직 문화를 구축했습니다. 45명의 팀으로 1억 달러 이상의 매출을 올리는 것은 매우 효율적인 조직임을 의미합니다. 이를 가능하게 하는 한 가지 특이점은 엔지니어링 매니저 직책이 없다는 것입니다.
"약 32~34명의 엔지니어가 있어요. 물론 팀 내에 리더는 있지만, 엔지니어링 매니저라는 직책은 없습니다. 모두가 항상 코드를 작성하며 기여하고 있어요."
또한 FAL은 일대일 미팅 대신 1대3이나 1대4 같은 소규모 그룹 토론을 선호합니다. 이렇게 하면 조직 전체의 통찰력이 더 잘 공유되고, 건설적인 논의가 가능해집니다.
인재 채용에 있어서 거르켐은 최적화에 대한 집착과 필드에 대한 열정을 중시합니다. "최적화에 대한 집착입니다. 데이터베이스 회사에서 일했거나 저수준 시스템 엔지니어링을 해본 경험이 있다면 GPU를 다뤄본 적이 없더라도 큰 장점입니다."
또한 FAL은 대기업 경험자를 선호합니다. "아마존이나 코인베이스 같은 대기업에서 저희는 엄청나게 많은 재능 있는 엔지니어들을 만났고, 가장 재능 있는 사람들을 Fall로 데려올 수 있었습니다."
성장 관리와 미래 전망
FAL의 성장률은 매우 가파릅니다. 지난해 8월에는 2백만 달러였던 ARR이 이제 1억 달러를 넘었습니다. 이러한 급속한 성장을 관리하기 위해 거르켐은 몇 가지 원칙을 따릅니다.
첫째, 수익을 북극성으로 삼습니다. "수익이 1순위입니다. 저희가 시도했던 다른 모든 것들은 다소 무용지물이 되었습니다."
둘째, 모델 출시를 마케팅 기회로 활용합니다. "플랫폼에서 발생하는 모든 모델 출시는 저희에게 더 많은 마케팅을 할 수 있는 기회가 됩니다."
거르켐이 현재 가장 해결하고 싶은 기술적 문제는 다중 GPU에서의 선형 스케일링입니다. "모델을 여러 GPU에서 실행할 수 있어야 합니다. 하나의 GPU에서 1분이 걸리는 작업을 두 개의 GPU에서 30초 만에 실행하고 싶기 때문입니다."
결론
FAL의 성공은 올바른 타이밍, 기술적 우수성, 개발자 중심의 접근 방식이 결합된 결과입니다. 거르켐과 부르카이는 초기의 어려운 피벗 결정을 통해 현재의 위치에 도달했으며, 지속적으로 시장의 변화에 빠르게 대응하고 있습니다.
생성형 AI 미디어의 미래는 밝으며, FAL은 이 분야의 리더로서 계속해서 혁신을 주도할 것으로 예상됩니다. 특히 비디오 생성 모델의 발전과 함께, FAL의 기술적 차별화와 개발자 중심의 플랫폼 전략이 더욱 주목받을 것 같습니다. 스타트업 창업자들에게 FAL의 이야기는 불확실성 속에서도 올바른 판단과 빠른 실행의 중요성을 보여주는 훌륭한 사례가 될 것입니다.
Original source: The pivot that paid off: How fal found explosive growth | Gorkem Yurtseven (Co-founder and CTO)
powered by osmu.app