(Tom Tunguz) AI 추론 시장 분화: 지연시간, 멀티모달, 엣지 인프라 완벽 분석 | OSMU Blog