LLM 추론 인프라 완벽 가이드: 토큰 경제학과 GPU 최적화 | OSMU Blog