당신의 유스케이스에 가장 저렴한 LLM은?

토큰 수와 사용량을 입력하면 모든 모델의 요청·일·월별 비용이 나란히 표시됩니다. 가격 편집 가능.

{{ __t('usage_section') }}
{{ __t('cache_hint') }}

{{ __t('cost_comparison') }}
{{ __t('model') }} {{ __t('th_in') }}
$/Mtok
{{ __t('th_out') }}
$/Mtok
{{ __t('th_cache_read') }}
$/Mtok
{{ __t('th_per_request') }}
$
{{ __t('th_per_day') }}
$
{{ __t('th_per_month') }}
$
{{ m.name }}
{{ m.vendor }}
{{ calcRequest(m).toFixed(5) }} {{ calcDay(m).toFixed(2) }} {{ calcMonth(m).toFixed(2) }}
{{ __t('note_label') }}: {{ __t('prices_disclaimer') }}

LLM API 비용 구조

공급사는 백만 토큰(Mtok) 단위로 과금하며 입력·출력 가격이 별도입니다. 다수가 캐시 가격을 제공해 안정적인 컨텍스트는 캐시 후 입력 가격의 일부로 다시 읽힙니다. 시스템 프롬프트 재사용이 많을 때 입력 비용을 50–90% 줄일 수 있습니다.

실무: 가장 저렴하면서 충분한 모델 고르기

분류·요약·간단 추출은 소형 모델(Haiku, GPT-4o mini, Gemini Flash, DeepSeek)이 20–100배 저렴하며 워크로드의 80%를 커버합니다. 추론·코드·다단 작업은 Opus, GPT-4o, Gemini Pro. 라우터로 40–70% 절감 가능.

비용 절감 팁

  • 프롬프트 캐시 활용: 시스템 프롬프트와 큰 고정 컨텍스트를 캐시 블록으로 표시 — Anthropic, OpenAI, Google 모두 지원.
  • 출력을 짧게: 출력은 보통 입력의 3–5배 가격. 긴 산문 대신 구조화된 JSON 사용.
  • 배치 API 활용: Anthropic, OpenAI에서 비동기 배치는 50% 저렴.