AI API Pricing Calculator

Complete Guide to AI API Pricing

Quick Reference

Token Basics

1 token ≈ 4 characters in English
100 tokens ≈ 75 words
1 page of text ≈ 750 words ≈ 1000 tokens

Cost Structure

Input tokens are cheaper
Output tokens cost more
Prices per million tokens

Understanding AI API Costs

AI language models process text in chunks called tokens. When using these APIs, you're charged based on the number of tokens processed, with separate pricing for input (your prompts) and output (the AI's responses). Understanding how tokens work is crucial for cost optimization.

Updated: Now includes the latest Anthropic Claude models – Claude Opus 4.1, Claude Sonnet 4.5, Claude Sonnet 4, and Claude Haiku 4.5.

AI Models Pricing (per 1M tokens)

Provider	Model Name	Input Cost ($)	Output Cost ($)
Anthropic	Claude Opus 4.1	$15.00	$75.00
Anthropic	Claude Opus 4	$15.00	$75.00
Anthropic	Claude Sonnet 4.5	$3.00	$15.00
Anthropic	Claude Sonnet 4	$3.00	$15.00
Anthropic	Claude Sonnet 3.7	$3.00	$15.00
Anthropic	Claude Haiku 4.5	$1.00	$5.00
DeepSeek	deepseek-chat	$0.56	$1.68
DeepSeek	deepseek-reasoner	$0.56	$1.68
Google	Gemini 2.5 Pro	$1.25	$10.00
Google	Gemini 2.5 Flash	$0.15	$0.60
Google	Gemini 2.0 Flash	$0.15	$0.60
Google	Gemini 2.0 Flash-Lite	$0.07	$0.30
OpenAI	o1-pro	$150.00	$600.00
OpenAI	GPT-4.5	$75.00	$150.00
OpenAI	GPT-realtime (audio)	$32.00	$64.00
OpenAI	GPT-5 pro	$15.00	$120.00
OpenAI	o1	$15.00	$60.00
OpenAI	o3	$10.00	$40.00
OpenAI	GPT-realtime (text)	$4.00	$16.00
OpenAI	GPT-4o Search Preview	$2.50	$10.00
OpenAI	GPT-4o	$2.50	$10.00
OpenAI	GPT-4.1	$2.00	$8.00
OpenAI	GPT-5.1	$1.25	$10.00
OpenAI	GPT-5	$1.25	$10.00
OpenAI	o4-mini	$1.10	$4.40
OpenAI	o3-mini	$1.10	$4.40
OpenAI	GPT-4.1 mini	$0.40	$1.60
OpenAI	GPT-5 mini	$0.25	$2.00
OpenAI	GPT-4o mini Search Preview	$0.15	$0.60
OpenAI	GPT-4o mini	$0.15	$0.60
OpenAI	GPT-4.1 nano	$0.10	$0.40
OpenAI	GPT-5 nano	$0.05	$0.40
Perplexity	Sonar Pro	$3.00	$15.00
Perplexity	Sonar Reasoning Pro	$2.00	$8.00
Perplexity	Sonar Deep Research	$2.00	$8.00
Perplexity	Sonar	$1.00	$1.00
Perplexity	Sonar Reasoning	$1.00	$5.00
xAI	grok-4-0709	$3.00	$15.00
xAI	grok-3	$3.00	$15.00
xAI	grok-3-mini	$0.30	$0.50
xAI	grok-code-fast-1	$0.20	$1.50

Token Counting Guide

What Counts as a Token?

Common English words: 1-2 tokens
Long or uncommon words: 2-3+ tokens
Numbers: ~1 token per 2-3 digits
Spaces and punctuation count
Special characters may use more tokens

Token Examples

"Hello" = 1 token
"artificial intelligence" = 3 tokens
"123456" = 2 tokens
"https://" = 2 tokens
Emojis: 1-3 tokens each

Note: The token count is an estimate and may vary slightly depending on the model. For additional details, please visit tiktokenizer.vercel.app.

Cost Optimization Strategies

1. Input Optimization

Use Clear, Concise Prompts: Shorter prompts mean fewer input tokens. Be specific but brief.
Leverage Input Caching: Some models offer discounted rates for cached inputs, perfect for repeated queries.
Batch Similar Requests: Combine related queries when possible to reduce overhead.

2. Output Management

Set Token Limits: Always specify maximum output tokens to prevent unexpected costs.
Choose the Right Model: Use cheaper models for drafts and more expensive ones for final versions.
Implement Retry Strategies: Handle API failures gracefully to avoid wasting tokens.

💡 Pro Tips for Cost Efficiency

Monitor token usage patterns to identify optimization opportunities
Use model-specific features like caching when available
Consider breaking long inputs into smaller chunks
Test with smaller outputs before scaling up
Keep track of costs across different models to optimize spending

Calculate AI API Costs

Model Selection

Input Details