AI Models with Reasoning

These 129 models use chain-of-thought reasoning to break down complex problems step-by-step. They excel at math, logic, coding challenges, and multi-step planning — trading speed for accuracy on hard tasks.

129

Reasoning Models

Providers

+ Vision

108

+ Tool Use

Free

All Reasoning Models — Ranked by Score

#	Model	Provider	Score	Context	$/1M Out
1	GPT-5.2 ProOpenAI	OpenAI	90	400K	$168.00
2	GPT-5 ProOpenAI	OpenAI	90	400K	$120.00
3	o3 ProOpenAI	OpenAI	82	200K	$80.00
4	Claude Opus 4.1Anthropic	Anthropic	81	200K	$75.00
5	o1-proOpenAI	OpenAI	77	200K	$600.00
6	Claude Opus 4Anthropic	Anthropic	76	200K	$75.00
7	o3 Deep ResearchOpenAI	OpenAI	74	200K	$40.00
8	Claude Opus 4.6Anthropic	Anthropic	71	1M	$25.00
9	Claude Opus 4.5Anthropic	Anthropic	70	200K	$25.00
10	Claude Sonnet 4.5Anthropic	Anthropic	69	1M	$15.00
11	Qwen3 VL 30B A3B ThinkingAlibaba	Alibaba	69	131K	Free
12	Qwen3 VL 235B A22B ThinkingAlibaba	Alibaba	69	131K	Free
13	GPT-5.2OpenAI	OpenAI	68	400K	$14.00
14	Gemini 3.1 Pro Preview Custom ToolsGoogle	Google	68	1.0M	$12.00
15	Gemini 3.1 Pro PreviewGoogle	Google	68	1.0M	$12.00
16	Gemini 3 Pro PreviewGoogle	Google	68	1.0M	$12.00
17	Claude Sonnet 4.6Anthropic	Anthropic	68	1M	$15.00
18	GPT-5.1OpenAI	OpenAI	67	400K	$10.00
19	GPT-5.3-CodexOpenAI	OpenAI	67	400K	$14.00
20	GPT-5.2-CodexOpenAI	OpenAI	67	400K	$14.00
21	GPT-5OpenAI	OpenAI	67	400K	$10.00
22	Gemini 3 Flash PreviewGoogle	Google	66	1.0M	$3.00
23	o4 Mini Deep ResearchOpenAI	OpenAI	66	200K	$8.00
24	GPT-5.1-Codex-MaxOpenAI	OpenAI	66	400K	$10.00
25	Gemini 3.1 Flash Lite PreviewGoogle	Google	66	1.0M	$1.50
26	Gemini 2.5 ProGoogle	Google	66	1.0M	$10.00
27	Gemini 2.5 Flash Lite Preview 09-2025Google	Google	65	1.0M	$0.40
28	GPT-5 MiniOpenAI	OpenAI	65	400K	$2.00
29	Gemini 2.5 Pro Preview 05-06Google	Google	64	1.0M	$10.00
30	GPT-5 NanoOpenAI	OpenAI	64	400K	$0.40
31	Nemotron Nano 12B 2 VL (free)NVIDIA	NVIDIA	64	128K	Free
32	Gemini 2.5 Flash LiteGoogle	Google	64	1.0M	$0.40
33	Grok 4.1 FastxAI	xAI	64	2M	$0.50
34	Grok 4 FastxAI	xAI	64	2M	$0.50
35	Gemini 2.5 FlashGoogle	Google	64	1.0M	$2.50
36	Gemini 2.5 Pro Preview 06-05Google	Google	64	1.0M	$10.00
37	Claude Haiku 4.5Anthropic	Anthropic	63	200K	$5.00
38	Claude Sonnet 4Anthropic	Anthropic	63	1M	$15.00
39	Qwen3.5 Plus 2026-02-15Alibaba	Alibaba	62	1M	$1.56
40	GPT-5.1-CodexOpenAI	OpenAI	62	400K	$10.00
41	GPT-5 CodexOpenAI	OpenAI	62	400K	$10.00
42	o3OpenAI	OpenAI	62	200K	$8.00
43	Qwen3.5-FlashAlibaba	Alibaba	62	1M	$0.40
44	o4 Mini HighOpenAI	OpenAI	61	200K	$4.40
45	o4 MiniOpenAI	OpenAI	61	200K	$4.40
46	Seed-2.0-MiniByteDance	ByteDance	61	262K	$0.40
47	Qwen3.5-122B-A10BAlibaba	Alibaba	61	262K	$2.08
48	Qwen3.5 397B A17BAlibaba	Alibaba	61	262K	$2.34
49	Qwen3.5-35B-A3BAlibaba	Alibaba	61	262K	$1.30
50	Qwen3.5-27BAlibaba	Alibaba	61	262K	$1.56

How AI Reasoning Works

Chain-of-Thought

Reasoning models "think out loud" before answering, breaking complex problems into smaller steps. This dramatically improves accuracy on math, logic puzzles, and multi-step coding tasks compared to standard models.

Speed vs Accuracy Trade-off

Reasoning takes extra tokens and time. These models are slower than standard models but significantly more accurate on hard problems. Use them when correctness matters more than latency.

When to Use Reasoning Models

Complex math and science problems, multi-step coding tasks, logical deduction, planning and strategy, and any task where standard models produce incorrect answers.

Notable Models

OpenAI's o1 and o3 series pioneered chain-of-thought reasoning. DeepSeek R1 demonstrated open-source reasoning. Many providers now offer reasoning-capable models at various price points.

Function Calling Models Vision Models Best for Coding Compare Models Full Leaderboard

Model

Score

GPT-5.2 ProOpenAI

GPT-5 ProOpenAI

o3 ProOpenAI

Claude Opus 4.1Anthropic

o1-proOpenAI

Claude Opus 4Anthropic

o3 Deep ResearchOpenAI

Claude Opus 4.6Anthropic

Claude Opus 4.5Anthropic

Claude Sonnet 4.5Anthropic

Qwen3 VL 30B A3B ThinkingAlibaba

Qwen3 VL 235B A22B ThinkingAlibaba

GPT-5.2OpenAI

Gemini 3.1 Pro Preview Custom ToolsGoogle

Gemini 3.1 Pro PreviewGoogle

Gemini 3 Pro PreviewGoogle

Claude Sonnet 4.6Anthropic

GPT-5.1OpenAI

GPT-5.3-CodexOpenAI

GPT-5.2-CodexOpenAI

GPT-5OpenAI

Gemini 3 Flash PreviewGoogle

o4 Mini Deep ResearchOpenAI

GPT-5.1-Codex-MaxOpenAI

Gemini 3.1 Flash Lite PreviewGoogle

Gemini 2.5 ProGoogle

Gemini 2.5 Flash Lite Preview 09-2025Google

GPT-5 MiniOpenAI

Gemini 2.5 Pro Preview 05-06Google

GPT-5 NanoOpenAI

Nemotron Nano 12B 2 VL (free)NVIDIA

Gemini 2.5 Flash LiteGoogle

Grok 4.1 FastxAI

Grok 4 FastxAI

Gemini 2.5 FlashGoogle

Gemini 2.5 Pro Preview 06-05Google

Claude Haiku 4.5Anthropic

Claude Sonnet 4Anthropic

Qwen3.5 Plus 2026-02-15Alibaba

GPT-5.1-CodexOpenAI

GPT-5 CodexOpenAI

o3OpenAI

Qwen3.5-FlashAlibaba

o4 Mini HighOpenAI

o4 MiniOpenAI

Seed-2.0-MiniByteDance

Qwen3.5-122B-A10BAlibaba

Qwen3.5 397B A17BAlibaba

Qwen3.5-35B-A3BAlibaba

Qwen3.5-27BAlibaba

How AI Reasoning Works

Chain-of-Thought

Speed vs Accuracy Trade-off

Reasoning takes extra tokens and time. These models are slower than standard models but significantly more accurate on hard problems. Use them when correctness matters more than latency.

When to Use Reasoning Models

Complex math and science problems, multi-step coding tasks, logical deduction, planning and strategy, and any task where standard models produce incorrect answers.

Notable Models

OpenAI's o1 and o3 series pioneered chain-of-thought reasoning. DeepSeek R1 demonstrated open-source reasoning. Many providers now offer reasoning-capable models at various price points.

AI Models with Reasoning

All Reasoning Models — Ranked by Score

How AI Reasoning Works

Chain-of-Thought

Speed vs Accuracy Trade-off

When to Use Reasoning Models

Notable Models

Related Pages

AI Models with Reasoning

All Reasoning Models — Ranked by Score

How AI Reasoning Works

Chain-of-Thought

Speed vs Accuracy Trade-off

When to Use Reasoning Models

Notable Models

Related Pages