AI for Data Engineering

293 models ranked for data engineering. Scored with bonuses for JSON mode (structured schemas), reasoning (query optimization), function calling (pipeline orchestration), large context, and large output.

293

Total Ranked

226

JSON Mode

128

Reasoning

217

Function Calling

Data Engineering AI — Ranked by DE Score

#	Model	Provider	Score	$/1M Out	Context
1	GPT-5.4 ProOpenAI	OpenAI	91	$180.00	1.1M
2	GPT-5.2 ProOpenAI	OpenAI	90	$168.00	400K
3	GPT-5 ProOpenAI	OpenAI	90	$120.00	400K
4	o3 ProOpenAI	OpenAI	82	$80.00	200K
5	Claude Opus 4.1Anthropic	Anthropic	81	$75.00	200K
6	o3 Deep ResearchOpenAI	OpenAI	74	$40.00	200K
7	o1-proOpenAI	OpenAI	77	$600.00	200K
8	Claude Opus 4.6Anthropic	Anthropic	71	$25.00	1M
9	Claude Opus 4.5Anthropic	Anthropic	70	$25.00	200K
10	GPT-5.4OpenAI	OpenAI	70	$15.00	1.1M
11	Claude Sonnet 4.5Anthropic	Anthropic	69	$15.00	1M
12	Qwen3 VL 30B A3B ThinkingAlibaba	Alibaba	69	Free	131K
13	Qwen3 VL 235B A22B ThinkingAlibaba	Alibaba	69	Free	131K
14	GPT-5.2OpenAI	OpenAI	68	$14.00	400K
15	Gemini 3.1 Pro Preview Custom ToolsGoogle	Google	68	$12.00	1.0M
16	Gemini 3.1 Pro PreviewGoogle	Google	68	$12.00	1.0M
17	Gemini 3 Pro PreviewGoogle	Google	68	$12.00	1.0M
18	Claude Sonnet 4.6Anthropic	Anthropic	68	$15.00	1M
19	Claude Opus 4Anthropic	Anthropic	76	$75.00	200K
20	GPT-5.1OpenAI	OpenAI	67	$10.00	400K
21	GPT-5.3-CodexOpenAI	OpenAI	67	$14.00	400K
22	GPT-5.2-CodexOpenAI	OpenAI	67	$14.00	400K
23	GPT-5OpenAI	OpenAI	67	$10.00	400K
24	Gemini 3 Flash PreviewGoogle	Google	66	$3.00	1.0M
25	o4 Mini Deep ResearchOpenAI	OpenAI	66	$8.00	200K
26	GPT-5.1-Codex-MaxOpenAI	OpenAI	66	$10.00	400K
27	Gemini 3.1 Flash Lite PreviewGoogle	Google	66	$1.50	1.0M
28	Gemini 2.5 ProGoogle	Google	66	$10.00	1.0M
29	Gemini 2.5 Flash Lite Preview 09-2025Google	Google	65	$0.40	1.0M
30	GPT-5 MiniOpenAI	OpenAI	65	$2.00	400K

AI for Data Pipelines & ETL

SQL & Query Generation

Generate complex SQL queries, dbt models, and data transformations. JSON mode ensures structured output for automated pipeline integration.

Schema Design & Migration

Design data warehouse schemas, create migration scripts, and manage evolving data models. Reasoning models optimize for query performance and normalization.

Pipeline Orchestration

Generate Airflow DAGs, Prefect flows, and Dagster assets. Function calling enables integration with orchestration APIs and metadata catalogs.

Data Quality & Testing

Create data quality checks, Great Expectations suites, and validation rules. Large context windows handle full schema documentation for comprehensive testing.

Database Data Analysis Data Visualization JSON Output Automation Full Leaderboard

Model

Score

GPT-5.4 ProOpenAI

GPT-5.2 ProOpenAI

GPT-5 ProOpenAI

o3 ProOpenAI

Claude Opus 4.1Anthropic

o3 Deep ResearchOpenAI

o1-proOpenAI

Claude Opus 4.6Anthropic

Claude Opus 4.5Anthropic

GPT-5.4OpenAI

Claude Sonnet 4.5Anthropic

Qwen3 VL 30B A3B ThinkingAlibaba

Qwen3 VL 235B A22B ThinkingAlibaba

GPT-5.2OpenAI

Gemini 3.1 Pro Preview Custom ToolsGoogle

Gemini 3.1 Pro PreviewGoogle

Gemini 3 Pro PreviewGoogle

Claude Sonnet 4.6Anthropic

Claude Opus 4Anthropic

GPT-5.1OpenAI

GPT-5.3-CodexOpenAI

GPT-5.2-CodexOpenAI

GPT-5OpenAI

Gemini 3 Flash PreviewGoogle

o4 Mini Deep ResearchOpenAI

GPT-5.1-Codex-MaxOpenAI

Gemini 3.1 Flash Lite PreviewGoogle

Gemini 2.5 ProGoogle

Gemini 2.5 Flash Lite Preview 09-2025Google

GPT-5 MiniOpenAI

AI for Data Pipelines & ETL

SQL & Query Generation

Generate complex SQL queries, dbt models, and data transformations. JSON mode ensures structured output for automated pipeline integration.

Schema Design & Migration

Design data warehouse schemas, create migration scripts, and manage evolving data models. Reasoning models optimize for query performance and normalization.

Pipeline Orchestration

Generate Airflow DAGs, Prefect flows, and Dagster assets. Function calling enables integration with orchestration APIs and metadata catalogs.

Data Quality & Testing

Create data quality checks, Great Expectations suites, and validation rules. Large context windows handle full schema documentation for comprehensive testing.

AI for Data Engineering

Data Engineering AI — Ranked by DE Score

AI for Data Pipelines & ETL

SQL & Query Generation

Schema Design & Migration

Pipeline Orchestration

Data Quality & Testing

Related Pages

AI for Data Engineering

Data Engineering AI — Ranked by DE Score

AI for Data Pipelines & ETL

SQL & Query Generation

Schema Design & Migration

Pipeline Orchestration

Data Quality & Testing

Related Pages