AIGate 大模型 API 网关 - 文档与模型定价

qwen3.6-plus

Qwen3.6

2x

Qwen3.6原生视觉语言系列Plus模型，展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果相较3.5系列显著提升。模型在Agentic coding、前端编程、Vibe coding等代码能力、多模态万物识别、OCR、物体定位等能力上显著增强。

1000K 输出 64K

minimax-m2.7-highspeed

MiniMax

1.50x

MiniMax-M2.7-highspeed，官方标称同类产品3倍生成速度，约100TPS极速推理，在编程、工具调用与搜索、办公生产力及其他多个场景下达到或刷新了最新的 SOTA 基准，正式开启了模型递归自我提升（recursive self-improvement）的旅程。

192K 输出 128K

minimax-m2.7

MiniMax

1x

MiniMax-M2.7 在编程、工具调用与搜索、办公生产力及其他多个场景下达到或刷新了最新的 SOTA 基准，正式开启了模型递归自我提升（recursive self-improvement）的旅程。

192K 输出 128K

qwen3.5-plus

Qwen3.5

1x

Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在多项任务评测中，3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。该模型版本功能等同于快照模型qwen3.5-plus-2026-02-15

1000K 输出 64K

glm-5

GLM-5

2x

GLM-5是面向Coding与Agent场景的新一代大模型，在复杂系统工程与长程任务中达到开源 SOTA，真实编程体验逼近 Claude Opus 级别；基于 744B 新基座、异步强化学习与稀疏注意力，实现从“写代码”到“写工程”的全面升级。

198K 输出 16K

deepseek-v3.2

DeepSeek

1x

DeepSeek-V3.2是引入DeepSeek Sparse Attention（一种稀疏注意力机制）的正式版模型，也是DeepSeek推出的首个将思考融入工具使用的模型，同时支持思考模式与非思考模式的工具调用。

128K 输出 64K

minimax-m2.5

MiniMax

1x

MiniMax-M2.5是MiniMax推出的旗舰级开源大模型，经过数十万个真实复杂环境中的大规模强化学习训练，M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或者刷新了行业的 SOTA。

200K 输出 128K

kimi-k2.5

Kimi

2x

kimi-k2.5是月之暗面迄今发布最全能的模型，原生多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务。

256K 输出 16K

doubao-seed-2.0-code

Doubao-Seed-2.0

3x

依托 Seed 2.0 Agent 与 VLM 能力，强化代码能力：前端出众，多语言适配，适合接入各类 AI 编程工具。默认non-thinking，支持开启深度思考。

256K 输出 128K

doubao-seed-2.0-pro

Doubao-Seed-2.0

3x

旗舰级全能通用模型，面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出，可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。

256K 输出 128K

doubao-seed-2.0-lite

Doubao-Seed-2.0

1x

Doubao-Seed-2.0-lite 是面向高频企业场景兼顾性能与成本的均衡型模型，综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作，支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。

256K 输出 128K

doubao-seed-code

Doubao-Seed

2x

面向Agentic编程任务进行了深度优化，在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等多项权威基准测试中表现优异

224K 输出 32K

glm-4.7

GLM

1x

智谱旗舰，具备更强的编程能力与更稳定的多步骤推理/执行能力。总参数355B，支持长程任务规划、编码、工具协同，问答自然、写作沉浸、创意角色扮演能力强。

198K 输出 16K

glm-5.1

GLM-5

3x

GLM-5.1 是智谱最新旗舰模型，代码能力大大增强，长程任务显著提升，能够在单次任务中持续、自主地工作长达 8 小时，完成从规划、执行到迭代优化的完整闭环，交付工程级成果。在综合能力与 Coding 能力上，GLM-5.1 整体表现对齐 Claude Opus 4.6，并在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力，是构建 Autonomous Agent 与长程 Coding Agent 的理想基座。

192K 输出 16K

HTTP	错误类型 (type)	说明
400	`invalid_request_error`	请求参数缺失或格式错误（如未提供 model 参数）
401	`invalid_api_key`	未提供 API Key 或 API Key 无效
402	`insufficient_quota`	额度不足，请联系管理员充值
403	`expired_api_key`	API Key 已过期或被禁用
403	`model_not_found`	当前 API Key 无权使用该模型
429	`rate_limit_exceeded`	请求频率超过限制（RPM），请稍后重试
502	`upstream_error`	上游模型服务异常，请稍后重试或联系技术人员
503	`no_available_channel`	该模型暂无可用渠道，请联系管理员
500	`server_error`	服务器内部错误

AIGate

快速开始

OpenAI 兼容

Anthropic 兼容

调用示例

可用模型列表

常见错误码

Token 套餐