模型 ID
系列
倍率
描述
上下文长度
qwen3.6-plus
Qwen3.6
2x
Qwen3.6原生视觉语言系列Plus模型,展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果相较3.5系列显著提升。模型在Agentic coding、前端编程、Vibe coding等代码能力、多模态万物识别、OCR、物体定位等能力上显著增强。
1000K
输出 64K
minimax-m2.7-highspeed
MiniMax
1.50x
MiniMax-M2.7-highspeed,官方标称同类产品3倍生成速度,约100TPS极速推理, 在编程、工具调用与搜索、办公生产力及其他多个场景下达到或刷新了最新的 SOTA 基准,正式开启了模型递归自我提升(recursive self-improvement)的旅程。
192K
输出 128K
minimax-m2.7
MiniMax
1x
MiniMax-M2.7 在编程、工具调用与搜索、办公生产力及其他多个场景下达到或刷新了最新的 SOTA 基准,正式开启了模型递归自我提升(recursive self-improvement)的旅程。
192K
输出 128K
qwen3.5-plus
Qwen3.5
1x
Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。
该模型版本功能等同于快照模型qwen3.5-plus-2026-02-15
1000K
输出 64K
glm-5
GLM-5
2x
GLM-5是面向Coding与Agent场景的新一代大模型,在复杂系统工程与长程任务中达到开源 SOTA,真实编程体验逼近 Claude Opus 级别;基于 744B 新基座、异步强化学习与稀疏注意力,实现从“写代码”到“写工程”的全面升级。
198K
输出 16K
deepseek-v3.2
DeepSeek
1x
DeepSeek-V3.2是引入DeepSeek Sparse Attention(一种稀疏注意力机制)的正式版模型,也是DeepSeek推出的首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。
128K
输出 64K
minimax-m2.5
MiniMax
1x
MiniMax-M2.5是MiniMax推出的旗舰级开源大模型,经过数十万个真实复杂环境中的大规模强化学习训练,M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或者刷新了行业的 SOTA。
200K
输出 128K
kimi-k2.5
Kimi
2x
kimi-k2.5是月之暗面迄今发布最全能的模型,原生多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务。
256K
输出 16K
doubao-seed-2.0-code
Doubao-Seed-2.0
3x
依托 Seed 2.0 Agent 与 VLM 能力,强化代码能力:前端出众,多语言适配,适合接入各类 AI 编程工具。默认non-thinking,支持开启深度思考。
256K
输出 128K
doubao-seed-2.0-pro
Doubao-Seed-2.0
3x
旗舰级全能通用模型,面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出,可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。
256K
输出 128K
doubao-seed-2.0-lite
Doubao-Seed-2.0
1x
Doubao-Seed-2.0-lite 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。
256K
输出 128K
doubao-seed-code
Doubao-Seed
2x
面向Agentic编程任务进行了深度优化,在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等多项权威基准测试中表现优异
224K
输出 32K
glm-4.7
GLM
1x
智谱旗舰,具备更强的编程能力与更稳定的多步骤推理/执行能力。总参数355B,支持长程任务规划、编码、工具协同,问答自然、写作沉浸、创意角色扮演能力强。
198K
输出 16K
glm-5.1
GLM-5
3x
GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果。
在综合能力与 Coding 能力上,GLM-5.1 整体表现对齐 Claude Opus 4.6,并在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力,是构建 Autonomous Agent 与长程 Coding Agent 的理想基座。
192K
输出 16K