Jan团队推出Jan-v2-VL-Max！30B多模态模型聚焦长周期Agent任务，长序列执行稳定度领先Gemini 2.5 Pro-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

当AI智能体（Agent）加速迈向复杂、跨多步的任务阶段时，开源社区迎来一位强劲新秀。Jan团队今日正式发布 Jan-v2-VL-Max——一款拥有300亿参数的多模态大模型，专为长周期、高稳定性的自动化执行场景打造；在关键指标上，已跑赢谷歌Gemini 2.5 Pro与DeepSeek R1，为开源Agent生态注入新的动力。

瞄准“误差累积”痛点，解决多步执行“跑偏”

多模态Agent在进行长序列操作（如自动化UI点击、跨应用流程）时，常因某个中间动作轻微偏差导致后续步骤全面脱轨，即典型的“误差累积”问题。Jan-v2-VL-Max针对性引入 LoRA-based RLVR（Reinforced Long-horizon Vision-Language Reasoning）技术，在延续Qwen3-VL-30B基座能力的同时，显著提升推理链的一致性与抗干扰能力，确保在数十步连续操作后仍能精准到位。

在“幻象递减回报”评测中拔尖，树立Agent新标杆

该模型在全新评测基准 “幻象递减回报”（Hallucination-Decay Return，HDR）上表现亮眼。该基准专门衡量Agent随任务长度增加因幻觉或逻辑断裂导致回报下降的速度。Jan-v2-VL-Max在长序列任务中保持更高的回报稳定性，超越Gemini 2.5 Pro与DeepSeek R1，进一步验证其在真实自动化场景中的可靠与可用。

开箱即用，支持本地高效部署

为降低上手门槛，Jan团队提供：

– 网页端直接交互页面，用户可上传图片并输入指令，快速试跑多步自动化流程；

– 基于vLLM的本地优化部署方案，支持在消费级GPU上高效运行，便于开发者接入自研Agent系统。

开源社区的“长思考”进阶

尽管Jan-v2-VL-Max在长序列执行方面相较基座模型是“小幅拉升”，但在Agent领域，稳定性每提升1%，就可能带来可用性的“质变”。这一成果意味着开源正从“单步回答”走向“长程规划”，为UI自动化、机器人控制、多工具协同等高价值场景提供更扎实的开放基座。

AIbase认为，当大模型竞争从“更聪明”转向“更可靠”，Jan团队此次专注执行稳定性的技术路线，恰逢其时。在Agent即将成为主流交互范式的浪潮下，Jan-v2-VL-Max或将成为开发者打造“长链不断、稳健执行”智能体的关键拼图。