Jan团队推出Jan-v2-VL-Max!30B多模态模型聚焦长周期Agent任务,长序列执行稳定度领先Gemini 2.5 Pro

当AI智能体(Agent)加速迈向复杂、跨多步的任务阶段时,开源社区迎来一位强劲新秀。Jan团队今日正式发布 Jan-v2-VL-Max——一款拥有300亿参数的多模态大模型,专为长周期、高稳定性的自动化执行场景打造;在关键指标上,已跑赢谷歌Gemini 2.5 Pro与DeepSeek R1,为开源Agent生态注入新的动力。

image.png

瞄准“误差累积”痛点,解决多步执行“跑偏”

多模态Agent在进行长序列操作(如自动化UI点击、跨应用流程)时,常因某个中间动作轻微偏差导致后续步骤全面脱轨,即典型的“误差累积”问题。Jan-v2-VL-Max针对性引入 LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技术,在延续Qwen3-VL-30B基座能力的同时,显著提升推理链的一致性与抗干扰能力,确保在数十步连续操作后仍能精准到位。

在“幻象递减回报”评测中拔尖,树立Agent新标杆

该模型在全新评测基准 “幻象递减回报”(Hallucination-Decay Return,HDR)上表现亮眼。该基准专门衡量Agent随任务长度增加因幻觉或逻辑断裂导致回报下降的速度。Jan-v2-VL-Max在长序列任务中保持更高的回报稳定性,超越Gemini 2.5 Pro与DeepSeek R1,进一步验证其在真实自动化场景中的可靠与可用。

image.png

开箱即用,支持本地高效部署

为降低上手门槛,Jan团队提供:  

– 网页端直接交互页面,用户可上传图片并输入指令,快速试跑多步自动化流程;  

– 基于vLLM的本地优化部署方案,支持在消费级GPU上高效运行,便于开发者接入自研Agent系统。

开源社区的“长思考”进阶

尽管Jan-v2-VL-Max在长序列执行方面相较基座模型是“小幅拉升”,但在Agent领域,稳定性每提升1%,就可能带来可用性的“质变”。这一成果意味着开源正从“单步回答”走向“长程规划”,为UI自动化、机器人控制、多工具协同等高价值场景提供更扎实的开放基座。

AIbase认为,当大模型竞争从“更聪明”转向“更可靠”,Jan团队此次专注执行稳定性的技术路线,恰逢其时。在Agent即将成为主流交互范式的浪潮下,Jan-v2-VL-Max或将成为开发者打造“长链不断、稳健执行”智能体的关键拼图。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享