当AI智能体(Agent)加速迈向复杂、跨多步的任务阶段时,开源社区迎来一位强劲新秀。Jan团队今日正式发布 Jan-v2-VL-Max——一款拥有300亿参数的多模态大模型,专为长周期、高稳定性的自动化执行场景打造;在关键指标上,已跑赢谷歌Gemini 2.5 Pro与DeepSeek R1,为开源Agent生态注入新的动力。

瞄准“误差累积”痛点,解决多步执行“跑偏”
多模态Agent在进行长序列操作(如自动化UI点击、跨应用流程)时,常因某个中间动作轻微偏差导致后续步骤全面脱轨,即典型的“误差累积”问题。Jan-v2-VL-Max针对性引入 LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技术,在延续Qwen3-VL-30B基座能力的同时,显著提升推理链的一致性与抗干扰能力,确保在数十步连续操作后仍能精准到位。
在“幻象递减回报”评测中拔尖,树立Agent新标杆
该模型在全新评测基准 “幻象递减回报”(Hallucination-Decay Return,HDR)上表现亮眼。该基准专门衡量Agent随任务长度增加因幻觉或逻辑断裂导致回报下降的速度。Jan-v2-VL-Max在长序列任务中保持更高的回报稳定性,超越Gemini 2.5 Pro与DeepSeek R1,进一步验证其在真实自动化场景中的可靠与可用。

开箱即用,支持本地高效部署
为降低上手门槛,Jan团队提供:
– 网页端直接交互页面,用户可上传图片并输入指令,快速试跑多步自动化流程;
– 基于vLLM的本地优化部署方案,支持在消费级GPU上高效运行,便于开发者接入自研Agent系统。
开源社区的“长思考”进阶
尽管Jan-v2-VL-Max在长序列执行方面相较基座模型是“小幅拉升”,但在Agent领域,稳定性每提升1%,就可能带来可用性的“质变”。这一成果意味着开源正从“单步回答”走向“长程规划”,为UI自动化、机器人控制、多工具协同等高价值场景提供更扎实的开放基座。
AIbase认为,当大模型竞争从“更聪明”转向“更可靠”,Jan团队此次专注执行稳定性的技术路线,恰逢其时。在Agent即将成为主流交互范式的浪潮下,Jan-v2-VL-Max或将成为开发者打造“长链不断、稳健执行”智能体的关键拼图。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?