财联社消息,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 仓库提交合并请求(PR),暗示离发布不远。
据称,Qwen3.5 采用全新的混合注意力机制,且大概率为原生支持视觉理解的 VLM 模型。从开发者挖掘的信息看,预计将开源至少 2B 的密集模型与 35B-A3B 的 MoE 模型。此前还有传闻称,该系列有望在今年春节期间正式开源。

© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?