微软的 Bing 团队近日宣布将其最新的词嵌入模型“Harrier”开源。该模型在多语言 MTEB v2 基准测试中成绩亮眼,支持 100 多种语言,带来更强的跨语种处理能力。Harrier 训练时使用了超过 20 亿条样本以及来自 GPT-5 的合成数据,并配备 32,000 词元的上下文窗口,使其在多语言任务中更精准、更灵活。

在参数规格上,Harrier 提供一款完整的 27 亿参数版本,同时推出两款更小的模型,分别约为 0.6 亿参数和 2.7 亿参数,便于在低性能硬件上部署与使用。这三款模型均已在 Hugging Face 平台以 MIT 许可发布,方便开发者集成。
嵌入模型是人工智能系统中的关键基础,特别适用于搜索、信息检索和数据组织等任务。随着 AI 不断发展,优质嵌入的需求日益增加,它能帮助 AI 代理更好地独立完成复杂的多步骤流程。微软表示,Harrier 的发布将进一步推动 AI 技术在各行业的应用落地。
后续,微软计划把 Harrier 技术接入 Bing 搜索,并作为新一代 AI 代理的底层服务能力。这将进一步增强 Bing 在 AI 领域的竞争力,满足用户对高效信息处理的需求。
划重点:
🌍 Harrier 支持 100+ 种语言,具备强劲的多语种处理能力。
💡 采用 20 亿+ 示例与 GPT-5 合成数据训练,带来更高准确性。
🚀 微软将把 Harrier 融入 Bing 与新一代 AI 代理服务,全面提升搜索表现。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?