微软 Bing 团队开源“Harrier”多语言嵌入模型

微软的 Bing 团队近日宣布将其最新的词嵌入模型“Harrier”开源。该模型在多语言 MTEB v2 基准测试中成绩亮眼,支持 100 多种语言,带来更强的跨语种处理能力。Harrier 训练时使用了超过 20 亿条样本以及来自 GPT-5 的合成数据,并配备 32,000 词元的上下文窗口,使其在多语言任务中更精准、更灵活。

Bing,必应,new Bing,搜索引擎,微软,AI,人工智能,chatGPT

在参数规格上,Harrier 提供一款完整的 27 亿参数版本,同时推出两款更小的模型,分别约为 0.6 亿参数和 2.7 亿参数,便于在低性能硬件上部署与使用。这三款模型均已在 Hugging Face 平台以 MIT 许可发布,方便开发者集成。

嵌入模型是人工智能系统中的关键基础,特别适用于搜索、信息检索和数据组织等任务。随着 AI 不断发展,优质嵌入的需求日益增加,它能帮助 AI 代理更好地独立完成复杂的多步骤流程。微软表示,Harrier 的发布将进一步推动 AI 技术在各行业的应用落地。

后续,微软计划把 Harrier 技术接入 Bing 搜索,并作为新一代 AI 代理的底层服务能力。这将进一步增强 Bing 在 AI 领域的竞争力,满足用户对高效信息处理的需求。

划重点: 

🌍 Harrier 支持 100+ 种语言,具备强劲的多语种处理能力。  

💡 采用 20 亿+ 示例与 GPT-5 合成数据训练,带来更高准确性。  

🚀 微软将把 Harrier 融入 Bing 与新一代 AI 代理服务,全面提升搜索表现。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享