微软必应开源27B级嵌入模型Harrier,多语种评测夺冠

4月7日,微软必应(Bing)团队发布并开源全新嵌入模型家族“Harrier”,目标是重构全球搜索、检索与AI代理的基础能力。该系列提供三种规模,其中旗舰版27B在多语言MTEB v2基准中超越OpenAI、亚马逊与Google Gemini等主流闭源模型,强势登顶。

QQ20260408-085511.jpg

这套模型的技术底座展现出极高的工程水准:Harrier覆盖100多种语言,支持最长32,000个词元的上下文窗口。在训练上,微软不仅采用了超过20亿条真实样本,还引入来自GPT-5的合成数据进行增强。这样的高质量数据组合,使Harrier在复杂语境理解与长文本处理上表现尤为突出。除270亿参数的完整版外,为适配不同算力条件,微软同步提供0.6B与2.7B两款小参数模型,并全部以MIT许可证在Hugging Face开放。

作为AI系统进行信息组织与检索的关键技术,嵌入模型的能力直接影响RAG(检索增强生成)系统的准确度。微软计划将这一能力深度融入Bing搜索与新型AI代理的相关服务。随着AI逐步迈向多步骤任务的自主化,Harrier的开源不仅为开发者带来可替代闭源模型的高性能选择,也意味着开源生态在语义表示层面已对顶尖私有方案实现阶段性超越,进一步加速AI代理在全球多语言场景中的落地。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享