4月7日,微软必应(Bing)团队发布并开源全新嵌入模型家族“Harrier”,目标是重构全球搜索、检索与AI代理的基础能力。该系列提供三种规模,其中旗舰版27B在多语言MTEB v2基准中超越OpenAI、亚马逊与Google Gemini等主流闭源模型,强势登顶。

这套模型的技术底座展现出极高的工程水准:Harrier覆盖100多种语言,支持最长32,000个词元的上下文窗口。在训练上,微软不仅采用了超过20亿条真实样本,还引入来自GPT-5的合成数据进行增强。这样的高质量数据组合,使Harrier在复杂语境理解与长文本处理上表现尤为突出。除270亿参数的完整版外,为适配不同算力条件,微软同步提供0.6B与2.7B两款小参数模型,并全部以MIT许可证在Hugging Face开放。
作为AI系统进行信息组织与检索的关键技术,嵌入模型的能力直接影响RAG(检索增强生成)系统的准确度。微软计划将这一能力深度融入Bing搜索与新型AI代理的相关服务。随着AI逐步迈向多步骤任务的自主化,Harrier的开源不仅为开发者带来可替代闭源模型的高性能选择,也意味着开源生态在语义表示层面已对顶尖私有方案实现阶段性超越,进一步加速AI代理在全球多语言场景中的落地。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?