两强合璧!微软发布深研智能体:GPT起草,Claude审稿

正文:

AI 时代的“门户之争”正快速淡化,连巨头 微软 也开始把竞争对手的长处纳入自家能力池,提升产品实力。

3月31日,据多方报道,微软 宣布为 365Copilot 的研究代理带来重大更新。核心变化是:同一项研究任务里,用户可同时调用 OpenAI 的 GPT 与 Anthropic 的 Claude,两个一线大模型“并肩上阵”。

image.png

协作新范式:GPT 主笔,Claude 把关

微软 推出的“Critique(批判)”功能,为深研流程设计了一套更严谨的管线:

分工明确: 先由 OpenAI 的 GPT 产出研究初稿,再交给 Anthropic 的 Claude 依照“学术评审”思路逐条审阅。

质量把控: Claude 重点核查结论是否准确、内容是否完整、引用是否规范,并针对问题逐项修订补全。

双向预演: 官方表示后续将支持反向流程,即由 Claude 先写,GPT 再评。

image.png

“理事会”机制:模型相互评判

除接力式协作外,微软 还上线了同步研究机制“Council(理事会)”:

独立研究: 让 GPT 与 Claude 针对同一主题各自完成研究与报告。

裁判总结: 再由“裁判模型”评估两份成果,提炼共识点,客观标注分歧,并指出各自的独特贡献。

数据背书:1+1 真的大于 2

在衡量深度研究质量的 DRACO 基准上,多模型协作的成品显著优于单模型。微软 365 与 Copilot 副总裁 Nicole Herskowitz 表示,这种方法能有效压制 AI 幻觉,显著增强生产力的可靠性。

行业背景:巨头“合纵连横”加速

尽管 微软 与 OpenAI 关系密切,近期策略却更为灵活:

破除垄断: 协议重组后,微软 获得与 OpenAI 竞争者合作的自由度。

重金布局: 已与英伟达、Anthropic 达成战略合作,并对 Anthropic 投资最高达 50 亿美元。

资本反应: 截至发稿,微软 股价上涨近 2%。尽管仍低于去年高位,但持续引入 AI 能力被视为基本面的重要支撑。

结语:从“单兵作战”到“智能集群”

当 GPT 的创意输出遇上 Claude 的严谨审校,微软 正以“多模型协同”的方式,把 AI 代理的实用性推上新台阶。对用户来说,无需再纠结选哪个模型,因为更强的 AI 助手已在底层打通“跨厂协作”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享