蚂蚁数科开放数据智能体技术,帮企业轻松做数据分析!

在第二届 CCF 中国数据大会上,蚂蚁数科宣布开源其前沿的数据智能体技术 —— Agentar SQL。借助这项技术,普通用户也能用日常语言完成复杂的商业数据查询和分析,为企业数字化转型提供有力支撑。

本次开源的首个成果是实时文本转结构化查询语言(Text-to-SQL)框架,帮助开发者快速搭建数据查询方案,大幅提升文本与数据库的交互效率。接下来,蚂蚁数科还将陆续推出数据库理解、行业知识挖掘以及实时多轮交互等能力,全面增强数据处理水平。

在某家头部城市商业银行的试运营中,Agentar SQL 的多项工具取得了超过 92% 的查询准确率,效果较传统方案提升三倍以上。更值得一提的是,蚂蚁数科的智能体技术在全球权威的自然语言转 SQL 基准测试 BIRD-SQL 中名列前茅,超越 Google 等国际厂商,成为行业领先者。

image.png

BIRD-SQL 的评测难度很高,数据集覆盖金融、电力、医疗等 37 个真实场景,任务复杂、数据量大,被认为是全球最具挑战性的 NL2SQL 测试之一。研究机构预计,到 2025 年全球商业智能市场规模将达 474.8 亿美元,中国市场也将加速增长,预计到 2028 年达到 17.9 亿美元,年复合增长率为 12.7%。

蚂蚁数科技术负责人章鹏在会上表示,NL2SQL 在落地时会遇到多重难题,例如口语表达的模糊理解、行业知识融合、复杂库表解析,以及生成准确 SQL 等。因此,仅靠简单模型远远不够。

章鹏强调,要实现可用、可落地的 NL2SQL 和数据智能体,必须建立完整的能力体系,包括对数据库的深入理解、智能体与用户的高效交互,以及可自我进化的能力。蚂蚁数科计划持续开源更完整的能力模块,推动智能数据分析普及。

Agentar-Scale-SQL 的开源内容已在 arXiv、GitHub 等平台发布,正受到开发者的广泛关注。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享