蚂蚁数科开源数据智能体,帮企业轻松做数据分析!

在第二届 CCF 中国数据大会上,蚂蚁数科宣布开源其前沿的数据智能体技术——Agentar SQL。借助这套能力,普通人也能用日常话语完成复杂的商业数据查询与分析,为企业数字化转型提供有力支撑。

此次首批开源的是一个实时文本转结构化查询语言(Text-to-SQL)框架,面向开发者,能帮助快速搭建数据查询方案,显著提升文本与数据库的交互效率。后续还将陆续推出涵盖数据库理解、行业知识挖掘与实时多轮交互等能力,全面增强数据处理水平。

在某家领先的城市商业银行试运行期间,Agentar SQL 的多个工具查询准确率超过 92%,相较传统方案提升三倍以上。更值得关注的是,这项智能体技术在全球权威的自然语言转 SQL 评测基准 BIRD-SQL 中表现优异,超越 Google 等国际厂商,成为行业领跑者。

image.png

BIRD-SQL 的测试难度很高,数据集覆盖金融、电力、医疗等 37 个真实场景,任务复杂、数据量大,被视为全球最具挑战的 NL2SQL 测试之一。研究机构预计,到 2025 年全球商业智能市场规模将达 474.8 亿美元;中国市场也将迅速扩大,预计到 2028 年达到 17.9 亿美元,年复合增长率为 12.7%。

蚂蚁数科技术负责人章鹏表示,NL2SQL 在实际落地中需要解决口语表达的模糊性、融合行业专业知识、解析复杂数据库结构,以及生成准确 SQL 等多重难题,因此仅靠简单模型远远不够。

他强调,要让 NL2SQL 和数据智能体真正做到产业可用,必须构建完整的能力体系,其中包括对数据库的深入理解、智能体与用户的高效交互,以及持续自我进化的能力。未来,蚂蚁数科将持续开源更完善的能力模块,推动智能数据分析走向普及。

Agentar-Scale-SQL 的开源内容已在 arXiv、GitHub 等平台发布,正受到开发者的广泛关注。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享