在第二届 CCF 中国数据大会上,蚂蚁数科宣布开源其前沿的数据智能体技术——Agentar SQL。借助这套能力,普通人也能用日常话语完成复杂的商业数据查询与分析,为企业数字化转型提供有力支撑。
此次首批开源的是一个实时文本转结构化查询语言(Text-to-SQL)框架,面向开发者,能帮助快速搭建数据查询方案,显著提升文本与数据库的交互效率。后续还将陆续推出涵盖数据库理解、行业知识挖掘与实时多轮交互等能力,全面增强数据处理水平。
在某家领先的城市商业银行试运行期间,Agentar SQL 的多个工具查询准确率超过 92%,相较传统方案提升三倍以上。更值得关注的是,这项智能体技术在全球权威的自然语言转 SQL 评测基准 BIRD-SQL 中表现优异,超越 Google 等国际厂商,成为行业领跑者。

BIRD-SQL 的测试难度很高,数据集覆盖金融、电力、医疗等 37 个真实场景,任务复杂、数据量大,被视为全球最具挑战的 NL2SQL 测试之一。研究机构预计,到 2025 年全球商业智能市场规模将达 474.8 亿美元;中国市场也将迅速扩大,预计到 2028 年达到 17.9 亿美元,年复合增长率为 12.7%。
蚂蚁数科技术负责人章鹏表示,NL2SQL 在实际落地中需要解决口语表达的模糊性、融合行业专业知识、解析复杂数据库结构,以及生成准确 SQL 等多重难题,因此仅靠简单模型远远不够。
他强调,要让 NL2SQL 和数据智能体真正做到产业可用,必须构建完整的能力体系,其中包括对数据库的深入理解、智能体与用户的高效交互,以及持续自我进化的能力。未来,蚂蚁数科将持续开源更完善的能力模块,推动智能数据分析走向普及。
Agentar-Scale-SQL 的开源内容已在 arXiv、GitHub 等平台发布,正受到开发者的广泛关注。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?