谷歌 AI 研究团队近日发布了 DS STAR(通过迭代规划与验证的数据科学代理),这是一个多智能体框架,能把模糊的业务诉求转成可运行的 Python 代码,全程无需人工分析师参与。与以往主要依赖结构化 SQL 数据库的代理不同,DS STAR 可直接处理 CSV、JSON、Markdown 以及非结构化文本等混合格式文件。

DS STAR 的整体流程分为多个阶段。首先,名为 Aanalyzer 的智能体会逐个扫描数据湖中的文件,自动生成 Python 脚本以提取关键信息,如列名、数据类型与元数据等。通过这一步,系统为每个文件建立结构化视图,为后续分析提供充足的上下文。
随后,系统进入迭代的规划与验证环节,涉及 Aplanner、Acoder、Averifier 与 Arouter 等多个智能体。Aplanner 先产出初始的可执行步骤,Acoder 将步骤转为 Python 代码并执行以获得观察结果。Averifier 根据执行反馈评估当前方案是否充分;如需调整,则由 Arouter 决定修正方向与策略。循环会持续进行,直到产出满足要求的结果,或触达最大迭代上限。
为增强鲁棒性,DS STAR 还配备 Adebugger 与 Retriever 模块。Adebugger 用于在脚本失败时自动排障与修复,即使出现模式漂移或缺失列等情况,系统也能继续稳定运行;Retriever 则在大规模数据集中检索最相关的文件,为分析过程补充必要的上下文。
在多项基准测试中,DS STAR 于 DABStep、KramaBench 与 DA Code 等任务上表现亮眼,显著提升了分析准确率。这表明它能将复杂的数据科学问题可靠地落地为 Python 解决方案,进一步推动数据分析的自动化进程。
论文:https://arxiv.org/pdf/2509.21825
划重点:
🌟 DS STAR 是多智能体框架,可把模糊的业务问题转成可运行的 Python 代码。
📊 系统依靠多代理协同,完成分析、代码生成与结果验证的迭代闭环。
🚀 多项基准中准确率显著提升,展现出强劲的自动化能力。

















用户38505528 1个月前0
粘贴不了啊用户12648782 2个月前0
用法杂不对呢?yfarer 2个月前0
草稿id无法下载,是什么问题?