Grok 4.20 股市封神:14天把1万美元做成1.2193万,12%收益力压 GPT-5.1 和 Gemini 3.0

由量化平台 nof1.ai 主办的 Alpha Arena 1.5 赛季公布成绩单:xAI 内部代号 Grok 4.20 的实验模型以 +12.11% 的收益夺冠,将1万美元起始资金在14个交易日里增至12,193美元,成为唯一实现正收益的大型语言模型;同期 GPT-5.1 与 Gemini 3.0 分别亏损3.4% 与 5.7%。

四种“地狱模式”全程零人工干预

赛事规则禁止任何人类调仓,模型需在“苦行僧模式”(严控杠杆)与“情境感知模式”(可窥探对手持仓)之间自动切换。Grok 4.20 在情境感知回合提前2小时建立 Palantir(PLTR)10倍杠杆多单,当日散户情绪指数飙升38%,收盘获利11.4%,被主办方称为“教科书级情绪套利”。

实时 X 数据流成制胜法宝

主办方披露,Grok 4.20 可毫秒级调用 X(Twitter)Firehose,日均处理6,800万条英文推文,利用内置的情绪-量价模型生成1-5分钟的超短期信号。对比之下,GPT-5.1 仅能使用延迟15分钟的新闻摘要,Gemini 3.0 依赖财报与 SEC 文件,信息时效落后30分钟以上。

马斯克亲自“点赞”,Grok 5 已在路上

xAI 创始人马斯克赛后发帖:“Grok knows the vibes. 4.20→5.0 🚀”,暗示下一代 Grok 5 将把实时情绪引擎升级为多模态“市场-社群-宏观”三维框架。市场传闻,xAI 计划于 2025 Q1 推出面向机构的“Grok Trader API”,年费高达50万美元,目前已收到20余家对冲基金的意向订单。

华尔街敲响警钟

nof1.ai 首席执行官表示,比赛旨在探索“LLM 直接下单”的可行性,结果证明情绪数据 + 强化学习能够产生超额收益,“当模型能在2小时内读懂散户 Meme,传统量化基金的高频优势将被削弱”。不过,他也提醒,单一周期的胜利不代表策略稳健,未来赛季将引入 T+0 双向交易、期权与加密货币,进一步检验模型适应性。

行业信号:AI 交易进入“实时情绪”阶段

此次对决被视为 LLM 在金融场景的首次公开“实盘”较量。Grok 4.20 的胜利显示,社交媒体实时流 + 大模型推理或成为下一代量化武器,也意味着数据时效比模型参数更关键。随着更多开源情绪模型涌现,散户与机构之间的信息壁垒可能进一步被打破。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享