国家数据局明确:Token官方中文名定为“词元”

今天中国政府网转载了《人民日报》引用国家数据局的文章,在官方语境下正式把大模型基础计量单位“Token”命名为“词元”。 报道指出,我国人工智能行业日均词元调用量已突破140万亿次。这一权威命名不仅使学界与业界围绕Token中文译名的长期争议告一段落,也意味着国家层面对大模型技术标准表述进一步走向统一。

QQ20260324-135141.jpg

在此之前,围绕Token的中文命名,业内曾提出多种竞争方案。腾讯研究院学者杨斌提出的“模元”一度引发广泛讨论;随后,由百川智能创始人王小川、潞晨科技创始人尤洋及原清华大学副教授胡翌霖等人力荐的“智元”方案,因强调Token更偏向“通用智能”而非单纯“通用计算”的属性,在社交平台上获得了极高的热度。

不过,最终采纳的“词元”更强调底层技术逻辑。按官方解释,词元是AI理解人类语言的最小单位,切分粒度介于字与词之间,能更精准覆盖大模型处理文本时的语义片段。随着调用量规模迈向140万亿这一历史性门槛,统一术语有助于降低行业沟通成本,为后续AI基础设施的统计量化与政策制定夯实基础。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享