今天,中国政府网转载了《人民日报》引用国家数据局的文章,在官方语境下正式把大模型基础计量单位“Token”命名为“词元”。 报道指出,我国人工智能行业日均词元调用量已突破140万亿次。这一权威命名不仅使学界与业界围绕Token中文译名的长期争议告一段落,也意味着国家层面对大模型技术标准表述进一步走向统一。

在此之前,围绕Token的中文命名,业内曾提出多种竞争方案。腾讯研究院学者杨斌提出的“模元”一度引发广泛讨论;随后,由百川智能创始人王小川、潞晨科技创始人尤洋及原清华大学副教授胡翌霖等人力荐的“智元”方案,因强调Token更偏向“通用智能”而非单纯“通用计算”的属性,在社交平台上获得了极高的热度。
不过,最终采纳的“词元”更强调底层技术逻辑。按官方解释,词元是AI理解人类语言的最小单位,切分粒度介于字与词之间,能更精准覆盖大模型处理文本时的语义片段。随着调用量规模迈向140万亿这一历史性门槛,统一术语有助于降低行业沟通成本,为后续AI基础设施的统计量化与政策制定夯实基础。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?