阿布扎比的人工智能集团 G42 于周二官宣推出 NANDA87B,这是一款参数规模达 87 亿的开源印英大语言模型,是早期版本 NANDA 的升级迭代。NANDA87B 现已在 MBZUAI 的 Hugging Face 页面以开放权重上线,开发者、创作者和企业可自由使用并在此基础上扩展功能。
该模型由穆罕默德・本・扎耶德人工智能大学(MBZUAI)、G42 旗下 Inception 与芯片制造商 Cerebras 联合研发。NANDA87B 基于 Llama-3.170B 构建,采用超过 650 亿个印地语标记进行训练,并配备面向印地语的专用分词器,以提升训练与推理效率。
G42 印度区首席执行官马努・贾因表示:“印度需要能用本国语言交流的世界级技术,NANDA87B 是向这个目标迈出的关键一步。” 他补充称,该模型面向印度 AI 生态的教育、娱乐与企业等多领域创新。
据 G42 介绍,NANDA87B 能处理正式印地语、日常口语以及混合印地语(Hinglish),并支持翻译、摘要、指令跟随与音译等多项任务。公司强调在设计过程中纳入安全性与文化一致性考量,力求输出更为负责。
MBZUAI 基础模型研究所执行董事理查德・莫顿表示,此次发布标志着扩展高级语言技术可获得性的显著进展。他称:“NANDA 为全球最大语言社区之一提供高质量、开放获取的语言技术,是一个重要里程碑。”
NANDA87B 的训练在由 G42 与 Cerebras 共同打造的 Condor Galaxy 超级计算系统上完成。
划重点:
🌟 NANDA87B 是 G42 推出的 87 亿参数开源印英模型,旨在助力印度科技发展。
💻 模型覆盖正式印地语、日常口语与混合印地语,可执行多种语言处理任务。
🔍 此次发布扩展了对高级语言技术的可达性,推动全球最大语言社群的技术进步。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?