阿布扎比 G42发布 NANDA87B:87亿参数的开源印英大模型

阿布扎比的人工智能集团 G42 于周二发布 NANDA87B,这是一款拥有 87 亿参数的开源印英大型语言模型,是早期版本 NANDA 的升级。NANDA87B 已在 MBZUAI 的 Hugging Face 页面以开放权重形式上线,开发者、创作者与企业可自由使用并扩展其能力。

这款模型由穆罕默德・本・扎耶德人工智能大学(MBZUAI)、G42 旗下 Inception 公司与芯片制造商 Cerebras 联合研发。NANDA87B 基于 Llama-3.170B 搭建,训练覆盖超过 650 亿个印地语标记,并采用面向印地语的专用分词器,以提升训练与推理效率。

G42 印度区首席执行官马努・贾因表示:“印度需要能用本国语言交流的世界级技术。NANDA87B 是向这一目标迈出的关键一步。” 他补充称,该模型将支持教育、娱乐与企业等多领域的创新。

G42 指出,NANDA87B 能处理标准印地语、日常口语以及印地夹英(Hinglish),并可执行翻译、摘要、指令跟随与音译等任务。团队强调在设计中纳入安全与文化对齐,力求输出更为负责、合规。

穆罕默德・本・扎耶德人工智能大学基础模型研究所执行董事理查德・莫顿表示,此次发布显著提升了高级语言技术的可获得性。他称:“NANDA 是为全球最大语言社区之一带来高质量、开放获取语言技术的重要里程碑。”

NANDA87B 的训练在 G42 与 Cerebras 共建的 Condor Galaxy 超级计算系统上完成。

划重点:

🌟 NANDA87B 是 G42 推出的 87 亿参数开源印英语言模型,旨在加速印度科技进步。  

💻 模型覆盖标准印地语、口语化表达与 Hinglish,可完成多种语言处理任务。  

🔍 此次发布扩展了对高级语言技术的可及性,推动面向全球最大语言社区之一的技术发展。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享