“阳光清言”亮相:西藏发布首个千亿参数藏语大模型,高原AI进入新阶段

 全球海拔最高的大语言模型迎来首秀。由西藏大学联合本地创业团队发布的“阳光清言”V1.0今日发布,模型规模突破千亿参数,训练语料累计288亿Token,覆盖新闻、法律、医疗、教育、科技等多类场景,首次为藏语AI基础设施补上关键一环。

国务院于8月印发的《“人工智能+”行动意见》被视作西藏AI加速落地的起跑枪。目前,拉萨主城区社区服务中心、贡嘎机场航站楼已率先部署AI客服与实时翻译系统;在进行中的青藏科考中,“e科考”App依托卫星链路完成全息影像采集并实现云端秒级回传,科考队野外数据整理时间压缩至原先的一半。

元宇宙 科幻 赛博朋克 绘画 (1)大模型

图源说明:图片由AI生成,授权来源:Midjourney

被誉为藏语数字化奠基人的西藏大学教授尼玛扎西院士表示,西藏AI正从“场景应用”迈向“系统研发”,而语料库是突破的核心。青年创业者旦增罗布团队历时六年构建7000万条藏汉平行语料库,并搭建覆盖140国的多语种语音数据库,为“阳光清言”以及计划于年底向社会开放的DeepZang模型提供了坚实数据底座。

“模型上线后,政务办理、远程医疗、生态监测等将实现以母语直接交流,藏语的传承不再只依赖纸本文献。”尼玛扎西说。业内普遍认为,千亿参数藏语大模型的发布,为其他低资源语言的智能化提供了可复制的高原样本。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享