全球海拔最高的大语言模型迎来首秀。由西藏大学联合本地创业团队发布的“阳光清言”V1.0今日发布,模型规模突破千亿参数,训练语料累计288亿Token,覆盖新闻、法律、医疗、教育、科技等多类场景,首次为藏语AI基础设施补上关键一环。
国务院于8月印发的《“人工智能+”行动意见》被视作西藏AI加速落地的起跑枪。目前,拉萨主城区社区服务中心、贡嘎机场航站楼已率先部署AI客服与实时翻译系统;在进行中的青藏科考中,“e科考”App依托卫星链路完成全息影像采集并实现云端秒级回传,科考队野外数据整理时间压缩至原先的一半。

图源说明:图片由AI生成,授权来源:Midjourney
被誉为藏语数字化奠基人的西藏大学教授尼玛扎西院士表示,西藏AI正从“场景应用”迈向“系统研发”,而语料库是突破的核心。青年创业者旦增罗布团队历时六年构建7000万条藏汉平行语料库,并搭建覆盖140国的多语种语音数据库,为“阳光清言”以及计划于年底向社会开放的DeepZang模型提供了坚实数据底座。
“模型上线后,政务办理、远程医疗、生态监测等将实现以母语直接交流,藏语的传承不再只依赖纸本文献。”尼玛扎西说。业内普遍认为,千亿参数藏语大模型的发布,为其他低资源语言的智能化提供了可复制的高原样本。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?