藏语大模型“阳光清言”亮相拉萨

11月19日这天,中新社的贡桑拉姆记者在拉萨发回报道,一个千亿参数级的藏语大模型“阳光清言”终于对外亮相了。这个大模型的训练数据可不少,足足用了约288亿个高质量的token。不管是汉藏双语的辞典条目,还是句子级、篇章级的藏语单语资料,“阳光清言”都吃得下。而且涵盖了新闻、法律、医学、教育、文化这些方方面面的内容。 中国工程院院士尼玛扎西教授作为项目领头人,把“阳光清言”藏语大模型V1.0形容成一个千亿级的大家伙。这款大模型不光藏语说得溜,汉语水平也很强劲。西藏大学信息科学技术学院的洛桑嘎登副教授特别强调,作为基座模型,“阳光清言”能在边疆治理、文旅、绿色能源、农牧科研、教育、文化还有藏医药等各个领域大展身手。 接下来,研究团队会赶紧按照国家法规去做备案,等到手续办妥了,“阳光清言”就能正式上线给社会用了。北京智谱华章科技有限公司跟西藏大学尼玛扎西院士团队联手搞的这项研发,既是为了提升咱们西藏智能技术的国际话语权,也是为了给西藏长治久安和高质量发展撑场子。