上海交大发布光学垂直大模型Optics GPT:以“AI for Science”加速硬科技自主创新

当前,全球人工智能技术发展迅速,但通用大模型在应对光学、材料、芯片等需要深厚专业知识的硬科技领域时,仍存在明显短板。

这些领域涉及复杂的物理原理、精密的工程计算和专业的设计逻辑,通用模型难以准确理解和应用。

正是在这一背景下,上海交通大学"光生未来"项目组经过深入研发,成功推出了Optics GPT光学领域垂直大语言模型,为解决硬科技领域的人工智能应用难题提供了新的思路。

与简单改造通用模型的做法不同,Optics GPT采取了"光学原生"的设计理念。

该模型从光学专业数据中"成长"而来,系统学习了光通信、光学设计、非线性光学等领域的核心知识体系与工程设计逻辑。

这种专业化的训练方式使其能够深度理解光学原理,具备真正的领域认知能力,而非仅停留在表面的信息检索和文本生成层面。

为了科学评估该模型的实际水平,研发团队构建了涵盖光物理、光量子、光学设计、非线性光学、光计算与光通信六大方向的专业评测集。

通过与多款主流通用大模型和开源大模型的系统对比测试,Optics GPT在所有核心维度上均取得领先成绩,充分验证了其在光学垂直领域中的专业深度与工程认知能力。

这一成果表明,垂直领域专业模型的发展方向是可行的,也是必要的。

从技术指标看,Optics GPT规模为8B参数量级,相比超大规模通用模型更加轻量化。

这一设计使其能够支持端侧与边缘高效部署,显著降低了光学行业的应用门槛,让中小企业和科研机构也能便捷获得专业级的人工智能支持。

在算法生成、系统诊断、仿真设计、实验辅助等核心应用场景中,该模型性能全面领先,为光学科研、工程设计和产业应用提供了有力支撑。

值得关注的是,Optics GPT从数据构建、模型训练到部署运行的全流程均实现了自主可控。

这意味着我国在光学等硬科技领域的人工智能应用中,不仅掌握了核心技术,更保障了产业安全与数据隐私。

在当前国际竞争日趋激烈的背景下,这种自主可控的能力对于维护国家科技安全具有重要意义。

该项目是上海交通大学在"人工智能赋能科学"战略下的重要实践。

这一战略方向反映了我国高等教育和科研机构对于人工智能与基础科学融合发展的深刻认识。

通过发展垂直领域的专业模型,可以为光学、材料、能源等硬科技领域的自主研发与智能化升级提供新的基础设施与创新工具,进而推动我国在关键领域的技术突破和产业升级。

上海交通大学此次研发的光学专业模型,不仅解决了通用人工智能在硬科技领域的适配难题,更展现了我国在关键技术自主创新上的决心与能力。

随着此类专业化模型的不断涌现,我国硬科技发展将迎来新一轮智能化浪潮,为全球科技竞争格局注入新的变量。