这事儿还得靠产业界、学术界和管理部门一起商量着办才行

在咱们国家,有一家企业搞出了厉害的东西,拿了国际上的第一名。这是北京百川智能科技有限公司搞出来的新医疗大模型,叫Baichuan-M3。这次他们把这个模型完全公开了,大家都能用。 看这个全球的HealthBench榜单,Baichuan-M3给了65.1分,就是个最高分。特别是那个难搞的HealthBench Hard部分,它拿了44.4分。这个成绩把前面的记录都给打破了,说明咱们国产的大模型已经能把国际上的那些领先模型全给打败了。 关键是,M3这个模型特别靠谱。在大家都担心的“幻觉”问题上——就是有时候模型瞎说八道、生成假信息——它把这个毛病给降到了3.5%。这个数据是现在所有公开的模型里最低的。这是因为研发团队换了种训练方法。他们把医学事实放在最前面教模型,让它自己学好怎么说话,不再是靠后来的工具去检查改错了。 除了不乱说话,M3还有个本事就是会好好跟人对话。你看平时看病的时候,病人也说不清所有的毛病和历史。M3就像一个资深医生一样,能跟你聊好几轮,把零散的信息给串起来。这种跟人互动问诊的能力,比真人医生的平均水平还要强不少。 百川智能的头儿王小川说,语言能力是医疗大模型的关键。多模态什么的虽然也重要,但现在主要还是要让机器能听懂人话和处理复杂的医学知识。未来的重点是怎么帮人们在家里管理健康、防病治病,而不是简单地替医生看病。 现在全球都在推健康助手,咱们国家也在医疗这块突破不少。技术进步不光是分数好看了,更重要的是解决了看病慢、信息不全、安全有风险这些实际问题。百川智能开源这个模型也是咱们企业积极参与技术合作的表现。 以后技术还得继续迭代和扩展应用场景。咱们得想办法让人工智能安全、合规地用起来,真正提升医疗服务的可及性,帮着咱们建设健康中国。这事儿还得靠产业界、学术界和管理部门一起商量着办才行。