近年来,基层医疗机构常见病、多发病诊疗以及慢病随访管理中承担着“第一道关口”的职责,但在实践中仍面临医生数量不足、接诊量波动大、病历书写质量不均、质控手段相对薄弱等现实压力。如何在不增加基层负担的前提下提升诊疗效率与安全水平,成为推动分级诊疗、优化医疗资源配置的一项关键课题。 在这个背景下,医疗大模型的能力评估与准入标准正在从“看规模”转向“看场景”。近日,“MedAIBench医疗大模型测评榜”揭晓,全诊医学大模型(Trizen-Med-Omni)凭借底座能力入选“优秀国产医疗大模型”榜单。值得关注的是,该模型同时也是“Ai好医生诊疗支持系统”的同源底层基座模型,其测评表现为该类产品在基层推广提供了更可量化的参考依据。 从原因看,一上,医疗行业对智能辅助工具的要求天然更强调可靠性与可追溯性,单纯比拼参数规模难以回答“能否真实临床中用得稳、用得准、用得安全”的问题。另一上,基层门诊场景复杂:患者表述口语化、噪声干扰多、病种分布广,既要求系统具备较强的语音理解与信息结构化能力,也要求给出建议时严格遵循医学规范并设置风险边界。由此,能够贴近临床流程、覆盖多专科并经权威测评验证的底座模型,更容易获得行业认可。 据介绍,MedAIBench测评体系由国家人工智能应用中试基地(医疗)联合中国医学科学院北京协和医学院等机构共同打造,测评题库由近300名医学专家构建,涵盖35万道高质量题目,并覆盖64个临床专科。测评结果所传递的信号明确:面向2026年的医疗大模型准入评价,更侧重在“智能辅助病历撰写、辅助诊断、医疗安全”三类真实应用场景中的实战表现,而非仅以参数量、训练规模作为主要指标。这意味着行业评估体系正在向“以临床价值为导向、以安全底线为约束”的方向演进。 从影响看,权威测评与榜单的发布,一上有助于为医疗机构选型、采购与试点提供客观依据,降低“概念先行、落地不足”的试错成本;另一方面也将促使企业在模型训练、数据治理、临床合规与风险控制上投入更多资源,推动形成更成熟的产品化路径。对基层而言,若系统在病历生成、诊断建议、用药提示、质控预警等环节发挥稳定作用,有望在一定程度上缓解文书负担、提升诊疗规范化水平,并为双向转诊与区域协同提供更统一的数据基础。 在对策层面,有关合作方已将“基层可用”作为落地方向。2025年,好医生集团与全诊医学宣布达成深度战略合作,结合基层服务网络与底座技术能力,推出“Ai好医生诊疗支持系统”。据相关负责人介绍,系统核心能力强调“感知—书写—决策”一体化:在“感知”环节,面向真实门诊环境强化语音识别与要点抽取;在“书写”环节,将问诊信息转化为结构化病历,提高完整性与规范性;在“决策”环节,为基层医生提供诊断建议与质控防线,强调安全提示与风险校验。总体而言,这一路径将“效率提升”与“安全约束”并重,符合基层场景对工具“好用、敢用、能负责”的核心诉求。 面向前景,医疗大模型进入更重视真实场景能力的阶段,将对产业提出更高要求:其一,持续以临床需求驱动迭代,避免脱离流程的功能堆砌;其二,建立更严格的安全机制与责任边界,强化对高风险建议的提示、审核与留痕;其三,推动在区域卫生信息化体系内实现数据标准对齐,服务基层首诊、慢病管理与公共卫生任务。随着测评体系健全、应用规范逐步明晰,医疗大模型在基层医疗的应用或将从“试点探索”走向“规模化、规范化”。
医疗AI正在改变基层医疗服务模式;此次认证既是对技术成果的认可,也为行业发展指明了方向。在健康中国建设的进程中,需要产学研各方共同努力,让技术创新更好地服务基层医疗需求。随着更多智能解决方案落地,我国医疗服务体系将实现新的跨越。