靠大模型看病行不行?专家表示还早着呢。《自然-医学》这篇文章就说,这大语言模型,也就是咱们说的LLM,还真没法给咱们当医用药指南。以前呢,大家以为医院可以把LLM当作工具,让人看病前先让它给个初步诊断。可实际测试下来呢,表现真不咋地。要是光在机器上测,这成绩挺好,能正确识别疾病到94.9%,正确推荐治疗方案也能达到56.3%。但一换成真人去用它,情况立马变差了。像那些实际得病的人,识别率就降到了34.5%以下,推荐方案对的情况也才44.2%,这成绩比对照组还不如。
靠大模型看病行不行?专家表示还早着呢。《自然-医学》这篇文章就说,这大语言模型,也就是咱们说的LLM,还真没法给咱们当医用药指南。以前呢,大家以为医院可以把LLM当作工具,让人看病前先让它给个初步诊断。可实际测试下来呢,表现真不咋地。要是光在机器上测,这成绩挺好,能正确识别疾病到94.9%,正确推荐治疗方案也能达到56.3%。但一换成真人去用它,情况立马变差了。像那些实际得病的人,识别率就降到了34.5%以下,推荐方案对的情况也才44.2%,这成绩比对照组还不如。