7月10日,MIT研究揭示用户提问方式显著影响AI医疗建议的可靠性。研究表明,拼写错误、花哨语言或情绪化表达等“扰动因素”使AI建议‘无需就医’的概率上升7%-9%。研究测试了GPT-4、LLaMA-3-70B等多款AI工具,数据来源包括真实案例与模拟场景。女性用户更容易受错误建议影响,但需进一步验证。微软此前将其AI工具Copilot的问题归因于用户提示词能力不足,并推出‘Copilot学院’提升使用技能。然而,研究负责人阿比尼塔・古拉巴蒂娜指出,AI模型在实际医疗场景中仍存在局限性。尽管微软声称其新AI工具准确率是人类医生的4倍,但研究提醒,生成式AI在医疗领域的应用仍需更多验证与审慎评估。
原文链接
本文链接:https://kx.umi6.com/article/21552.html
转载请注明文章出处
相关推荐
换一换
AI给的答案别轻信!22%的医疗建议回答可能致死
2024-10-15 17:18:00
当心 AI 给你“洗脑”,MIT 最新研究显示大模型成功给人类植入错误记忆
2024-09-06 17:17:20
AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断
2025-07-10 20:26:59
AI 模型提早 5 年预警乳腺癌,MIT 研究登 Science 获 LeCun 转发
2024-08-07 15:20:32
研究:AI 医疗建议存巨大安全隐患,22% 的回答可能致死
2024-10-15 17:14:45
苏州“十五五”规划建议:深化投融资体制改革,积极发展股权、债券等直接融资
2026-01-21 20:29:06
百川发布循证增强医疗大模型M3 Plus
2026-01-22 14:59:21
阿里云智能集团资深副总裁李飞飞:内存价格预计还会上涨两到三倍
2026-01-22 19:09:39
AI时代教育被质疑导致“新寒门” 阿里千问回应:不存在!
2026-01-23 11:49:50
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
国家知识产权局:将加快推动《集成电路布图设计保护条例》修改
2026-01-23 11:52:03
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
637 文章
446339 浏览
24小时热文
更多
-
2026-01-23 11:53:08 -
2026-01-23 11:52:03 -
2026-01-23 11:50:59