综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年11月,谷歌AI Studio一款神秘模型(疑似Gemini-3)成功破解了200多年前一位奥尔巴尼商人的潦草账本,震惊学界。该模型不仅以接近满分的准确率完成手写转写,还纠正了账本中的格式错误和模糊表述,并通过历史货币与重量系统的多步换算澄清复杂记录。测试显示,其字符错误率(CER)为1.7%,词错误率(WER)为6.5%,排除大小写和标点后更降至0.56%和1.22%,达到人类专家级水准。这一突破标志着AI在模式识别与推理能力上的重大跃迁,或暗示机器开始具备抽象符号化推理能力,引发广泛关注与讨论。
原文链接
11月9日,研究人员测试谷歌AI模型Veo-3生成手术视频的能力,发现其虽能生成逼真画面,但缺乏医学逻辑理解。研究使用SurgVeo基准评测,涵盖50段真实手术视频,由4名外科医生评分。结果显示,Veo-3在腹腔手术中视觉合理性初评3.72分,但器械操作和手术逻辑性分别仅1.78分和1.61分;神经外科表现更差,手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题,如虚构器械或违反生理规律。提供更多上下文未显著改善结果,表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进,并警示此类AI用于医学培训可能误导医学生或手术机器人,强调现有系统远未达到安全应用标准。
原文链接
谷歌被曝将于1月23日发布增强版AI模型“Gemini 2.0 Flash Thinking Exp-0123”。该模型是现有“Exp-1219”的升级版,具备更强的推理能力,能在快速决策和动态适应任务中更高效。模型特点在于生成“思考过程”,提高AI思维透明度。若如期发布,将集成到Google AI Studio,为开发者和研究人员提供更强大工具。
原文链接
加载更多
暂无内容