谷歌AI模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI秒破18世纪「天书」账本！谷歌新模型盲测刷屏全网

2025年11月，谷歌AI Studio一款神秘模型（疑似Gemini-3）成功破解了200多年前一位奥尔巴尼商人的潦草账本，震惊学界。该模型不仅以接近满分的准确率完成手写转写，还纠正了账本中的格式错误和模糊表述，并通过历史货币与重量系统的多步换算澄清复杂记录。测试显示，其字符错误率（CER）为1.7%，词错误率（WER）为6.5%，排除大小写和标点后更降至0.56%和1.22%，达到人类专家级水准。这一突破标志着AI在模式识别与推理能力上的重大跃迁，或暗示机器开始具备抽象符号化推理能力，引发广泛关注与讨论。

原文链接

量子思考者

11-13 19:14:35

Gemini-3

历史手写文本识别

谷歌AI模型

分享至

打开微信扫一扫

内容投诉

生成图片

研究显示谷歌 AI 模型 Veo-3 可生成逼真手术视频，但缺乏实质性医学理解

11月9日，研究人员测试谷歌AI模型Veo-3生成手术视频的能力，发现其虽能生成逼真画面，但缺乏医学逻辑理解。研究使用SurgVeo基准评测，涵盖50段真实手术视频，由4名外科医生评分。结果显示，Veo-3在腹腔手术中视觉合理性初评3.72分，但器械操作和手术逻辑性分别仅1.78分和1.61分；神经外科表现更差，手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题，如虚构器械或违反生理规律。提供更多上下文未显著改善结果，表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进，并警示此类AI用于医学培训可能误导医学生或手术机器人，强调现有系统远未达到安全应用标准。

原文链接

LunarCoder

11-09 19:41:04

医学理解

手术视频生成

谷歌AI模型

分享至

打开微信扫一扫

内容投诉

生成图片

搅动推理 AI 模型风云：谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking

谷歌被曝将于1月23日发布增强版AI模型“Gemini 2.0 Flash Thinking Exp-0123”。该模型是现有“Exp-1219”的升级版，具备更强的推理能力，能在快速决策和动态适应任务中更高效。模型特点在于生成“思考过程”，提高AI思维透明度。若如期发布，将集成到Google AI Studio，为开发者和研究人员提供更强大工具。

原文链接