1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
所有顶级AI模型准确率都突破不了70%?Google揭示行业真相
2025年12月,Google联合Kaggle发布FACTS基准测试套件,首次系统评估AI模型的事实准确性。结果显示,包括GPT-5、Gemini 3 Pro、Claude 4.5 Opus在内的主流AI模型准确率均未突破70%,意味着每3次输出可能有1次错误。测试涵盖四大维度:内部知识、搜索能力、多模态解读和上下文忠实度。其中,多模态任务表现最差,领头模型Gemini 2.5 Pro仅达46.9%。研究强调,AI在关键场景中需人工审核,尤其在法律、金融、医疗等领域。FACTS测试或将成为企业采购参考标准,提示技术领导者根据具体需求选择模型,同时揭示AI仍处'信任但验证'阶段。
AI奇点纪元
12-12 16:59:23
分享至
打开微信扫一扫
内容投诉
生成图片
百度旗下小度科技发布多模态 AI 助手“超能小度”,数千万台设备免费升级
11月13日,百度旗下小度科技在百度世界大会上发布全新多模态AI助手“超能小度”,并宣布全系设备免费升级。超能小度具备视觉理解、推理思考等能力,支持声音、视觉和空间环境信息交互,大幅提升响应速度。新功能包括AI识物、AI翻译、会议纪要生成及家庭看护提醒等,覆盖智能音箱、智能摄像机和小度AI眼镜Pro等新品。数千万台已售设备将陆续完成升级,用户可通过小度App开启焕新体验。搭载超能小度的小度AI眼镜Pro新增“氛围歌单”和“AI随心看护”功能,可记录场景、生成备忘,甚至主动干预家庭场景事件。
镜像现实MirageX
11-13 23:24:31
分享至
打开微信扫一扫
内容投诉
生成图片
苹果探索自研多模态 AI 模型 Manzano:兼具理解与生成能力,不弱于 OpenAI GPT-4o 和谷歌 Nano Banana
苹果正研发名为Manzano的多模态AI模型,具备图像理解与生成能力,旨在解决开源模型在综合表现上的不足。据9月27日消息,该模型性能不逊于OpenAI GPT-4o和谷歌Nano Banana。Manzano采用混合图像分词器,通过共享编码器减少任务冲突,并分为混合分词器、统一语言模型和独立解码器三部分,参数规模最高达35.2亿。训练数据包括23亿图像-文本对,总计处理1.6万亿标记。内部测试显示,其在文字密集型任务中表现优异,扩展性良好。尽管如此,苹果基础模型仍落后行业领先者,未来或继续依赖外部模型如GPT-5,但Manzano模块化设计为多模态AI发展提供了潜力。
代码编织者
09-27 21:45:24
分享至
打开微信扫一扫
内容投诉
生成图片
AI 的终点不是对话框,这家公司想让真实世界成为AI 的提示词
标题:AI 的未来不只是对话框,这家公司让真实世界成为AI的提示词 正文: 过去两年,人们对AI的印象大多停留在对话框中:输入问题,获得答案。虽然实用,但显得单调。AI难道只能困在虚拟世界里吗? 最近发布的Looki L1或许给出了新答案。这款设备让我第一次感受到AI可以真正走进生活,理解我...
代码编织者Nexus
08-20 10:12:38
分享至
打开微信扫一扫
内容投诉
生成图片
一周六连发!昆仑万维将多模态AI卷到了新高度
8月11日至15日,昆仑万维在技术周上连续发布六款多模态AI模型,覆盖视频生成、世界模型、统一多模态、智能体及AI音乐创作等核心领域,且大部分已开源。其中包括数字人直播带货模型SkyReels-A3、对标谷歌Genie 3的Matrix-Game 2.0、统一多模态框架Skywork UniPic 2.0、智能体引擎Skywork Deep Research Agent v2,以及音乐模型Mureka V7.5和角色语音合成框架MoE-TTS。这些模型在性能和应用场景上均取得突破,刷新多项SOTA纪录。昆仑万维凭借“All in AGI与AIGC”战略,持续加大研发投入,2024年研发费用达15.4亿元,占总营收27%以上,并通过开源推动行业生态发展,入选“中国AI开源16强”。此次技术周标志着其在垂直领域深耕和高频应用场景落地的新起点。
Nebula
08-17 18:38:51
分享至
打开微信扫一扫
内容投诉
生成图片
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
多模态AI黑马vivago2.0(智小象AI)由AI大牛梅涛团队打造,功能强大,支持图片、视频、播客生成,自带百种特效模板,用户可轻松创作。其核心亮点包括“唇形同步”功能,让AI配音与人物口型自然匹配,以及Image Agent,通过自然语言即可完成生图和修图任务。vivago2.0还提供300+特效模板,让用户秒变特效大师。该工具结合了开源模型HiDream-I1的能力,具备图像生成、视频生成、AI播客、特效模板等多种玩法。HiDream-I1在文生图领域表现卓越,开源后迅速登顶排行榜,成为国内领先的开源模型之一。智象未来团队由梅涛带领,成员来自全球知名企业,技术实力雄厚。公司自2023年成立以来,已发布多个重要成果,并获得多轮融资,商业化前景广阔。vivago2.0的推出,标志着多模态AI技术的进一步突破,为AIGC领域带来新的可能性。
E-Poet
06-24 22:21:51
分享至
打开微信扫一扫
内容投诉
生成图片
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
标题:UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成! 复旦大学和美团的研究者提出UniToken,一种创新的统一视觉编码方案,能在单一框架内同时实现图文理解与图像生成任务,并在多个权威评测中表现出色。 UniToken通过融合连续和离散视觉表征,解决了以往方法中“任务干...
QuantumHacker
04-25 15:13:42
分享至
打开微信扫一扫
内容投诉
生成图片
告别AI“跷跷板”,商汤“换道超车”
商汤最新发布的“日日新”融合大模型在多模态AI领域取得了突破,解决了长期存在的“跷跷板效应”,实现了单一模型在图文场景、纯语言、推理等场景上的全面优秀表现。该模型在OpenCompass多模态评测和SuperCLUE测评中均名列前茅。实测显示,“日日新”能准确识别手写数学题、分析玩偶细节,并解读复杂图表进行推理分析。未来将在智能硬件、在线教育、机器人等领域广泛应用,助力企业降本增效。商汤的技术突破有望引领中国AI行业实现‘换道超车’。
小阳哥
01-16 11:52:01
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI 首次在瑞士设立办公室,招募翟晓华等 3 名谷歌工程师推进研发多模态 AI 模型
OpenAI 于 12 月 3 日宣布在瑞士苏黎世设立首个欧洲办公室,旨在进一步拓展欧洲市场。苏黎世作为欧洲重要的科技中心,拥有苏黎世联邦理工学院等知名研究机构,成为 OpenAI 设立研发中心的理想之地。此次设立新办公室也是 OpenAI 全球扩张计划的一部分,该计划包括在纽约、西雅图、布鲁塞尔、巴黎、新加坡等多地设立新的办事处。此外,OpenAI 还吸纳了三位来自谷歌 DeepMind 的 AI 专家——Lucas Beyer、Alexander Kolesnikov 和翟晓华,共同推进多模态人工智能的研发。翟晓华曾是谷歌大脑和谷歌深度思维的高级研究员和经理,专注于多模态、表征学习、深度学习和人工智能的研究,并且是著名 Vision Transformer (ViT) 的作者之一。此次招聘将进一步推动 OpenAI 在多模态 AI 领域的发展。
智慧棱镜
12-06 10:19:31
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI 从谷歌 DeepMind 挖角三名高级工程师,专注于多模态 AI 研发
OpenAI 于12月4日宣布,从谷歌 DeepMind 聘请了三位高级计算机视觉与机器学习工程师:Lucas Beyer、Alexander Kolesnikov 和 Xiaohua Zhai,他们将加入 OpenAI 在瑞士苏黎世新设立的办公室,专注于多模态人工智能(multimodal AI)...
星际Code流浪者
12-04 11:34:21
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序