综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:实测“灵光”:AI助手的潜力远未被完全开发
正文:
今天,一款名为“灵光”的APP在朋友圈刷屏。这是蚂蚁集团推出的一款全模态AI助手,主打零门槛操作,还能用自然语言30秒生成可互动的小应用。这让我不禁联想到即将发布的谷歌Gemini 3.0——一句话生成操作系统。AI生成的边界究竟在哪里?...
原文链接
11月19日,谷歌Gemini 3 Pro模型首秀引发关注。开发者测试显示,该模型仅需一条指令即可生成复杂3D乐高编辑器和完整手机游戏,如经典游戏《Ridiculous Fishing》的复刻版,包含音效与音乐。Gemini 3 Pro在多项基准测试中表现优异,以1501 Elo登顶LMArena排行榜,并在GPQA Diamond等测试中取得超91%的准确率。此外,在MMMU-Pro和Video-MMMU测试中分别获得81%和87.6%的高分,同时SimpleQA Verified测试得分为72.1%,展现其在科学与数学领域的可靠性。不过,与Anthropic的Claude Code相比,Gemini 3 Pro在多步骤指令遵循度上稍显不足。
原文链接
9月30日,蚂蚁集团宣布开源全球首个万亿参数推理大模型Ring-1T-preview。该预览版在多项权威测试中表现出色,在AIME 25测试中得分92.6,接近GPT-5的94.6分;在CodeForces测试中以94.69分超越GPT-5,展现强大代码生成能力。同时,模型在LiveCodeBench和ARC-AGI-v1榜单中位列开源模型首位,并在IMO25数学竞赛中展示出优秀推理能力。据蚂蚁百灵团队介绍,Ring-1T正式版正在训练中,目标是进一步挖掘其自然语言推理潜力。
原文链接
腾讯公司公关总监张军宣布,腾讯混元大模型将于12月3日上线视频生成能力。用户可在腾讯元宝App中提交申请试用,企业客户可通过腾讯云接入服务。目前,API已开放内测申请,腾讯还将开源该视频生成大模型,参数量达130亿。本月,腾讯大模型App元宝发布了2.0版本,新增了AI搜索、AI阅读、创意绘画、灵感图库、AI美照等应用,并整合了微信视频号、QQ音乐等信息资源。此前,腾讯在9月发布了采用MoE架构的新一代大模型腾讯混元Turbo,相比上一代产品,其推理效率提升了100%,推理成本降低了50%。对外,腾讯混元Turbo的价格也比混元Pro降低了50%,输入价格为0.015元/千tokens,输出价格为0.05元/千tokens。
原文链接
DeepSeek AI模型最新版本V2.5于9月5日正式发布,该版本是DeepSeek Coder V2与DeepSeek V2 Chat的整合升级。新模型旨在更精确地满足人类偏好,优化写作任务和指令执行能力。据官方数据显示,新模型在多项性能指标上均实现了显著提升,包括ArenaHard winra...
原文链接
【中兴星云大模型通过广东备案】中兴通讯宣布其自主研发的大模型——中兴星云,已成功通过广东省生成式人工智能服务备案。该模型在需求、设计、编程、测试等30多种场景下,支持多种主流编程语言,为开发者提供了一站式的智能化研发体验。中兴星云代码生成能力媲美GPT-4,且在单元测试准确率和覆盖率上显著优于GPT-4 Turbo,助力编码效率提升30%,整体研发效率提高10%。此外,该模型还具备白名单机制、代码特征值识别、敏感词识别和后台审计等安全功能,旨在有效控制使用范围及保障信息安全。自2023年4月启用以来,中兴通讯通过整合领域数据、知识积累和技术文档,注入超过1000亿token的代码语料,对大模型进行了增量预训练与并行训练。这一创新成果标志着中兴在人工智能领域的又一重要进展。
原文链接
加载更多
暂无内容