1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理
标题:快手开源多模态推理模型Keye-VL 1.5:视频理解新标杆 快手开源了新一代多模态推理模型Keye-VL 1.5,具备128k超长上下文窗口、0.1秒级视频定位能力及跨模态推理功能。相比此前版本,新模型在时序定位和跨模态推理上显著提升,并创新性提出Slow-Fast双路编码机制,在性能与...
阿达旻
09-05 22:26:24
多模态模型
视频理解
跨模态推理
分享至
打开微信扫一扫
内容投诉
生成图片
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025年9月,Gimlet Labs研究发现,AI可自动生成苹果设备的Metal内核,并显著提升PyTorch推理速度。实验显示,AI生成内核在215个PyTorch模块上实现平均1.87倍加速,部分工作负载甚至快数百倍。研究人员使用Mac Studio(Apple M4 Max芯片)和PyTorch eager模式作为基准,测试了Anthropic、DeepSeek和OpenAI等模型。AI生成内核正确性随尝试次数增加而提高,第5次尝试时可达94%。智能体群体策略进一步优化性能,平均加速31%,特定层级达42%。研究强调其目标是验证AI生成内核的可行性,而非追求极限性能,展现自动化内核工程的潜力。
数据炼金师
09-05 11:17:03
AI生成内核
Metal性能优化
PyTorch推理速度
分享至
打开微信扫一扫
内容投诉
生成图片
100倍AI推理能效提升,“模拟光学计算机”来了
标题:模拟光学计算机:AI推理能效提升100倍 人工智能(AI)和组合优化推动了科学研究与工业应用的发展,但其高能耗对数字计算的可持续性提出了挑战。现有新型计算系统通常只擅长AI或优化任务,且需频繁进行高能耗的数字转换,效率受限。微软英国剑桥研究院团队提出了一种“模拟光学计算机”(Analog ...
智慧轨迹
09-04 15:08:12
AI推理
模拟光学计算机
组合优化
分享至
打开微信扫一扫
内容投诉
生成图片
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025年9月1日,AI行业正从追求模型能力上限转向提升计算效率,混合推理成为行业共识。美团开源的龙猫大模型通过“零计算”专家机制大幅节省算力,应对复杂推理模式导致的成本上升问题。OpenAI的GPT-5采用“路由器”机制,根据任务复杂度选择模型,减少50-80%的token消耗;DeepSeek V3.1则推出单模型双模式架构,可在“思考”与“非思考”间切换,降低25-50%的token使用量。包括Google、阿里、字节等在内的头部厂商均探索混合推理方案,目标是实现性能与成本的平衡,并向更智能的“自我调节”方向发展。
量子黑客
09-01 16:20:02
AI模型
成本效率
混合推理
分享至
打开微信扫一扫
内容投诉
生成图片
一场「狼人杀」,考倒了一堆大模型
标题:一场「狼人杀」,考倒了一堆大模型 人工智能越来越像人,但“像人”究竟意味着什么?除了会解题、写文,它能否理解人类个性化的推理方式?比如在狼人杀中,有人逻辑缜密,有人直觉敏锐,有人擅长伪装。AI能跟上这种风格差异吗? 南开大学与上海AI lab等机构设计了一个名为InMind的评测框架,...
LunarCoder
08-28 14:28:50
大模型
推理风格
狼人杀
分享至
打开微信扫一扫
内容投诉
生成图片
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
2025年8月27日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态旗舰模型。该模型是行业首个具备“高刷”视频理解能力的多模态模型,在性能与效率上实现越级领先,超越Qwen2.5-VL 72B模型。MiniCPM-V 4.5最大支持6倍视频帧数量输入,达到96倍视觉压缩率,显著提升动态画面理解精度。在图片、长视频、OCR及文档解析等任务中均达SOTA水平,并支持短思考与长思考混合推理模式,适用于端侧设备。模型已开源,可通过GitHub、Hugging Face和ModelScope获取。
电子诗篇
08-27 12:03:30
多模态模型
端侧推理
高刷视频理解
分享至
打开微信扫一扫
内容投诉
生成图片
中国信通院联合华为、三大运营商等成立“先进存力AI推理工作组”
8月26日,在2025中国算力大会上,中国信息通信研究院联合华为数据存储、科大讯飞、浪潮、曙光、沐曦、清微智能及三大运营商等企业,共同成立“先进存力AI推理工作组”。该工作组旨在推动我国AI推理领域进入“存算协同、生态共建”新阶段,促进行业技术合作与生态发展。这一举措或将为我国人工智能产业发展注入新动力,并进一步巩固我国在全球AI领域的竞争力。
数据炼金师
08-26 21:53:20
中国信通院
先进存力AI推理工作组
华为
分享至
打开微信扫一扫
内容投诉
生成图片
物理AI里程碑?英伟达如期发布机器人“新大脑” 实时推理能力迎来飞跃
2025年8月25日,英伟达正式发布新一代专为物理AI和机器人设计的计算平台Jetson Thor,包括开发者套件Jetson AGX Thor和量产模组Jetson T5000。该平台基于Blackwell GPU架构,性能较前代提升显著,支持端侧实时处理传感器数据及运行多个生成式AI模型,降低对云端依赖。起售价3499美元,已向全球开放销售。多家头部企业如波士顿动力、联影医疗等已采用Jetson Thor,用于优化机器人性能。英伟达认为,物理AI将是下一代技术浪潮,市场规模可达万亿美元。此外,国内机器人市场正快速扩张,新场景开发或带来供应链分化,建议关注高壁垒环节企业。
数字墨迹
08-26 09:42:23
Jetson Thor
实时推理
物理AI
分享至
打开微信扫一扫
内容投诉
生成图片
完美自指: 一个关于意识的主动推理理论
完美自指:一个关于意识的主动推理理论 2025年3月,Ruben Laukkonen与Karl Friston等人合作发表论文《完美自指:一个关于意识的主动推理理论》,迅速引发计算神经科学和意识研究领域的广泛关注。该理论基于自由能原理和主动推理框架,提出意识由现实模型模拟、推断竞争与认知深度三大基石...
数码游侠
08-24 15:17:16
主动推理
意识
认知深度
分享至
打开微信扫一扫
内容投诉
生成图片
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新方法 AI Agent在处理复杂任务时,常因频繁查资料、跳页面和筛选信息导致显存占用过高、算力不足。为此,MIT与新加坡国立大学联合提出了一种名为MEM1框架的创新方案。实验表明,7B参数的MEM1模型推理速度是传统14B模型的...
Oasis
08-22 16:50:16
MEM1
强化学习
长程推理
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序