综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
北京时间2月5日早上7:30,贾跃亭旗下FF公司在拉斯维加斯举办的美国国家汽车经销商大会活动中,正式发布了首批具身智能(Embodied AI)机器人产品。这一发布标志着FF在人工智能与机器人领域的进一步拓展,引发广泛关注。发布会选址于拉斯维加斯,凸显其国际化布局与技术前沿定位。
原文链接
正文:2025年12月,清华大学TSAIL实验室与生数科技联合开源了TurboDiffusion,一个视频生成加速框架,可在单张RTX 5090显卡上实现最高200倍的生成速度提升。例如,1.3B模型生成5秒480P视频仅需1.9秒,原需184秒;14B模型生成720P视频也只需38秒。该框架通过SageAttention、Sparse-Linear Attention等四项核心技术优化推理性能,同时几乎无损画质。TurboDiffusion大幅降低云端推理成本,推动实时视频编辑、AI短剧制作等创新场景,并适配国产芯片架构。
原文链接
12月25日,清华大学TSAIL实验室与生数科技联合发布开源视频生成加速框架TurboDiffusion。该框架通过SageAttention、SLA及rCM技术,在保持视频质量的同时,将AI视频生成速度提升100至200倍。实测数据显示,单张RTX 5090显卡生成5秒480P视频仅需1.9秒,较原版184秒大幅缩短;720P视频生成时间从1.2小时压缩至38秒。团队提供多种模型权重下载,并针对消费级与工业级硬件优化,支持量化版和非量化版选择。TurboDiffusion性能远超现有加速方案,为AI视频生成带来革命性突破。
原文链接
12月18日,据《科创板日报》报道,微软计划本月与Kimi合作推出新的Agent功能,进一步深化双方在AI领域的合作。此前,微软Azure已接入Kimi k2模型,此次合作将延伸至应用层,旨在通过AI的Agent能力实现Office产品的自动化,以应对本土厂商的激烈竞争。记者向微软及Kimi方面求证,但截至发稿未获回应。这一合作或将提升微软在办公自动化领域的竞争力,同时为用户提供更智能的办公体验。(记者 李明明)
原文链接
2025年11月,Stable Diffusion原班人马创立的黑森林实验室推出开源模型Flux.2,挑战谷歌Nano Banana Pro。Flux.2提供多个版本([pro]、[flex]、[dev]及即将推出的[klein]),在生图质量、精细控制和性价比上表现出色,尤其适合生产力工具需求。实测显示,Flux.2能完成复杂指令如生成渐变花瓶、设计手机广告图等,效果接近Nano Banana Pro但成本更低。尽管在中文支持和部分细节上稍逊一筹,其图像编辑与多参考融合能力获得用户好评。Flux.2还支持4MP高分辨率编辑,修复老照片和增强真实感表现突出。这是继2024年8月发布Flux.1系列后团队的又一力作,在线体验已开放。
原文链接
10月23日,字节跳动Seed团队发布3D生成大模型Seed3D 1.0,可从单张图像生成高质量仿真级3D模型。该模型基于创新的Diffusion Transformer架构,支持精细几何、真实纹理和PBR材质生成,并能无缝导入仿真引擎如Isaac Sim,适用于具身智能训练。Seed3D 1.0在纹理与材质生成性能上超越开源及闭源模型,几何生成能力超过业界更大参数规模模型,综合性能领先。其分步生成策略可从单一物体扩展至完整场景,为世界模拟器提供丰富3D环境支持。项目主页及体验入口已开放。
原文链接
10月2日,微软宣布将人工智能订阅服务整合进Office软件,推出更高价位的Microsoft 365版本以应对OpenAI的ChatGPT竞争。新版本每月收费19.99美元,包含集成聊天机器人、人工智能研究助手及图像生成功能,提升办公效率与创造力。这一更新标志着微软在人工智能领域的进一步布局,意在吸引更多专业用户和企业客户。
原文链接
9月30日,微软宣布推出基于“氛围工作”理念的Office智能体模式(Agent Mode),用户可通过Copilot或Office Agent聊天功能,用简单提示快速制表、生成PPT和起草文档。目前,该功能已支持Excel和Word工作流,PowerPoint支持即将上线;Office Agent已在PowerPoint和Word中可用,Excel版本稍后推出。新功能结合OpenAI和Anthropic模型,旨在简化复杂操作,例如让非专家用户也能高效使用Excel。数据显示,Excel的Agent Mode在基准测试中准确率为57.2%,低于人类的71.3%,但具体统计口径尚不明确。目前,相关功能通过Frontier项目开放,仅限网页版,桌面版即将推出。
原文链接
9月19日,高德宣布TrafficVLM模型重磅升级,通过AI技术为驾驶者提供“天眼”视角,预知超视距路况。新模型依托空间智能架构,帮助用户全面掌握全局交通状况,提前洞察拥堵成因与发展。例如,在前方3公里突发事故时,系统可推理识别拥堵趋势,并推送变道建议。升级版基于通义Qwen-VL底座,结合高德海量交通数据完成训练,实现路况可视化、可感知与可预判,大幅提升导航体验。
原文链接
2025年9月1日,退休经济学教授Gary Smith通过一个简单问题揭示了GPT-5的‘变笨’现象。他提问‘井字棋棋盘旋转90度是否影响游戏’,GPT-5的回答漏洞百出,既有逻辑错误,还出现了拼写和绘图混乱等问题,与其宣传的‘博士级AI’形象大相径庭。OpenAI承认对GPT-5进行了风格调整,使其更亲切友好,但教授认为这导致能力下降。此外,OpenAI正测试新功能‘Thinking effort’,允许用户调节模型思考强度,最高级仅限Pro用户使用。同时,奥特曼透露GPT-6开发加速,将支持个性化聊天机器人,并强调记忆功能的重要性,但隐私加密尚未落实。
原文链接
加载更多
暂无内容