
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月6日,字节发布机器人全能大模型Robix,由李航博士带队研发。Robix采用视觉-语言单模型设计,整合推理、任务规划和自然语言交互功能,解决传统机器人模块间信息代沟问题。其核心基于思维链推理和三阶段训练策略(持续预训练、监督微调、强化学习),支持3D空间理解与复杂任务执行。测试显示,Robix在多项空间理解任务中表现优于GPT-4o、Gemini 2.5 Pro等模型,真实环境评估中平均任务进度达92.5%。李航曾担任华为诺亚方舟实验室主任,现以返聘顾问形式继续参与字节AI项目。相关技术报告与论文已公开。
原文链接
标题:字节Seed推出全新智能体UI-TARS-2,一个模型搞定多平台操作
正文:
字节Seed团队发布了最新智能体UI-TARS-2,能够自主操作手机、电脑和浏览器,完成复杂任务。例如,它仅用35秒就编写了一个重量单位转换函数,并计算出结果为4000克。相比Claude和OpenAI的同类模型...
原文链接
标题:字节Seed发布扩散语言模型,推理速度达2146 tokens/s
字节Seed推出了一款基于扩散模型的代码生成工具——Seed Diffusion Preview。这款模型采用离散状态扩散技术,在推理速度上表现出色,每秒可生成2146个token,比同类模型快数倍,且较同等规模的自回归模...
原文链接
《科创板日报》17日消息,字节跳动旗下豆包大模型团队今日发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型打造的开源多模态智能体。该模型具备在虚拟环境中高效完成多种任务的能力,尤其在7个GUI图形用户界面评测基准中达到了SOTA(最高性能)。此外,UI-TARS-1.5首次展示了其在游戏中的长时推理能力和开放空间中的交互能力,标志着多模态智能体技术的重要进展。
原文链接
加载更多

暂无内容