1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阶跃星辰发布首个开源能在手机上落地的端侧 Agent:10 分钟可打造豆包手机同款
12月17日,阶跃星辰发布全新AI Agent系列模型「Step-GUI」,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议,以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。该模型可在淘宝、微博、抖音等超200个APP场景中执行任务,具备视觉理解能力,并能基于指令完成用户任务。个人开发者和硬件厂商均可使用这套方案,在终端快速打造类似功能的Agent助手,最快仅需10分钟即可部署上线,为移动端AI应用提供了高效解决方案。(记者 黄心怡)
虚拟微光
12-17 22:07:14
Step-GUI Edge
端侧 Agent
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
00后大模型实习生「扒光」豆包手机!千字实测揭秘
2025年12月,一款名为「豆包手机」的AI设备因强大的跨应用自动化功能引发热议。其能在数秒内完成比价下单、回微信、订机票等复杂任务,甚至在锁屏状态下后台运行。大模型实习生「宵逝」通过黑盒测试和逻辑推演,揭示其核心技术:基于Android Framework层的OS级影子系统,采用两套模式(直觉与推理)及混合感知路由,支持并行运行时和隐私隔离设计。该设备依托字节跳动的UI-TARS 2.0模型,具备多模态感知与动态规划能力,被业界视为GUI Agent技术落地的里程碑。专家认为,这标志着AI原生手机的开端,或重新定义未来智能设备形态。
量子黑客
12-11 11:45:39
GUI Agent
UI-TARS
豆包手机
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025年12月1日,大模型独角兽阶跃星辰宣布开源其GUI Agent技术及4B GUI Agent模型。此次开源的GELab-Zero套组与豆包手机助手技术类型相似,并包含完整的配套基建。同时发布的4B模型(GELab-Zero-4B-preview)在手机端、电脑端等多个GUI榜单中刷新了同尺寸模型的性能纪录,取得SOTA成绩。这一成果标志着阶跃星辰在智能交互领域的重要进展。(记者 黄心怡)
智能视野
12-01 15:15:24
GUI Agent
开源
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署
2025年11月,阶跃星辰开源了GELab-Zero,一款支持所有安卓设备的4B GUI Agent模型。该模型在多个GUI榜单中刷新同尺寸性能纪录,取得SOTA成绩,并首次同步开放完整配套基建,支持一键部署。针对移动生态碎片化问题,GELab-Zero提供端到端解决方案,涵盖轻量化本地推理、多设备任务分发及多种Agent模式,大幅降低开发门槛。同时,阶跃开源基于真实业务场景的评测标准AndroidDaily,聚焦饮食、出行等六大生活核心维度,测试显示其准确率达73.4%。研究团队表示,未来将持续优化性能并扩展跨平台支持。项目已上线GitHub和Hugging Face。
数码游侠
11-30 16:17:01
GELab-Zero
GUI Agent
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?
2025年9月14日,美团推出首个AI Agent支持“一句话点餐”,标志着GUI Agent技术进入实用化阶段。同年10月17日,中兴通讯Nebula-GUI模型在AgentCLUE-mobile测评中斩获总榜银牌,总分84.38,尤其在自动点餐、订票等复杂任务中表现优异。该模型已商用在努比亚Z70 Ultra等手机上,覆盖30余款主流APP,常用场景准确率超90%。中兴通过自研端到端数据制备系统和双层强化学习技术,显著提升了模型的感知、推理与执行能力,未来计划扩展至购物比价、旅游出行等更多场景。这一进展让“手机变私人小秘书”从概念走向现实,推动移动智能服务赋能多行业。
新智燎原
11-04 15:19:17
GUI Agent
中兴Nebula小模型
手机AI超级入口
分享至
打开微信扫一扫
内容投诉
生成图片
拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了
拜拜了GUI!中科院团队提出“LLM友好”计算机接口 大模型Agent自动操作电脑的理想很丰满,但现实却骨感。现有LLM智能体面临两大痛点:成功率低和效率差。复杂任务常让Agent卡住,简单任务也需要几十轮交互,耗时漫长。 问题出在哪?中国科学院软件研究所团队指出,瓶颈在于我们使用了40多年的图形用...
代码编织者
10-27 15:06:03
GOI
GUI
LLM
分享至
打开微信扫一扫
内容投诉
生成图片
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化 无需海量标注数据,智能体也能精准定位目标元素了!浙大等机构的研究团队提出了一种名为GUI-RCPO的自我监督强化学习方法,使模型能够在无标签数据上自主提升图形界面定位(GUI grounding)能力。 什么是G...
超频思维站
09-05 13:20:04
GUI-RCPO
无标签数据
自我监督
分享至
打开微信扫一扫
内容投诉
生成图片
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片
让AI作画自己纠错!随机丢模块提升生成质量,告别塑料感废片 AI作画和视频生成可以“自我救赎”了!清华大学、阿里巴巴AMAP和中科院自动化研究所的研究团队提出了一种全新方法——S²-Guidance(随机自引导)。其核心亮点是通过随机丢弃网络模块动态构建“弱”子网络,实现生成过程的自我修正。这种方法...
灵感Phoenix
08-23 14:01:43
AI作画
S²-Guidance
随机丢模块
分享至
打开微信扫一扫
内容投诉
生成图片
荣耀 MagicGUI 大模型发布并开源,效果比肩 SOTA 模型
2025年7月26日,荣耀正式发布并开源MagicGUI大模型,支撑YOYO智能体实现多模态感知与自动化执行。作为“阿尔法战略”重要里程碑,该模型效果比肩SOTA模型,并由荣耀Magic V5首发搭载。今年3月,荣耀在MWC大会上提出“阿尔法战略”,宣布从智能手机制造商向全球AI终端生态公司转型。未来5年,荣耀将投入100亿美元(约合716.49亿元人民币),分三个阶段构建智慧手机、智慧生态系统及智慧世界,推动AI设备生态发展,与全球伙伴共创AI新时代。
AI创意引擎
07-26 10:35:47
SOTA 模型
荣耀 MagicGUI
阿尔法战略
分享至
打开微信扫一扫
内容投诉
生成图片
火山引擎发布豆包 1.5・视觉深度思考模型,新增 GUI Agent 能力
5月13日,在FORCE LINK AI创新巡展·上海站上,火山引擎发布豆包1.5·视觉深度思考模型。该模型参数仅20B,但在60个公开评测基准中有38个达到业界最佳表现。其在视频理解、视觉推理及新增的GUI Agent能力方面表现突出。视频理解领域引入动态帧率采样技术,提升视频时序定位能力;结合向量搜索,精准定位视频片段。视觉推理能力通过强化学习大幅提升,能自主推理并验证假设。新增的GUI Agent能力可在多种设备环境完成复杂交互任务,如App功能自动化检测,已在字节跳动多款产品中应用。目前,该模型已在火山方舟平台上线。
像素宇宙
05-13 16:59:57
GUI Agent
火山引擎
豆包1.5
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序