1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

挤爆字节服务器的Agent到底啥水平?一手实测来了

克雷西 一水 发自 凹非寺
量子位 | 公众号 QbitAI

“字节版Manus”有多能打?量子位实测在此。

我们用一天的对话额度,全面测试了字节最新推出的智能体协作系统“扣子空间”(Coze Space),涵盖信息整理、任务执行、工具调用等多项技能。

结果显示,这款仍在早期测试阶段的智能体表现相当惊艳,尤其在自主任务规划和资料搜集方面。它已具备解决许多真实任务的潜力,但在指令遵循方面仍有改进空间。

扣子空间由字节推出,官方称其为“你和AI Agent协同办公的最佳场所”。由于Demo效果出色,上线初期便因用户过多导致服务器一度被挤爆。

作为首批体验者,我们对其进行了深度测试。扣子空间的智能体分为探索和规划两种模式。探索模式注重效率,规划模式则更强调任务的条理性与细节。

在探索模式下,智能体能够快速整理信息并生成网页或PPT。例如,我们让它整理波音747系列飞机的发展历程,它不仅搜集了相关资料,还生成了包含文字、图表和时间线的网页,内容详尽且美观。

在规划模式下,智能体不仅能整理资料,还能在虚拟环境中模拟操作,如订票、浏览网页等。例如,我们让它预订从北京到上海的高铁票,虽然过程中遇到了一些限制,但其信息识别和规划执行能力已显现出较高水准。

此外,扣子空间支持MCP协议,可接入飞书文档、GitHub、天气、地图等多种应用。我们利用这一功能,结合地图、天气和语音合成插件,成功制作了一份网页版会议指南,包含流程介绍、天气预报和语音播报等功能。

虽然整体耗时较长,尤其是语音合成与网页设计采用串行方式,但对不懂技术的用户来说,这套系统已足够友好。

总结来看,扣子空间的通用智能体在任务规划和资料搜集方面表现出色,但在指令遵循上仍有优化空间。未来,随着技能丰富度的提升,其应用场景将更为广泛。

除了通用智能体,扣子空间还推出了“专家模式”,提供用户研究专家和华泰A股观察助手两个选项。专家Agent在实用性上更胜一筹,尤其在复杂任务中展现出更强的纠错能力。例如,用户研究专家可在短时间内生成完整的用户调研方案,从访谈提纲到问卷设计再到虚拟数据分析,几乎覆盖所有需求。

不过,由于涉及的专业领域较深,任务耗时也相应增加,例如股票分析任务通常需要几十分钟。

值得一提的是,扣子空间还引入了“裂变玩法”,每位用户在完成任务后可获得五个邀请码,邀请码用完后还可获得更多资格,这让体验机会相对容易获取。

总体而言,扣子空间已是一款可用的智能体系统,其通用与专家模式的协作潜力值得期待。

原文链接
本文链接:https://kx.umi6.com/article/17629.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
京东、阿里、美团上演新“三国杀” 谁能挟AI Agent卡位未来电商超级入口?
2025-09-28 13:55:13
AI Agent ,风口上的「猪」?
2025-08-26 10:40:43
大模型之后 智能体站上C位!科技企业争相布局|直击MWC上海
2025-06-20 08:59:01
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
2025-08-13 15:36:41
“京东 AI 购”独立 App 内测,能让智能体帮忙购物、点外卖
2025-12-26 12:37:00
京东:1.4万个智能体上岗“赛跑” 数字人带货成绩超80%真人主播
2025-05-22 17:35:51
对话清华大学张亚勤:智能体是大模型时代的APP
2025-06-23 08:29:04
聚焦企业级AI实战落地,ISC.AI 2025企业级AI应用领航者论坛成功举办!
2025-08-14 19:01:33
GAIR 2025 世界模型论坛:走向真实智能的起点
2025-11-30 16:20:12
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
蚂蚁数科金融大模型技术领先 评测效果超主流开源模型
2025-06-19 16:51:45
阶跃星辰姜大昕:智能体未来将呈现三大发展趋势
2025-09-12 11:13:06
24小时热文
更多
扫一扫体验小程序