挤爆字节服务器的Agent到底啥水平?一手实测来了
克雷西 一水 发自 凹非寺
量子位 | 公众号 QbitAI
“字节版Manus”有多能打?量子位实测在此。
我们用一天的对话额度,全面测试了字节最新推出的智能体协作系统“扣子空间”(Coze Space),涵盖信息整理、任务执行、工具调用等多项技能。
结果显示,这款仍在早期测试阶段的智能体表现相当惊艳,尤其在自主任务规划和资料搜集方面。它已具备解决许多真实任务的潜力,但在指令遵循方面仍有改进空间。
扣子空间由字节推出,官方称其为“你和AI Agent协同办公的最佳场所”。由于Demo效果出色,上线初期便因用户过多导致服务器一度被挤爆。
作为首批体验者,我们对其进行了深度测试。扣子空间的智能体分为探索和规划两种模式。探索模式注重效率,规划模式则更强调任务的条理性与细节。
在探索模式下,智能体能够快速整理信息并生成网页或PPT。例如,我们让它整理波音747系列飞机的发展历程,它不仅搜集了相关资料,还生成了包含文字、图表和时间线的网页,内容详尽且美观。
在规划模式下,智能体不仅能整理资料,还能在虚拟环境中模拟操作,如订票、浏览网页等。例如,我们让它预订从北京到上海的高铁票,虽然过程中遇到了一些限制,但其信息识别和规划执行能力已显现出较高水准。
此外,扣子空间支持MCP协议,可接入飞书文档、GitHub、天气、地图等多种应用。我们利用这一功能,结合地图、天气和语音合成插件,成功制作了一份网页版会议指南,包含流程介绍、天气预报和语音播报等功能。
虽然整体耗时较长,尤其是语音合成与网页设计采用串行方式,但对不懂技术的用户来说,这套系统已足够友好。
总结来看,扣子空间的通用智能体在任务规划和资料搜集方面表现出色,但在指令遵循上仍有优化空间。未来,随着技能丰富度的提升,其应用场景将更为广泛。
除了通用智能体,扣子空间还推出了“专家模式”,提供用户研究专家和华泰A股观察助手两个选项。专家Agent在实用性上更胜一筹,尤其在复杂任务中展现出更强的纠错能力。例如,用户研究专家可在短时间内生成完整的用户调研方案,从访谈提纲到问卷设计再到虚拟数据分析,几乎覆盖所有需求。
不过,由于涉及的专业领域较深,任务耗时也相应增加,例如股票分析任务通常需要几十分钟。
值得一提的是,扣子空间还引入了“裂变玩法”,每位用户在完成任务后可获得五个邀请码,邀请码用完后还可获得更多资格,这让体验机会相对容易获取。
总体而言,扣子空间已是一款可用的智能体系统,其通用与专家模式的协作潜力值得期待。
.png)

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13