综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月,阿里云发布新一代图像生成及编辑模型Qwen-Image-2.0,支持1K token超长文本输入、复杂指令理解、中文渲染和多图编辑,输出分辨率高达2K。实测显示,该模型可精准生成五宫格漫画、美食爆炸图、城市3D景观等复杂场景,画面质感与细节表现出色。此外,其图片编辑能力强大,可实现OOTD拼图、九宫格写真等创意需求,并在中文文字渲染上表现优异,适合信息图表、海报设计等实用场景。国际评测中,Qwen-Image-2.0位列前列,仅次于Nano Banana Pro等顶级模型。目前,开发者可通过阿里云百炼平台或Qwen Chat免费体验该模型。
原文链接
阿里通义实验室的最新升级版Mobile-Agent-v2是一款AI助手,它通过语音命令,如“我要去XX地方”,就能自动帮用户在手机上完成打车等操作,特别适合老年人和视障群体。这款AI引入了多智能体架构,能高效追踪任务、记忆相关信息和反思操作,提升了处理复杂指令和跨应用任务的能力,如查找TikTok视频并分享,以及在社交媒体上关注名人并评论。它还能适应不同语言环境,如在小红书搜索攻略并评论。Mobile-Agent-v2通过规划智能体简化任务追踪,记忆单元存储关键信息,反思智能体确保操作准确性。实验结果显示,无论英文还是非英文场景,Mobile-Agent-v2在多项指标上都有显著提升。代码和论文已公开,可方便研究和使用。
原文链接
加载更多
暂无内容