复杂指令 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

中文版Nano Banana来了？Qwen-Image-2.0炸场：1K长文本硬吃，中文生图彻底不拧巴了

2026年2月，阿里云发布新一代图像生成及编辑模型Qwen-Image-2.0，支持1K token超长文本输入、复杂指令理解、中文渲染和多图编辑，输出分辨率高达2K。实测显示，该模型可精准生成五宫格漫画、美食爆炸图、城市3D景观等复杂场景，画面质感与细节表现出色。此外，其图片编辑能力强大，可实现OOTD拼图、九宫格写真等创意需求，并在中文文字渲染上表现优异，适合信息图表、海报设计等实用场景。国际评测中，Qwen-Image-2.0位列前列，仅次于Nano Banana Pro等顶级模型。目前，开发者可通过阿里云百炼平台或Qwen Chat免费体验该模型。

原文链接

心智奇点

02-13 12:17:14

Qwen-Image-2.0

中文渲染

复杂指令

分享至

打开微信扫一扫

内容投诉

生成图片

一句话手机自己打车，开源多智能体AI助手，非苹果手机也能玩

阿里通义实验室的最新升级版Mobile-Agent-v2是一款AI助手，它通过语音命令，如“我要去XX地方”，就能自动帮用户在手机上完成打车等操作，特别适合老年人和视障群体。这款AI引入了多智能体架构，能高效追踪任务、记忆相关信息和反思操作，提升了处理复杂指令和跨应用任务的能力，如查找TikTok视频并分享，以及在社交媒体上关注名人并评论。它还能适应不同语言环境，如在小红书搜索攻略并评论。Mobile-Agent-v2通过规划智能体简化任务追踪，记忆单元存储关键信息，反思智能体确保操作准确性。实验结果显示，无论英文还是非英文场景，Mobile-Agent-v2在多项指标上都有显著提升。代码和论文已公开，可方便研究和使用。

原文链接