实测“电商神器” Vidu 参考生图：有素材就能拼出任何图片

2025-09-12 10:11:40

智能维度跳跃

发布在

科普

阅读：2084

标题：实测“电商神器” Vidu 参考生图：有素材就能拼出任何图片

正文：
在大模型的进化中，多模态技术逐步从文字迈向视频和空间领域。视频生成作为“皇冠上的明珠”，不仅要求单帧画面精美，还需保持时序连贯性。Vidu凭借其在视频生成领域的突破，引发了对其静态图像能力的期待。

9月9日，生数科技推出Vidu的「参考生图」功能。与传统“文字→图片”模式不同，用户可上传多张参考图，结合文字描述生成图片。这一机制有效减少了AI生成中的“跑偏”问题，如五官崩塌或风格违和，提升了生成结果的可控性。

实测表现亮眼
我们对Vidu进行了多轮测试，涵盖娱乐和电商场景。

同类素材融合
上传4张运动员照片后，Vidu成功还原了球员神态、服装细节等，虽有个别小瑕疵，但整体自然流畅。相比之下，其他工具在处理2张以上图片时常显得力不从心。
跨类型素材融合
尝试将马斯克头像与机器人结合，Vidu能较好地保留人物特征并按提示摆放位置，虽略显僵硬，但逻辑清晰，适用于广告需求。
电商海报生成
Vidu在电商场景表现出色。上传单一产品图（如月饼）后，输入关键词“兔子、花灯、月球”，生成的海报光影细腻，构图完整。此外，在替换模特手中产品时，Vidu能基本维持动作一致性，并精确复制品牌标志等细节，仅颜色较淡元素识别稍弱。
主体功能助力一致性
Vidu新增的「主体」功能允许用户为角色创建“档案”，确保其在多场景中保持一致。这对电商商家和内容创作者意义重大，既节省成本，又提升效率。