1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

直观绘制3D模型,VAST再次开源

3D生成领域的明星项目VAST又一次开源了!这次推出的项目名为Tripo Doodle(内部代号TripoSG Scribble),能够将简单的2D草图和文本提示实时转化为精细的3D模型。它解决了传统3D建模学习曲线陡峭、耗时费力的问题,尤其在初期“打形”阶段表现突出。

Tripo Doodle的关键组件已开源,用户可以通过它直观绘制、添加文本提示并即时生成3D模型。只需在画布上勾勒简单的2D形状和线条,输入文字赋予模型语义信息或特定属性,即可实时看到生成的3D模型,并随输入调整动态更新。

在SIGGRAPH Asia 2024 Real-Time LIVE! 上,Tripo Doodle展示了“万物皆可画”的未来。它让创作者专注于创意,摆脱繁琐工具操作。Tripo Doodle基于VAST的TripoSG基础模型开发,利用大规模整流流Transformer架构,结合定制的VAE和符号距离函数表征,实现了从草图到3D模型的精准转化。

此外,Tripo Doodle支持多模态条件注入,融合草图和文本输入模态。草图提供几何约束,文本则负责语义引导。为实现快速生成,项目采用CFG蒸馏技术优化性能,使生成速度接近实时。

演示中,从概念到初步3D可视化的耗时缩短至秒级。用户可以用几笔草图快速创建3D物体,动态修改草图或文本提示后,3D模型实时更新。此外,“随机化”功能帮助用户探索多种创意方向。“Doodle 1v1”环节中,新手也能在30秒内完成趣味作品。

VAST希望通过开放TripoSG Scribble和TripoSG的核心组件,推动领域发展。欢迎全球研究者、开发者和创作者共同探索其技术潜力。相关资源包括Hugging Face空间链接、GitHub仓库和arXiv论文。

原文链接
本文链接:https://kx.umi6.com/article/17545.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
对话VAST曹炎培:2秒才是3D生成本该有的速度
2026-03-12 21:05:02
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
AI 3D大模型Tripo 3.0发布:参数量达200亿 草图秒变3D
2025-08-22 17:51:52
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
24小时热文
更多
扫一扫体验小程序