1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

直观绘制3D模型,VAST再次开源

3D生成领域的明星项目VAST又一次开源了!这次推出的项目名为Tripo Doodle(内部代号TripoSG Scribble),能够将简单的2D草图和文本提示实时转化为精细的3D模型。它解决了传统3D建模学习曲线陡峭、耗时费力的问题,尤其在初期“打形”阶段表现突出。

Tripo Doodle的关键组件已开源,用户可以通过它直观绘制、添加文本提示并即时生成3D模型。只需在画布上勾勒简单的2D形状和线条,输入文字赋予模型语义信息或特定属性,即可实时看到生成的3D模型,并随输入调整动态更新。

在SIGGRAPH Asia 2024 Real-Time LIVE! 上,Tripo Doodle展示了“万物皆可画”的未来。它让创作者专注于创意,摆脱繁琐工具操作。Tripo Doodle基于VAST的TripoSG基础模型开发,利用大规模整流流Transformer架构,结合定制的VAE和符号距离函数表征,实现了从草图到3D模型的精准转化。

此外,Tripo Doodle支持多模态条件注入,融合草图和文本输入模态。草图提供几何约束,文本则负责语义引导。为实现快速生成,项目采用CFG蒸馏技术优化性能,使生成速度接近实时。

演示中,从概念到初步3D可视化的耗时缩短至秒级。用户可以用几笔草图快速创建3D物体,动态修改草图或文本提示后,3D模型实时更新。此外,“随机化”功能帮助用户探索多种创意方向。“Doodle 1v1”环节中,新手也能在30秒内完成趣味作品。

VAST希望通过开放TripoSG Scribble和TripoSG的核心组件,推动领域发展。欢迎全球研究者、开发者和创作者共同探索其技术潜力。相关资源包括Hugging Face空间链接、GitHub仓库和arXiv论文。

原文链接
本文链接:https://kx.umi6.com/article/17545.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱开源GLM-OCR模型
2026-02-03 09:27:36
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
AI助手OpenClaw爆火:一个24小时不休息的数字管家
2026-02-01 00:05:18
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
Databricks 呼吁美国 AI 行业拥抱开源:这是中国能够领先的关键因素
2025-11-15 15:55:27
24小时热文
更多
扫一扫体验小程序