1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

直观绘制3D模型,VAST再次开源

3D生成领域的明星项目VAST又一次开源了!这次推出的项目名为Tripo Doodle(内部代号TripoSG Scribble),能够将简单的2D草图和文本提示实时转化为精细的3D模型。它解决了传统3D建模学习曲线陡峭、耗时费力的问题,尤其在初期“打形”阶段表现突出。

Tripo Doodle的关键组件已开源,用户可以通过它直观绘制、添加文本提示并即时生成3D模型。只需在画布上勾勒简单的2D形状和线条,输入文字赋予模型语义信息或特定属性,即可实时看到生成的3D模型,并随输入调整动态更新。

在SIGGRAPH Asia 2024 Real-Time LIVE! 上,Tripo Doodle展示了“万物皆可画”的未来。它让创作者专注于创意,摆脱繁琐工具操作。Tripo Doodle基于VAST的TripoSG基础模型开发,利用大规模整流流Transformer架构,结合定制的VAE和符号距离函数表征,实现了从草图到3D模型的精准转化。

此外,Tripo Doodle支持多模态条件注入,融合草图和文本输入模态。草图提供几何约束,文本则负责语义引导。为实现快速生成,项目采用CFG蒸馏技术优化性能,使生成速度接近实时。

演示中,从概念到初步3D可视化的耗时缩短至秒级。用户可以用几笔草图快速创建3D物体,动态修改草图或文本提示后,3D模型实时更新。此外,“随机化”功能帮助用户探索多种创意方向。“Doodle 1v1”环节中,新手也能在30秒内完成趣味作品。

VAST希望通过开放TripoSG Scribble和TripoSG的核心组件,推动领域发展。欢迎全球研究者、开发者和创作者共同探索其技术潜力。相关资源包括Hugging Face空间链接、GitHub仓库和arXiv论文。

原文链接
本文链接:https://kx.umi6.com/article/17545.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
业界首个,阿里通义万相“首尾帧生视频模型”开源
2025-04-17 23:53:37
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发
2025-06-12 16:39:43
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
DeepSeek开源新模型,数学推理能力大提升
2025-05-01 09:16:24
刷新3D生成上限!一键生成精细到毛发的3D资产
2025-08-02 14:19:08
李想回应开源理想星环OS:就是为了感谢DeepSeek
2025-05-07 21:20:18
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
2025-06-17 19:28:49
在终端就能跑的轻量级推理智能体,OpenAI 发布完全开源 Codex CLI 工具
2025-04-17 02:20:31
英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍
2025-08-19 15:01:14
24小时热文
更多
扫一扫体验小程序