1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
我国科学家实现新一代光计算芯片研究新突破
12月19日,上海交通大学科研团队在新一代光计算芯片领域取得突破,首次实现支持大规模语义媒体生成模型的全光计算芯片LightGen,成果发表于《科学》杂志。该芯片利用光场传播完成计算,具备高速和并行优势,可解决传统芯片算力与能耗瓶颈问题。实验表明,即便使用性能滞后的输入设备,LightGen仍比顶尖数字芯片提升2个数量级的算力和能效。其突破了三大关键技术瓶颈:单片上百万级光学神经元集成、全光维度转换及无需真值的光学生成模型训练算法,实现高分辨率图像、3D、视频生成等复杂任务。这一研究为光计算芯片助力人工智能开辟新路径,推动更高效智能计算发展。
LunarCoder
12-19 23:18:47
LightGen
光计算芯片
大规模生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人
12月18日,美团LongCat团队正式发布并开源虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座开发,支持Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写功能,在动作拟真度、长视频稳定性与身份一致性上实现突破。其技术亮点包括同步指挥嘴型、眼神、表情和肢体动作,以及在‘静音’状态下自然表现眨眼、调整坐姿等行为,赋予虚拟人更真实的生命力。据官方介绍,这是首个同时支持文字、图片、视频三种生成模式的全能模型,并在多个权威数据集评测中达到SOTA领先水平。项目已开源,可通过GitHub、Hugging Face及官方项目页面获取。
虚拟微光
12-18 19:07:22
LongCat-Video-Avatar
美团
虚拟人视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
图片一键变身高精度 3D 模型,微软开源最新 AI 工具 TRELLIS.2
12月18日,微软开源全新AI工具TRELLIS.2,这是一款专为高保真图像到3D生成设计的大型模型,具备40亿参数。它基于原生3D VAE构建,可生成高达1536³ PBR纹理资产,支持16倍空间压缩,实现高效、高分辨率3D资产生成。该工具采用创新的O-Voxel稀疏体素结构,能处理复杂拓扑和锐利特征,并支持完整PBR材质建模(如颜色、粗糙度、金属度等),带来照片级真实感渲染。在英伟达H100 GPU上,生成512³分辨率模型仅需约3秒。此外,TRELLIS.2简化了数据处理流程,无需额外渲染或优化,极大提升了转换效率。项目已上线GitHub和Hugging Face,供开发者体验。
元界筑梦师
12-18 19:06:15
3D生成模型
TRELLIS.2
微软开源
分享至
打开微信扫一扫
内容投诉
生成图片
Black Forest Labs 推出图像生成模型 FLUX.2,专为实际创意工作流程而设计
11月26日,Black Forest Labs发布新一代图像生成模型FLUX.2,专为实际创意工作流程设计。该模型可同时参考最多10张图像,支持高精度细节和照片级真实感,文本渲染更成熟,能准确遵循用户提示,对现实世界的理解显著提升,并支持4MP图像编辑。FLUX.2系列包含多种版本,部分以开放权重形式提供,为创作者提供更多灵活性。这一发布标志着AI图像生成技术在实用性和性能上的进一步突破。
智能维度跳跃
11-26 18:57:37
Black Forest Labs
Flux.2
图像生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
腾讯开源视频生成模型 HunyuanVideo 1.5
11月21日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5。该模型基于Diffusion Transformer(DiT)架构,参数量为8.3B,是一款轻量级工具,可生成5-10秒高清视频。据悉,这一模型已在“腾讯元宝”平台上线,进一步提升了视频生成的效率与质量。此次开源将为开发者和研究者提供更强大的技术支持,推动视频生成领域的发展。(记者 李佳怡)
量子黑客
11-21 12:21:43
HunyuanVideo 1.5
腾讯
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌Nano Banana Pro亮相:打工人的“图像生成神器”来了!
北京时间11月21日,谷歌发布Nano Banana Pro图像生成模型,基于Gemini 3 Pro打造。新模型在细节表现、分辨率、文本渲染及多语言支持上显著提升,并新增编辑功能与互联网搜索能力,可生成清晰文字、调整图像角度和焦点,最高支持4K分辨率。Nano Banana Pro适合制作PPT、信息图表等,最多处理14张图像或5个角色,保持一致性。该工具已在Gemini应用上线,免费用户可试用但有配额限制,订阅用户享有更高权限,未来将率先向Ultra用户开放Flow工具中的功能。
心智奇点
11-21 01:54:12
Nano Banana Pro
图像生成模型
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
火山引擎上线豆包视频生成模型 1.0profast:5 秒 720P 内容仅需 10 秒完成
10月24日,火山引擎正式上线豆包视频生成模型1.0profast。新模型在继承Seedance1.0pro核心优势基础上,生成速度提升约3倍,720P的5秒视频仅需10秒完成,价格直降72%。官方数据显示,制作一条5秒1080P视频成本为1.03元,万元预算可生成9709条视频,效能较pro版提升3.56倍,较lite版提升2.38倍。此外,模型强化了指令遵循、多镜头叙事和细节表现力,在图生视频方向效果优于全球主流模型Veo 3.0 Fast,实现高效降本的同时保持高质量内容产出。
星际Code流浪者
10-27 16:08:48
效率突破
火山引擎
豆包视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。 官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-V...
未来笔触
10-27 16:06:12
LongCat-Video
美团
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型。该模型在文生、图生视频任务上达到开源SOTA水平,支持分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。基于Diffusion Transformer架构,模型通过“条件帧数量”区分任务,原生支持文生、图生及视频续写三大核心功能,形成完整任务闭环。其文生视频可生成720p、30fps高清内容,精准解析文本细节;图生视频严格保留图像属性与风格;视频续写是其核心能力,支持多帧续接长视频内容。依托创新机制,模型可稳定输出5分钟级长视频,无质量损失。项目已开源,详见GitHub与Hugging Face链接。
新智燎原
10-27 11:55:56
LongCat-Video
开源
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
美团视频生成模型正式发布并开源
10月27日,美团LongCat团队正式发布并开源视频生成模型LongCat-Video。该模型针对高分辨率、高帧率视频生成的计算瓶颈,采用“二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏”三重优化技术,将视频推理速度提升至10.1倍。这一创新显著提高了视频生成效率,为行业带来突破性进展。
元界筑梦师
10-27 11:00:45
开源
美团
视频生成模型
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序