综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8日,阿里发布全员信宣布组织架构调整:通义实验室升级为事业部,由周靖人负责;李飞飞出任阿里云CTO,吴泽明专注集团CTO职责;雷雁群接任淘宝闪购CEO。同时,成立阿里巴巴集团技术委员会,吴泳铭任组长,成员包括周靖人、吴泽明和李飞飞。周靖人担任技术委员会首席AI架构师,李飞飞负责阿里云技术及AI云基础设施建设,吴泽明负责集团业务技术平台及AI推理平台建设,并担任技术委员会召集人。(记者 黄心怡)
原文链接
3月16日,通义实验室发布并开源了首个支持影视级多场景配音的多模态大模型Fun-CineForge。该模型通过“数据+模型”的一体化设计,尝试解决影视级AI配音的关键问题,并配套开放了高质量数据集的构建方法。这一成果为影视制作领域提供了更高效的AI技术支持,具有重要的行业意义。
原文链接
3月5日,阿里巴巴CEO吴泳铭发布内部邮件称,公司已批准通义实验室成员林俊旸的辞职申请,后续工作将由周靖人继续负责。同时,公司将成立基础模型支持小组,由吴泳铭、周靖人和范禹共同协调资源推进基础模型建设。阿里巴巴表示将继续坚持开源模型策略,并加大对人工智能领域的研发投入,积极吸纳优秀人才,持续强化在AI领域的竞争力。
原文链接
2026年3月2日,阿里巴巴集团宣布将AI品牌统一为“千问”,以解决此前千问、通义千问、Qwen等多个名称带来的混淆问题。千问大模型(Qwen)覆盖基础大模型和专业领域模型,千问APP则作为C端旗舰AI应用。统一后,品牌中文名为“千问大模型”,英文名为“Qwen”,而“通义实验室”仍为阿里巴巴旗下AI机构的组织名称。此举旨在强化品牌认知,推动AI技术在更多场景的应用落地。
原文链接
7月4日,阿里通义实验室宣布开源首个音频生成模型ThinkSound。该模型首次将思维链(CoT)技术应用于音频生成领域,能够像专业音效师一样“听懂画面”,实现高保真、强同步的空间音频生成。研究团队构建了支持链式推理的多模态音频数据集AudioCoT,包含2531.8小时高质量样本,覆盖动物鸣叫、机械运转等真实场景,并通过严格筛选保障数据质量。ThinkSound由多模态大语言模型和统一音频生成模型组成,分三阶段解析画面内容并生成精准音频效果。这一技术突破解决了传统视频到音频生成中动态细节与空间关系不足的问题,满足专业创意需求。项目已开源,详情可参考GitHub、Hugging Face及ModelScope平台。
原文链接
加载更多
暂无内容