综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月5日,腾讯正式发布自研AI大模型混元2.0(Tencent HY 2.0),包括HY 2.0 Think和HY 2.0 Instruct版本。该模型采用混合专家架构,总参数达406B,激活参数32B,支持256K上下文窗口,在复杂推理场景中表现优异,稳居国内第一梯队。相比上一版本,新模型在数学、科学、代码及指令遵循等领域显著提升,尤其在IMO-AnswerBench、HMMT2025等权威测试中取得一流成绩。此外,通过强化学习策略优化,其效率和质感大幅提高,单位token智能密度处于业界领先水平。目前,HY 2.0已接入腾讯元宝、ima等应用,并上线腾讯云API供用户使用,相关技术将逐步开源。
原文链接
2025年11月,腾讯混元大模型团队正式发布并开源HunyuanOCR模型,这是一款商业级、轻量(1B参数)的OCR专用视觉语言模型,采用原生ViT和轻量LLM架构。其感知能力(文本检测、复杂文档解析)优于所有公开方案,语义能力(信息抽取、翻译)表现出色,荣获ICDAR 2025 DIMT挑战赛小模型赛道冠军,并在OCRBench上取得3B以下模型SOTA成绩。该模型实现三大突破:全能与高效统一、极简端到端架构、数据驱动与强化学习创新。目前,模型已在Hugging Face趋势榜排名前四,GitHub标星超700,并被vllm官方团队接入。项目提供高性能部署方案,助力科研与工业落地。
原文链接
2025年11月25日,腾讯混元宣布开源全新OCR模型HunyuanOCR。该模型参数仅为1B,基于混元原生多模态架构开发,具备高效与精准的文字识别能力。这一开源举措为开发者提供了更便捷的工具,助力多模态技术应用拓展。
原文链接
11月25日,腾讯混元宣布开源全新OCR模型HunyuanOCR,参数仅1B,多项核心能力达SOTA水平。该模型依托混元原生多模态架构,支持端到端推理,在复杂文档解析、文字检测与识别等任务中表现优异,如在OmniDocBench测评中获94.1分,超越谷歌Gemini3-pro;在OCRBench榜单上以860分领先3B以下参数模型。此外,HunyuanOCR支持14种小语种翻译,适用于票据字段抽取、视频字幕识别、拍照翻译等场景,并斩获ICDAR2025端到端文档翻译比赛小模型赛道冠军。模型已开源,可通过GitHub、HuggingFace等平台获取和体验。
原文链接
11月21日,腾讯元宝上线了一句话、一张图生成视频功能,基于混元大模型团队最新开源的HunyuanVideo 1.5模型打造。该模型采用Diffusion Transformer(DiT)架构,参数达8.3B,支持生成5-10秒高清视频。用户可通过输入文字描述实现“文生视频”,或上传图片配合文字提示将静态图片转化为动态视频。新功能已率先在「元宝」平台推出,为内容创作者提供更高效的视频生成工具,进一步拓展了AI技术在多媒体领域的应用。
原文链接
11月13日,腾讯发布Q3财报,营收1928.7亿元,同比增长15%,经营利润达726亿元,同比增长18%。AI战略成效显著,元宝与微信、腾讯会议等数十款应用打通,生态协同增强;国际游戏收入突破200亿元,得益于Supercell及新作《消逝的光芒:困兽》表现强劲;微信小店等新芽业务活力显现,微信及WeChat月活用户增至14.14亿。广告业务收入362.4亿元,同比增长21%,AI驱动精准投放助力增长;云服务受益于AI需求提升,企业服务收入实现双位数增长。混元大模型能力持续升级,开源模型获行业认可。腾讯正加速AI技术落地与国际化布局。
原文链接
11月13日,腾讯发布Q3财报显示营收和利润显著增长,但资本支出低于预期。针对外界对AI发展可能受影响的担忧,腾讯总裁刘炽平在财报电话会上回应称,目前公司GPU资源充足,能够满足内部需求。他还提到,云业务外部收入存在一定限制,而AI模型‘混元’的研发进展顺利,团队在技术、人才及基础设施方面取得显著改进。刘炽平对当前成果表示满意,并透露下一版本模型将带来有意义的能力提升,预计研发改进步伐将进一步加快。
原文链接
11月13日,腾讯总裁刘炽平在三季度财报电话会上透露,腾讯正为混元团队招聘更多顶尖研究人才,以强化现有工程团队。同时,腾讯正从硬件、软件基础设施等多个维度优化混元整体架构,提升数据准备、模型预训练及跨领域大规模强化学习能力。此前,关于“前OpenAI研究员姚顺雨上亿薪资入职腾讯”的传闻被鹅厂黑板报辟谣,确认为不实信息。
原文链接
11月13日,腾讯总裁刘炽平在三季度财报电话会上表示,腾讯在AI竞赛中并未落后,下一代模型将显著提升混元能力。他指出,目前国内没有一个模型具有决定性优势,各公司处于接近的竞争状态,不同模型在不同场景下各有优劣。这一表态展现了腾讯对AI技术发展的信心及行业竞争的激烈态势。(蓝鲸新闻)
原文链接
11月13日,腾讯混元图像3.0正式上线国内最大AI内容创作平台LiblibAI,并同步推出腾讯优图视频特效模型Youtu-Video FX。混元图像3.0参数规模达80B,是首个开源工业级原生多模态生图模型,官方称其为“效果最好、参数量最大”的开源模型,可对标业界头部闭源模型。该模型具备常识推理能力,支持解析千字复杂语义并生成长文本文字,适用于多种创意场景。作为今年5月发布的2.0版本升级版,3.0在画质和功能上进一步优化,此前已实现毫秒级响应与超写实画质。用户可通过LiblibAI平台体验相关功能。
原文链接
加载更多
暂无内容