
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,百度在WAVE SUMMIT深度学习开发者大会上发布文心大模型X1.1,其在事实性、指令遵循和智能体能力上显著提升,分别提高34.8%、12.5%和9.6%。官方称其效果超越DeepSeek R1-0528,比肩GPT-5和Gemini 2.5 Pro。实测中,X1.1在逻辑推理、文案生成、代码编写等任务表现出色,例如成功解决“农夫过河”变体题、精准生成小红书文案及设计教资模拟试题。同时,百度开源ERNIE-4.5-21B-A3B-Thinking模型,并升级飞桨框架至v3.2,优化训练效率与推理性能。目前,飞桨文心开发者数量超2333万,服务76万家企业,进一步推动AI技术落地与创新。
原文链接
9月9日,百度在WAVE SUMMIT深度学习开发者大会2025上发布文心大模型X1.1深度思考模型。该模型基于文心大模型4.5训练,在事实性、指令遵循和智能体能力上分别提升34.8%、12.5%和9.6%。文心X1.1整体表现超越DeepSeek R1,在部分任务中领先,并与GPT-5、Gemini 2.5 Pro效果持平。模型已上线文心一言官网、文小言App及百度智能云千帆平台,全面开放给企业客户和开发者。此外,百度还发布了飞桨核心框架3.2版本,升级大模型开发与部署工具,目前飞桨文心生态开发者达2333万,服务企业76万家。
原文链接
4月17日,在火山引擎AI创新巡展杭州站上,字节跳动发布豆包1.5深度思考模型,并升级文生图模型。该模型在数学、编程等领域表现出色,采用MoE架构,参数200B但激活参数仅20B,显著降低推理成本。此外,它还能结合视觉技术实现地貌分析、旅行辅助等功能。文生图模型升级至3.0版本,提升文字排版、图片生成精度及2k直出能力。视频搜索功能也得到增强,可精准定位答案。据谭待透露,截至2025年3月,豆包大模型日均tokens使用量超12.7万亿,较发布初期增长超106倍。
原文链接
3月21日,腾讯混元正式发布自研深度思考模型混元T1正式版。该模型在多个权威基准测试中表现出色,在MMLU-PRO测试中获得87.2分,紧随o1之后;同时在CEval、AIME、Zebra Logic等涵盖中英文知识及数学、逻辑推理的公开测试中,成绩达到行业顶尖水准,展现出强大的推理能力。这是腾讯在人工智能领域的重要进展,标志着其在深度学习和自然语言处理方面的持续突破。
原文链接
百度发布文心大模型4.5和X1,均免费开放。文心大模型4.5主打原生多模态,各方面能力全面提升,尤其在多模态任务上接近GPT-4o水平。核心技术包括FlashMask动态注意力掩码、多模态异构专家扩展技术等。文心大模型X1则是百度版深度思考模型,具备更强的理解、规划、反思和进化能力,支持自主工具调用,已在多个领域展现强大功能。其API价格约为DeepSeek R1的一半,大幅降低了使用成本。两款模型API价格分别为:文心大模型4.5输入0.004元/千tokens,输出0.016元/千tokens;文心大模型X1输入0.002元/千tokens,输出0.008元/千tokens。未来,百度计划于6月底开源文心大模型,并在下半年推出5.0版本。
原文链接
微软宣布Copilot用户现可免费无限制访问OpenAI的o3-mini-high深度思考模型。此功能原仅限Pro计划用户使用,现已对所有用户开放。用户只需点击Copilot中的“深度思考”按钮,AI将在约30秒内生成经过充分推理的回复。OpenAI的o3-mini-high模型是其最新、最具成本效益的模型之一,提供更快的性能和更高的效率。
原文链接
标题:如何有效利用深度思考模型
正文:昨天,朋友提出一个有趣的问题,让我一时语塞:现在许多企业接入深度思考模型,但感觉它与普通模型无异,甚至质疑其用途。
其实,要理解深度思考的独特之处,首先得明白它与普通模型的区别。深度思考模型像是人类的大脑,理性思考与感性思考并存,类似于心理学中的系统1和系统2。...
原文链接
2月25日,有消息称字节跳动旗下AI助手豆包正在进行小范围测试,测试对象是其自研的深度思考模型,而非外界猜测的DeepSeek模型。据豆包相关负责人回应,目前测试的是其自身模型的不同实验版本。尽管豆包对话页面尚未公开显示‘深度思考’功能入口,但部分灰度测试用户在提问时已观察到豆包生成的答案中包含思维链。
原文链接
财联社2月25日电,字节跳动旗下AI助手豆包正在小范围内测其自研的深度思考模型,而非此前传闻的DeepSeek模型。实测显示,该功能目前未公开,仅部分用户灰度测试时可观察到豆包生成答复中带有思维链。
原文链接
《科创板日报》19日报道,腾讯元宝宣布旗下深度思考模型“混元T1”现对所有用户开放无限量使用。该模型与DeepSeek-R1同属推理模型,擅长处理复杂任务。腾讯元宝还提供DeepSeek-V3及腾讯混元Turbo以快速生成答案。
原文链接
加载更多

暂无内容