
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年9月1日,美团发布并开源了LongCat-Flash-Chat AI模型,采用混合专家架构,总参数量达5600亿,但仅激活5%即可实现高效性能。该模型在智能体任务、推理速度及成本控制上表现突出,尤其适合复杂场景应用。其创新的“零计算专家”机制和跨层通道设计优化了算力分配与训练效率,在H800 GPU上实现100+ tokens/s推理速度,输出成本低至5元/百万token。基准测试中,LongCat-Flash在多项指标中名列前茅,例如ArenaHard-V2得分86.50,MMLU得分89.71,并在智能体工具使用和编程任务中超越更大规模模型。美团已提供SGLang和vLLM两种部署方案,代码以MIT License开源,用户可自由用于研究或蒸馏新模型。详情见其官方资源及相关页面。
原文链接
2023年,创业者袁进辉经历了两段重要历程:3月,其创业项目OneFlow被美团联合创始人王慧文收购,随后加入光年之外;8月,他离开美团,创立硅基流动,专注AI Infra领域。2024年初,硅基流动因率先部署DeepSeek的R1模型实现流量暴涨40倍,成为行业焦点。尽管与DeepSeek创始人梁文锋在开源问题上有分歧,两家公司仍保持业务合作。2025年初,基于V3架构的R1模型爆火,引发流量风暴,硅基流动通过大规模专家并行技术迎战,提升了品牌知名度。最新一轮融资由阿里云领投,金额达数亿元。袁进辉认为,AI行业的关键在于商业化,而硅基流动将聚焦高增长,探索公有云、私有部署及海外市场,力求在竞争中抓住商机。
原文链接
7月28日,据IT之家报道,智谱AI计划于今晚开源其GLM-4.5系列新模型。知情人士向新浪科技确认了这一消息。根据此前modelscope/ms-swift代码库的commit记录,GLM-4.5系列预计将采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型,包含GLM-4.5(355B-A32B)和GLM-4.5-Air(106B-A12B)两款版本。该模型支持高吞吐推理、工具调用解析、分布式负载均衡等功能,并具备文本、图像、视觉扩展等多模态处理能力。此次发布可能为AI领域带来技术革新,引发广泛关注。
原文链接
7月25日,智谱AI模型GLM-4.5系列踪迹曝光,预计采用全新混合专家(MoE)架构,定位为多模态可扩展大模型。该系列包括GLM-4.5(355B-A32B)和GLM-4.5-Air(106B-A12B)两款模型,支持文本、图像、视觉扩展等多模态功能。新架构具备高吞吐推理、分布式负载均衡、工具调用解析等特性,并新增推理解析器与多token预测能力。相关代码与特性已在modelscope/ms-swift代码库中显示,或成AI领域新突破。
原文链接
标题:AI打假AI,拿下SOTA丨厦大&腾讯优图
正文:
AI生成图像越来越逼真,能否用AI检测“魔法打败魔法”?厦门大学与腾讯优图实验室联合提出创新方法“AIGI-Holmes”,通过“大模型+视觉专家”协同架构,让AI学会检测并描述图像问题。
核心创新点:
1. 双视觉编码器架构...
原文链接
2025年6月30日,知乎直答发布最新版本,升级知识库功能,支持订阅与内容分享,并与社区深度融合,提供沉浸式阅读、边看边问、精准提问等多元场景体验。用户可创建主题知识库并共享订阅,覆盖科技、财经、教育等多个领域。知识库还支持AI搜索引用,提升专业内容的可信度和查询效率。目前公共知识库已在知乎直答网页端和App端全量上线,进一步放大专家网络影响力。
原文链接
今日,《科创板日报》报道,人工智能公司DeepSeek在AI开源社区Hugging Face发布了全新模型DeepSeek-Prover-V2-671B。该模型参数量高达6710亿,是Prover-V1.5的升级版,采用更高效的safetensors文件格式并支持多计算精度,便于快速训练与部署。其架构基于DeepSeek-V3,运用MoE混合专家模式,含61层Transformer层及7168维隐藏层,支持超长上下文,最大位置嵌入达16.38万,可高效处理复杂数学证明任务。此外,模型通过FP8量化技术优化推理效率,减小模型体积。此模型的发布标志着深度学习领域的重要进展,值得关注。
原文链接
4月21日,据快科技报道,大阪都会大学医学研究生院研究显示,生成式AI在医疗诊断中的平均准确率达52.1%,与非专家医生相当,但比专家医生低15.8%。研究分析了GPT-4、Llama3 70B、Gemini 1.5 Pro和Claude 3 Sonnet等主流AI模型,其中GPT-4应用最广。AI在皮肤科诊断中表现优异,得益于图像识别能力,但在泌尿科领域的可靠性仍需更多数据验证。研究认为,生成式AI有潜力辅助医疗诊断,尤其在医学教育、非专家医生支持及资源匮乏地区的诊断中可发挥作用。未来,随着技术进步,AI与专家医生的诊断差距有望缩小。
原文链接
4月21日,大阪都会大学医学研究生院的研究显示,生成式AI在医疗诊断中的平均准确率为52.1%,与非专家医生相当,但低于专家医生15.8%。研究团队分析了83项涉及GPT-4、Llama3 70B等模型的研究,发现AI在皮肤科表现突出,但在泌尿科的数据有限。AI可辅助医学教育和资源匮乏地区的诊断,但其透明度和偏见问题需解决。研究呼吁未来在更多复杂临床场景中验证AI性能,并强调其在医学培训中的潜力。尽管AI展现潜力,但涉及复杂病例时仍存挑战,医生失业风险尚不确定。
原文链接
Meta于4月5日推出最新开源AI模型Llama 4,包含Scout和Maverick两个版本。Llama 4首次采用混合专家(MoE)架构,能高效处理文本、视频、图像和音频等多模态数据。Scout拥有170亿活跃参数、16个专家模型,总参数1090亿;Maverick同样170亿活跃参数,但扩展至128个专家模型,总参数达4000亿。Behemoth作为更强大的模型正在研发中,被Meta视为“教师模型”。这些模型均基于大量未标注数据训练,具备广泛视觉理解能力。Scout和Maverick已开放下载,支持多平台获取,Meta AI已升级至Llama 4并覆盖40国,但多模态功能暂限美国英语。Meta CEO扎克伯格强调开源共享愿景,同时承认Llama 4开发延迟源于技术基准未达标及对话模拟能力不足等问题。Meta计划今年投入650亿美元扩展AI基础设施,面临投资者对回报的质疑。
原文链接
加载更多

暂无内容