
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月5日,月之暗面发布Kimi K2模型最新版本(0905),上下文长度扩展至256K,显著提升复杂任务支持能力。新版本在真实编程任务中表现更优,尤其Agentic Coding能力和前端编程体验均有升级。同时推出高速版API,输出速度达60-100 Token/s,并新增多项功能:Token Enforcer确保格式正确、兼容Anthropic API、支持WebSearch Tool和全自动Context Caching。定价与0711版相同,用户可通过Kimi开放平台或Hugging Face、ModelScope部署模型。
原文链接
8月25日,硅基流动宣布上线深度求索团队开源的DeepSeek-V3.1模型。该模型总参数达671B,激活参数37B,采用混合推理架构,思考效率更高,工具使用与智能体任务表现显著提升,性能在多项测试中比肩Claude 4 Sonnet等主流模型。新版本支持160K超长上下文,适用于长文档解析、多轮对话、复杂任务处理等场景,且成本仅为Claude 4 Sonnet输入的1/5、输出的1/9。此外,其最大支持500万TPM,可无损解析法律合同、学术文献等,并实现高精度RAG增强检索,大幅降低错误率。
原文链接
2025年8月,阿里巴巴推出全新AI代码编辑器Qoder,现处于免费预览阶段。Qoder具备超强上下文理解能力,可一次性检索10万个代码文件,并支持多文件协同修改。其通过深度分析代码库生成清晰文档,帮助团队快速理解项目全貌,同时学习用户编码风格以提供个性化建议。Qoder的Quest模式允许用户通过自然语言描述功能需求,自动生成详细开发计划并执行,大幅提升开发效率。其核心技术包括规则、记忆、代码图谱和索引四大支柱,能智能选择最佳模型以平衡任务难度与响应速度。目前,Qoder已引发广泛关注,尽管部分用户反馈存在不足,但其免费试用政策吸引了大量开发者体验。专业版定价待定。更多详情见官网及论坛。
原文链接
2025年8月21日,DeepSeek官方发布V3.1版本,上下文长度扩展至128k,参数达685B,支持多种精度格式。新版本在编程能力上表现突出,Aider测试中得分71.6%,超越Claude 4 Opus,成本低至1美元。新增原生搜索和特殊Token功能,并优化推理速度和上下文支持。尽管未发布模型卡,V3.1已登上Hugging Face趋势榜第四。实测显示其性能显著提升,但在部分复杂任务上仍有改进空间。网友期待未来R2版本的发布。
原文链接
2025年8月20日,DeepSeek V3.1发布,主要更新包括上下文长度拓展至128K和支持多种张量格式。实测显示,V3.1在编程能力、情境写作、数学理解、翻译水平等方面均有显著提升。例如,V3.1在处理GIF压缩任务时提供了更全面的代码说明和优化策略;情境写作中,风格从V3的理性转为更具文艺气息的表达;数学题解答逻辑清晰且正确;翻译表现对长难句的理解更强但偶有小失误。此外,V3.1在冷门知识问答中存在争议性回答。网友测试发现其在非推理模型基准上拿下SOTA成绩,性价比高,但部分线上API仍存在问题。目前,V3.1已可在网页端、APP及小程序使用,Base版本可从抱抱脸下载。
原文链接
正文:8月20日,DeepSeek在Hugging Face开源新模型V3.1-Base,参数约685B,上下文长度拓展至128K。同日晚些时候,线上模型版本已升级至V3.1,支持官方网页、App、小程序测试,API调用方式保持不变。备受期待的DeepSeek R2仍未确定发布时间。
原文链接
8月19日,DeepSeek官方宣布线上模型版本升级至V3.1,上下文长度扩展至128k。用户可通过官网、App及小程序体验新版功能,API调用方式保持不变。此次更新显著提升了模型处理长文本的能力,适用于长文档分析、代码理解及对话一致性等场景。IT之家提醒,本次更新为常规版本升级,备受期待的DeepSeek R2仍未公布发布时间。
原文链接
《科创板日报》19日讯,记者黄心怡报道,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。这一更新标志着模型性能和应用能力的进一步提升,为用户提供更高效、精准的服务体验。
原文链接
8月13日,Anthropic宣布其Claude Sonnet 4模型上下文token数提升至100万,是此前上限的五倍。新功能支持处理超7.5万行代码或数十篇长篇研究论文,适用于大规模代码分析、海量文档整合及多步骤工作流等场景。该功能已向Tier 4及以上客户开放测试,并可通过亚马逊Bedrock使用,谷歌云Vertex AI支持即将推出。超过20万token的提示词定价翻倍,但通过缓存和批量处理可降低50%成本。此外,Anthropic近期还推出了Claude的记忆功能和Claude Opus 4.1版本,进一步提升实用性。
原文链接
2025世界机器人大会上,阿里达摩院宣布开源具身智能三大关键组件:VLA模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP。RynnRCP通过标准化框架打通传感器数据采集、模型推理到机器人动作执行的全流程,支持多款热门模型和机械臂。RynnVLA-001能从视频中学习人类操作技能并迁移到机械臂控制,而RynnEC则赋予模型对物理世界的多维度理解能力。此外,达摩院上月还开源了WorldVLA模型,提升图像与动作生成能力。相关代码已发布在GitHub平台,供开发者使用。
原文链接
加载更多

暂无内容