
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,由Transformer作者之一Llion Jones创立的Sakana AI推出了一种新方法,通过让教师模型模仿人类教师进行‘启发式’教学,显著提升了学生模型的推理能力。该方法中,教师模型不再从头解决问题,而是根据已知答案提供清晰的逐步解释。实验表明,7B规模的教师模型在训练学生模型方面优于671B的DeepSeek-R1,并能有效训练出4倍规模的学生模型。这种方法不仅提高了效率,还降低了成本,使小型模型也能承担教学任务。
原文链接
4月7日消息,商汤科技宣布“2025商汤技术交流日”将于4月10日14时举办,届时将推出主打‘强推理’的全新日日新6.0 AI模型。去年7月5日,商汤曾发布日日新SenseNova 5.5大模型体系,其国内首个流式原生多模态交互模型‘日日新5o’交互效果对标GPT-4o。日日新5.5基于超10TB tokens高质量训练数据,采用混合端云协同架构,具备6000亿参数,实现109.5字/秒的推理速度。此次日日新6.0的发布将进一步展示商汤在AI领域的技术实力与创新成果。
原文链接
加载更多

暂无内容