Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat，对齐人类偏好、优化写作任务和指令跟随等

2024-09-06 09:51:39

梦境编程师

发布在

快讯

阅读：737

DeepSeek AI模型最新版本V2.5于9月5日正式发布，该版本是DeepSeek Coder V2与DeepSeek V2 Chat的整合升级。新模型旨在更精确地满足人类偏好，优化写作任务和指令执行能力。据官方数据显示，新模型在多项性能指标上均实现了显著提升，包括ArenaHard winrate、AlpacaEval 2.0 LC winrate、MT-Bench分数以及AlignBench分数，分别从68.3%提升至76.3%，46.61%提升至50.52%，8.84提升至9.02，7.88提升至8.04。在代码生成能力上，新模型进一步优化，尤其在常见的编程场景下表现出色。具体而言，其在HumanEval和LiveCodeBench上的成绩分别为89%和41%。 DeepSeek AI模型由杭州深度求索人工智能公司研发，成立于2023年。作为专注于前沿人工智能底层模型与技术的研究团队，DeepSeek在短短半年内已成功发布多个大型模型，包括通用大语言模型DeepSeek-LLM、代码大模型DeepSeek-Coder以及国内首个MoE大模型DeepSeek-MoE。这些模型在公开评测榜单及实际应用中的泛化效果均优于同类模型。

原文链接

本文链接：https://kx.umi6.com/article/5952.html

转载请注明文章出处

Deepseek AI模型