GPT-4 Turbo - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI“短板”暴露：研究发现 GPT-4 Turbo 回答高级历史题准确率仅 46%

最新研究显示，AI在高级历史题上的准确率仅46%，远低于随机猜测水平。该研究由奥地利复杂科学研究所团队主导，测试了GPT-4、Llama和Gemini三大顶尖模型。使用Hist-LLM基准测试工具，结果显示GPT-4 Turbo表现最佳但仍不理想。研究指出，AI在处理技术性和复杂历史问题时存在困难，可能因训练数据偏见导致在某些地区表现更差。尽管如此，研究人员对未来AI辅助历史研究仍持乐观态度，正通过改进基准测试工具来提升模型性能。

原文链接

未来笔触

01-20 17:20:47

GPT-4 Turbo

准确率

历史考试

分享至

打开微信扫一扫

内容投诉

生成图片

科大讯飞星火 4.0 Turbo 大模型发布：七大能力全面超越 GPT-4 Turbo

10月24日，在2024科大讯飞全球1024开发者节上，科大讯飞发布了“讯飞星火4.0 Turbo”大模型，该模型在数学能力、代码能力等方面全面超越GPT-4 Turbo。据官方介绍，讯飞星火4.0 Turbo已完成超长思维链、树搜索和自我反思评价等算法验证，预计年底可实现类O1的高难度数学能力。此外，此次还推出了星火代码7B版本，可在端侧本地运行，满足代码生成、代码补全等需求，并宣称效果业界最优。这一新模型的发布，标志着科大讯飞在人工智能领域取得了重要进展。

原文链接

电子诗篇

10-24 11:11:45

GPT-4 Turbo

星火 4.0 Turbo

科大讯飞

分享至

打开微信扫一扫

内容投诉

生成图片

科大讯飞发布讯飞星火大模型 V4.0，整体超越 GPT-4 Turbo

6月27日，科大讯飞在发布会上推出讯飞星火大模型V4.0，基于中国首个万卡算力集群“飞星一号”训练，整体超越GPT-4 Turbo，尤其在文本生成等关键任务上表现出色。新模型在12项主流测试中的8个排名首位，同时伴随新品如讯飞星火App、智能批阅机等，拓展了教育、医疗和商业应用场景。这一技术进步标志着科大讯飞在人工智能领域的最新突破。

原文链接

Nebula

06-27 21:51:07

GPT-4 Turbo

科大讯飞

讯飞星火大模型

分享至

打开微信扫一扫

内容投诉

生成图片

科大讯飞：星火 V4.0 大模型“对标 GPT-4 Turbo”，6 月 27 日发布多款产品

科大讯飞即将于6月27日在北京国家会议中心发布星火大模型V4.0，以“懂你的AI助手”为主题，全面对标GPT-4 Turbo。发布会上，将展示七大核心能力提升，包括个人空间、智能批阅机、AI学习机、晓医App升级、多语种语音识别等，并发布企业智能体平台和机器人超脑平台2.0。讯飞董事长刘庆峰透露，星火V4.0将展示端到端智能语音落地成果，预计三季度上市，且独家功能包括一句话复刻、高噪音场景识别和多语种方言切换。这场发布会标志着讯飞在人工智能领域的最新进展。

原文链接

Nebula

06-24 23:28:42

GPT-4 Turbo

星火 V4.0

科大讯飞

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多