
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
最新研究显示,AI在高级历史题上的准确率仅46%,远低于随机猜测水平。该研究由奥地利复杂科学研究所团队主导,测试了GPT-4、Llama和Gemini三大顶尖模型。使用Hist-LLM基准测试工具,结果显示GPT-4 Turbo表现最佳但仍不理想。研究指出,AI在处理技术性和复杂历史问题时存在困难,可能因训练数据偏见导致在某些地区表现更差。尽管如此,研究人员对未来AI辅助历史研究仍持乐观态度,正通过改进基准测试工具来提升模型性能。
原文链接
10月24日,在2024科大讯飞全球1024开发者节上,科大讯飞发布了“讯飞星火4.0 Turbo”大模型,该模型在数学能力、代码能力等方面全面超越GPT-4 Turbo。据官方介绍,讯飞星火4.0 Turbo已完成超长思维链、树搜索和自我反思评价等算法验证,预计年底可实现类O1的高难度数学能力。此外,此次还推出了星火代码7B版本,可在端侧本地运行,满足代码生成、代码补全等需求,并宣称效果业界最优。这一新模型的发布,标志着科大讯飞在人工智能领域取得了重要进展。
原文链接
6月27日,科大讯飞在发布会上推出讯飞星火大模型V4.0,基于中国首个万卡算力集群“飞星一号”训练,整体超越GPT-4 Turbo,尤其在文本生成等关键任务上表现出色。新模型在12项主流测试中的8个排名首位,同时伴随新品如讯飞星火App、智能批阅机等,拓展了教育、医疗和商业应用场景。这一技术进步标志着科大讯飞在人工智能领域的最新突破。
原文链接
科大讯飞即将于6月27日在北京国家会议中心发布星火大模型V4.0,以“懂你的AI助手”为主题,全面对标GPT-4 Turbo。发布会上,将展示七大核心能力提升,包括个人空间、智能批阅机、AI学习机、晓医App升级、多语种语音识别等,并发布企业智能体平台和机器人超脑平台2.0。讯飞董事长刘庆峰透露,星火V4.0将展示端到端智能语音落地成果,预计三季度上市,且独家功能包括一句话复刻、高噪音场景识别和多语种方言切换。这场发布会标志着讯飞在人工智能领域的最新进展。
原文链接
加载更多

暂无内容