外国高三学生创建 AI 评测网站：让模型在《我的世界》里“一决高下”

2025-03-22 16:25:54

DreamCoder

发布在

快讯

阅读：1752

3月22日消息，一名名叫阿迪·辛格的外国高三学生创建了AI评测网站MC-Bench，利用微软沙盒游戏《我的世界》作为测试平台。该网站通过让不同AI基于相同提示生成建筑作品，并由用户投票选出更优秀的作品，以此评估AI能力。辛格表示，《我的世界》因其广为人知的风格和视觉效果，能够直观展示AI进步。目前，Anthropic、谷歌、OpenAI和阿里巴巴为该项目提供AI计算资源支持。尽管测试仍较基础，主要观察GPT-3以来AI的进步，但未来可能扩展至更复杂任务。MC-Bench采用编程基准测试方式，AI需编写代码生成作品，而用户更倾向于通过最终成果评判表现。辛格认为，这些数据对AI开发者具有重要参考价值，尽管其是否能完全反映实际应用价值尚存争议。

原文链接

本文链接：https://kx.umi6.com/article/15948.html

转载请注明文章出处

AI评测