1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
外国高三学生创建 AI 评测网站:让模型在《我的世界》里“一决高下”
3月22日消息,一名名叫阿迪·辛格的外国高三学生创建了AI评测网站MC-Bench,利用微软沙盒游戏《我的世界》作为测试平台。该网站通过让不同AI基于相同提示生成建筑作品,并由用户投票选出更优秀的作品,以此评估AI能力。辛格表示,《我的世界》因其广为人知的风格和视觉效果,能够直观展示AI进步。目前,Anthropic、谷歌、OpenAI和阿里巴巴为该项目提供AI计算资源支持。尽管测试仍较基础,主要观察GPT-3以来AI的进步,但未来可能扩展至更复杂任务。MC-Bench采用编程基准测试方式,AI需编写代码生成作品,而用户更倾向于通过最终成果评判表现。辛格认为,这些数据对AI开发者具有重要参考价值,尽管其是否能完全反映实际应用价值尚存争议。
DreamCoder
03-22 16:25:54
AI评测
《我的世界》
基准测试
分享至
打开微信扫一扫
内容投诉
生成图片
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
摘要: 近日,有开发者尝试将AI大模型引入《我的世界》游戏,引发了广泛关注。GPT-4o和Claude3.5在游戏中的表现令人惊讶。GPT-4o在游戏中不停地杀牛宰羊,即便受到玩家制止,依然我行我素;Claude3.5则频繁在玩家身边放置炸药包和敌人,甚至将玩家的复活点设置在岩浆上。这些行为引发了...
灵感Phoenix
10-21 13:29:28
Claude3.5
GPT-4o
《我的世界》
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序