1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
悬赏5000刀!148局AI斗蛐蛐世界杯官方战报出炉,全球赛邀你接棒来战
正文:2026年3月5日,淘宝举办的‘AI斗蛐蛐’世界杯引发关注。该赛事将12个全球顶尖AI大模型置于统一Agent框架下,在12人局技能狼人杀场景中进行150局对抗,目前已完成148局。谷歌Gemini系列暂居前两名,阿里Qwen3-Max位列第三。评测维度包括投票准确率、神职技能效率、刀法精准度等,展现AI在复杂互动场景中的推理与博弈能力。基于此,WhoisSpy国际赛于3月1日至15日开放全球开发者参与,提供更宽松规则和实时复盘支持,优胜者最高可获5000美元奖励。官网:
虚拟微光
03-05 15:24:51
AI斗蛐蛐
WhoisSpy国际赛
狼人杀
分享至
打开微信扫一扫
内容投诉
生成图片
AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背
2025年12月23日,淘宝主办的首届「高校生VS开发者对抗赛」正在火热进行中,比赛基于AI狼人杀平台WhoisSpy.ai展开。参赛选手通过训练自己的AI Agent,在经典的12人狼王守卫版型中对决,争夺智慧与演技兼备的“狼王”称号。赛事分为练习赛(12月10日-23日)和正式赛(12月24日-31日),优胜者可获得丰厚奖金及阿里巴巴淘天集团实习机会。平台支持实时对战,Agent需在限时内完成发言,比赛规则严格限制发言字数与时间。目前已有七百多位选手参与,六千多场练习赛展开,部分选手表现亮眼,狼人胜率逼近100%。WhoisSpy.ai还提供大模型评测榜单,Claude-Sonnet-4.5、GPT-5等名列前茅。参赛者可通过官方指南轻松创建并优化专属Agent,体验AI博弈乐趣。
幻彩逻辑RainbowLogic
12-23 14:42:45
Agent
AI狼人杀
WhoisSpy.ai
分享至
打开微信扫一扫
内容投诉
生成图片
7个AI玩狼人杀,GPT-5获断崖式MVP,Kimi手段激进
在最近的一项基准测试中,7个AI模型进行了210场狼人杀游戏,GPT-5以96.7%的胜率断崖式领先,展现卓越的操纵与防御能力。国产模型Qwen3和Kimi-K2分别位列第4和第6,其中Kimi-K2表现出大胆激进的风格,甚至通过‘悍跳’扭转局势。测试通过Elo评分和多项指标量化模型表现,揭示了强弱模型间的显著差异。此外,GPT-5在其他基准测试中也大幅超越GPT-4,例如在Level 5 MATH上得分从23%提升至98%。研究指出,该测试不仅评估AI解决逻辑问题的能力,还探索其在社交动态中的行为模式,为未来复杂社会互动模拟奠定基础。目前,团队正寻求合作以扩展研究规模。
智慧轨迹
09-02 17:34:44
GPT-5
Kimi-K2
狼人杀
分享至
打开微信扫一扫
内容投诉
生成图片
一场「狼人杀」,考倒了一堆大模型
标题:一场「狼人杀」,考倒了一堆大模型 人工智能越来越像人,但“像人”究竟意味着什么?除了会解题、写文,它能否理解人类个性化的推理方式?比如在狼人杀中,有人逻辑缜密,有人直觉敏锐,有人擅长伪装。AI能跟上这种风格差异吗? 南开大学与上海AI lab等机构设计了一个名为InMind的评测框架,...
LunarCoder
08-28 14:28:50
大模型
推理风格
狼人杀
分享至
打开微信扫一扫
内容投诉
生成图片
不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵
2025年6月30日至7月4日,淘天集团在北京、杭州两地同步举办第四届“硬核少年技术节”。本届技术节分为AI展示场、AI交流场、AI开放场和AI比赛场,形式新颖且贴近实际应用。在AI展示场中,淘天展示了AIGX技术体系近40项成果,并与爱橙科技联合开源强化学习训练框架ROLL。AIGR方向披露了百亿参数推荐大模型RecGPT已接入手机淘宝首屏“猜你喜欢”,实现用户点击量两位数增长。AI交流场“博见社”聚焦“多模态智能”主题,邀请学界及工业界专家进行分享。AI比赛场则设有AI Hackathon 3.0和别开生面的AI狼人杀,参赛者需训练AI Agent参与博弈对抗。淘天通过技术节展现了其AI技术落地、实用主义的技术美学以及年轻技术人的创造力与匠心精神。
DreamCoder
07-01 12:22:28
AIGX技术体系
AI狼人杀
淘天技术节
分享至
打开微信扫一扫
内容投诉
生成图片
“AI 版狼人杀”:开发者搭建平台让多个大语言模型展开社交推理博弈
开发者Guzus搭建了一个平台,让多个AI语言模型参与经典社交推理游戏“Mafia”(狼人杀)。用户可查看每局游戏的胜负结果及完整对话记录。Claude 3.7 Sonnet在游戏中的胜率惊人,Mafia角色达到100%,作为村民胜率为45%。该游戏规则简单,村民需找出Mafia成员,夜晚医生保护村民,Mafia则暗中杀害。AI之间的社交博弈充满戏剧性,部分模型甚至公开身份,展示出独特的策略。Guzus计划开放Github代码仓库,未来可能支持本地AI模型。该项目目前依赖Openrouter API。
跨界思维
03-08 19:03:13
ai
狼人杀
社交推理
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序