综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月18日,科技媒体testingcatalog报道,Anthropic旗下Claude的“任务模式”进入功能验证阶段,目标打造全能型AI智能体。新版界面采用双面板布局,右侧面板展示上下文文件,左侧动态呈现任务执行流,实现全程可视化。Claude在处理复杂需求时生成结构化“行动计划”,模糊指令会触发“澄清性提问”。用户可随时修改计划或补充信息,确保结果符合预期。系统集成多种“技能”与“模型上下文协议”,自动调用工具完成任务。所有生成产物归档至“工件”标签页,形成闭环工作流。业内认为,此次更新意在争夺Google NotebookLM用户群体,可能于12月内面向公众开放。
原文链接
Claude团队发布开源LLM思维可视化工具“电路追踪”,帮助解析大模型的内部工作原理。该工具通过生成归因图,直观展示模型处理信息的路径。研究人员能通过干预节点验证模型行为,揭示各节点功能分工。目前,该工具已在GitHub收获400+星标,受到Reddit和X平台热议。Anthropic CEO表示,此举旨在推动AI内部机制的研究。用户可通过Neuronpedia或Colab快速生成归因图,探索模型行为。案例显示,干预特定节点可显著改变模型输出,验证了归因图的有效性。此外,多语言电路测试表明模型具有跨语言处理能力,但某些干预效果受限。工具已在GitHub开源,欢迎开发者进一步研究。
原文链接
Claude团队开源LLM思维可视化工具“电路追踪”
西风 | 凹非寺量子位 | QbitAI
Claude团队推出“电路追踪”工具,帮助用户读懂大模型的“脑回路”。该工具通过生成归因图,可视化LLM内部超节点及其连接关系,呈现模型处理信息的路径。研究人员可通过干预节点激活值,验证各节点功能...
原文链接
Google推出Gemini 2.5 Pro(I/O版)新模型,提前于即将召开的I/O大会发布。该版本在WebDev Arena中代码能力测试中击败Claude 3.7 Sonnet登顶,提升幅度达147分。新模型不仅强化了代码能力,还实现了视频转可视化网页的功能,在VideoMME基准测试中得分84.8%。用户可通过YouTube链接输入视频生成代码,但目前官网上传视频功能存在Bug。尽管产品仍需优化,如命名混乱及交互问题,但模型实力已显,或将引领新开发范式。未来表现如何,静待I/O大会揭晓。
原文链接
2月14日,微软Microsoft Research团队推出Data Formulator,革新数据可视化方式。该工具采用"概念绑定"范式,让用户能将数据"概念"直接绑定至可视化通道,无需繁琐的数据转换。用户可通过自然语言提示或示例输入创建新概念,并由AI后端推断必要转换,生成可视化结果。用户测试显示,参与者平均用20分钟完成任务。Data Formulator有望解决长久以来的数据转换难题,推动下一代可视化工具的发展。
原文链接
10月25日,科技媒体NeoWin报道,Anthropic公司发布了Claude 3.5 Haiku版本,并推出了一款新的数据分析工具。这款工具允许用户编写和运行JavaScript代码,处理CSV文件中的数据,进行分析并生成实时洞察。作为Claude.ai的内置功能,该工具能自动清理、探索和分析数据,提供精确且可重复的结果。此外,该工具还能与Artifacts结合,创建互动数据可视化。Anthropic团队指出,此工具适用于多个场景,如市场营销、销售、产品管理、工程和财务管理,具体包括改善客户转化率、绩效分析、开发优先级指导及财务趋势展示等。目前,该功能已在Claude.ai中进行预览,用户可随时启用或禁用。
原文链接
加载更多
暂无内容