1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI 导致维基百科人类访问量显著下降,运营方疾呼“危险”
2025年10月17日,维基媒体基金会警告称,AI技术导致维基百科人类访问量显著下降,过去几个月页面浏览量同比减少8%。运营方表示,生成式AI聊天机器人和搜索引擎通过总结内容分流了流量,威胁到平台的长期可持续发展。维基媒体基金会高级总监Marshall Miller指出,虽然AI模型普遍依赖维基百科数据进行训练,但访问量下降可能削弱志愿者贡献和内容更新速度,同时影响个人捐赠支持。他呼吁用户支持人工整理的知识,强调查看原始来源和传播可信信息的重要性,以应对AI对信息获取方式的深远影响。
数据炼金师
10-17 16:22:38
AI模型训练
维基百科
访问量下降
分享至
打开微信扫一扫
内容投诉
生成图片
微软旗下领英:将默认使用用户数据训练AI模型!
微软旗下领英宣布,从2025年11月3日起将默认使用用户数据训练AI模型,以优化算法和改进AI功能。此次训练涵盖所有用户,包括欧洲经济区、英国和瑞士的用户。领英将利用公开资料和帖子数据,用于如“使用AI重写”等功能,但私人消息或帖子不会被使用。值得注意的是,生成式AI改进功能默认开启,用户需手动关闭相关设置以避免数据被使用。关闭步骤为:进入设置>数据隐私>生成式AI改进,关闭对应开关。此政策引发用户对隐私的关注,用户可自行选择是否参与数据训练。
未来笔触
09-24 15:47:40
AI模型训练
用户数据
领英
分享至
打开微信扫一扫
内容投诉
生成图片
中文互联网基础语料 3.0 发布:数据量为 120GB,助力大模型训练与 AI 发展
9月18日,在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0正式发布。该版本数据量达120GB,由中央网信办指导,中国网络空间安全协会联合国家互联网应急中心等单位共同打造。语料经过严格筛选、过滤和去重,覆盖更多优质中文网站信源,并强化了违法不良信息的过滤能力,为大模型训练与AI发展提供可信数据支持。网安协会表示,这是各界协同共建高质量中文语料的重要成果,未来将持续加强语料建设,助力人工智能技术创新与产业发展。
未来编码者
09-18 15:56:52
中文互联网基础语料
人工智能发展
大模型训练
分享至
打开微信扫一扫
内容投诉
生成图片
腾讯混元游戏 2.0 发布:图片秒变动画 / CG,全面开放使用
9月5日,腾讯发布“混元游戏”2.0版本,新增图生视频、自定义模型训练和角色一键精修等功能,大幅提升2D生图与文生图能力,达到行业领先水平。平台全面开放使用,用户可通过官网体验。新功能支持静态图片秒变动画,适用于游戏角色展示、特效预览等场景,并提供风格定制化与细节优化工具,助力游戏美术设计提效。自定义模型训练允许用户通过少量图片微调专属LoRA模型,简化风格统一难题。角色精修功能提供高一致性与高创意性模式,满足不同优化需求。此次升级还强化了游戏特效生成能力,覆盖技能图标、环境特效等专项优化,进一步推动AIGC在游戏领域的应用。
蝶舞CyberSwirl
09-05 17:21:54
图生视频
腾讯混元游戏
自定义模型训练
分享至
打开微信扫一扫
内容投诉
生成图片
国务院:加快研究更加高效的模型训练和推理方法
8月26日,国务院发布《关于深入实施“人工智能+”行动的意见》,提出提升模型基础能力的多项措施。意见强调加强人工智能基础理论研究,支持多路径技术探索与架构创新,并加快研发更高效的模型训练和推理方法,推动理论、技术与工程创新协同发展。同时,探索模型应用新形态,优化复杂任务处理能力和交互体验,并建立健全模型能力评估体系,以促进模型能力持续迭代提升。
镜像现实MirageX
08-26 17:56:47
人工智能
技术创新
模型训练
分享至
打开微信扫一扫
内容投诉
生成图片
国家数据局:国内多数AI模型训练使用的中文数据占比已超60%
财联社8月21日电,国家数据局最新数据显示,国内多数AI模型训练中使用的中文数据占比已超60%,部分模型甚至达到80%。这表明中文高质量数据的开发与供给能力显著增强,为我国人工智能模型性能的快速提升提供了有力支撑。这一进展凸显了我国在AI领域的技术进步和数据资源优势,也为未来人工智能产业的进一步发展奠定了坚实基础。
AGI探路者
08-21 15:37:53
AI模型训练
中文数据
国家数据局
分享至
打开微信扫一扫
内容投诉
生成图片
我国多数模型使用的中文数据占比超 60%,部分已达 80%
8月14日,国务院新闻办举行‘高质量完成“十四五”规划’发布会。国家数据局局长刘烈宏表示,我国多数人工智能模型使用的中文数据占比已超60%,部分达80%,性能快速提升。截至6月底,各地高质量数据集累计交易额近40亿元,上海、天津、安徽等地试点数据作价入股新模式。国家数据局将推进高质量数据集建设,重点布局具身智能、低空经济、生物制造等领域,并培育为优质数据买单的市场环境。
虚拟织梦者
08-14 11:52:44
中文数据
模型训练
高质量数据集
分享至
打开微信扫一扫
内容投诉
生成图片
亚马逊 AWS 展示 Project Rainier 分布式集群,有望成为最强 AI 模型训练计算机
7月14日,亚马逊AWS发布介绍其分布式集群Project Rainier,该项目有望成为全球最强AI模型训练计算机。Project Rainier基于Annapurna Labs开发的Trainium2芯片,每个服务器配备16颗芯片,每4个服务器组成一个UltraServer,数以万计的UltraServer通过NeuronLinks和Elastic Fabric Adapter技术互联,构成超级集群。该系统分布于美国多个数据中心,具备跨中心协作能力。Anthropic将利用Project Rainier训练下一代Claude模型,其算力可达Anthropic当前最大训练集群的五倍,为AI模型研发提供强大支持。
心智奇点
07-14 12:19:57
AI模型训练
Project Rainier
Trainium2
分享至
打开微信扫一扫
内容投诉
生成图片
7B模型对标GPT-4o,全球首个医疗代码生成大模型训练平台来了
2025年7月,埃默里大学、佐治亚理工学院等联合发布全球首个医疗代码生成大模型训练平台MedAgentGym。该平台整合72,413个真实医疗编程任务,覆盖电子健康记录查询、生物信息学建模等四大领域,并提供容器化隔离环境与交互式反馈机制。基于此平台开发的开源模型Med-Copilot-7B通过两阶段训练后,在多项医疗编程任务上性能接近GPT-4o,达到59.90分。研究团队还引入AI验证器,显著提升模型成功率至42%,为未来医疗AI发展奠定基础。论文及代码已公开,项目有望加速医疗AI普惠化进程。
AGI探路者
07-13 13:05:04
MedAgentGym
医疗代码生成
大模型训练平台
分享至
打开微信扫一扫
内容投诉
生成图片
为训练 AI 模型 Claude,Anthropic 耗资数百万美元购入并“销毁”巨量图书
6月26日,据外媒报道,人工智能公司Anthropic为训练AI模型Claude,耗资数百万美元购入并销毁大量实体图书,将书籍拆解、扫描后丢弃原件。法庭文件显示,公司曾雇佣前Google Books项目负责人Tom Turvey,试图复制谷歌的图书数字化模式。法官William Alsup裁定该行为构成合理使用,因图书已合法购买、扫描后即刻销毁,且数字文件仅限内部使用。AI训练需要海量优质文本,而书籍相比网络内容更具质量优势。Anthropic最初尝试绕过版权,后转向购买二手书进行破坏式扫描,以规避法律风险。
WisdomTrail
06-26 07:54:56
AI模型训练
合理使用
图书销毁
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序