1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Llama惨遭抛弃!Meta内部改用Claude写代码
2025年7月,Meta内部开发团队被曝弃用自家Llama模型,改用Claude Sonnet编写代码。据Meta工程师透露,这一调整旨在提升工作效率,因Claude的代码能力显著优于Llama。自Llama 4发布以来,该系列模型饱受争议,包括差评、刷榜风波及内部文化问题。尽管Llama-4.1和4.2仍在开发中,但Meta新成立的MSL团队或将重塑品牌,开发下一代大模型。与此同时,Anthropic公司凭借Claude实现年化收入40亿美元,其编程工具Claude Code广受开发者好评,甚至有苹果开发者用其完成2万行代码项目。此外,Meta FAIR研究员朱泽园明确FAIR与GenAI、MSL独立运作,分别专注于长期研究、技术开发和产品开发。
像素宇宙
07-11 09:32:54
Claude
Llama
Meta
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 推 LlamaRL 强化学习框架:全异步分布设计,训练 AI 模型提速 10.7 倍
6月10日,Meta公司推出LlamaRL强化学习框架,采用全异步分布式设计,在405B参数模型上将强化学习步骤时间从635.8秒缩短至59.5秒,速度提升10.7倍。强化学习通过反馈调整输出,已成为大语言模型优化性能的关键部分。然而,其高资源需求一直是个难题。LlamaRL基于PyTorch构建,通过独立执行器并行处理生成、训练和奖励模型,大幅减少等待时间。该框架利用NVIDIA NVLink技术和分布式直接内存访问(DDMA),使405B参数模型权重同步仅需2秒。测试显示,LlamaRL在8B、70B和405B模型上的训练时间分别缩短至8.90秒、20.67秒和59.5秒,性能稳定甚至有所提升,解决了内存限制和GPU效率问题,为大语言模型训练提供了高效解决方案。
虚拟织梦者
06-11 16:14:21
LlamaRL
Meta
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
英伟达发布 Llama Nemotron Nano VL AI:高效精准,攻克复杂文档解析难题
6月4日,英伟达发布基于Llama 3.1架构的Llama Nemotron Nano VL视觉-语言模型,专攻文档级理解任务。该模型整合CRadioV2-H视觉编码器与Llama 3.1语言模型,支持长达16K上下文处理,适用于多图像和复杂文本解析。模型分三阶段训练:图文预训练、多模态指令微调及文本指令优化,借助Megatron-LLM框架和A100/H100 GPU集群完成。在OCRBench v2测试中,其在OCR、表格解析及图表推理等任务上表现出色,尤其在结构化数据提取上媲美大规模模型。Llama Nemotron Nano VL支持灵活部署,兼容服务器与边缘设备,并提供4-bit量化版本,显著提升推理效率。此模型为企业文档处理提供高效解决方案。
代码编织者
06-05 08:46:44
Llama Nemotron Nano VL
文档解析
视觉-语言模型
分享至
打开微信扫一扫
内容投诉
生成图片
Llama核心团队“大面积跑路”,14人中11人出走
近日,Meta AI团队面临严峻的人才流失问题,Llama模型创始团队14名核心成员中已有11人离职。其中5人加入法国AI创企Mistral,该公司由前Meta研究人员Guillaume Lample和Timothée Lacroix创立,他们曾主导Llama模型开发。Meta还因Llama 4模型性能争议及缺乏专用“推理”模型,面临竞争压力。DeepSeek和Qwen等开源模型快速崛起,进一步压缩了Meta的市场空间。此外,Meta内部领导层调整频繁,Joelle Pineau卸任FAIR负责人,由Robert Fergus接替。Meta虽投入数十亿美元,但在开源AI领域的优势地位正在减弱。
元界筑梦师
05-27 16:23:08
Llama模型
Meta
人才流失
分享至
打开微信扫一扫
内容投诉
生成图片
DOGE使用Meta Llama 2模型审查联邦工作人员邮件
据《科创板日报》23日报道,由埃隆·马斯克参与的美国政府效率部(DOGE)正在利用Meta开发的Llama 2模型,对联邦工作人员针对此前优化和裁员计划的回复邮件进行审查与分类。根据该计划,若员工回复‘辞职’,即可离职;拒绝者则可能被强制复工并面临更严格的工作要求。(来源:Wired)
智慧棱镜
05-23 14:55:00
DOGE
Meta Llama 2
联邦工作人员
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 推出激励计划助力初创企业采用其 Llama AI 模型,每月补贴高达 6000 美元
Meta 推出“Llama for Startups”计划,为符合条件的美国初创企业提供每月最高6000美元补贴,最长持续6个月。申请截止时间为5月30日,目标是推动生成式AI应用开发。入选企业可获Meta技术支持及资金援助,助其降低AI解决方案成本。此举旨在强化Meta在开源AI领域的竞争力,但面临DeepSeek、Qwen等对手挑战。此前,Meta的Llama模型因测试表现问题推迟新版本发布,并被指在基准测试中作弊。尽管如此,Meta对Llama寄予厚望,预计2025年其生成式AI产品将带来20亿至30亿美元收入,2035年达4600亿至1.4万亿美元。目前,Meta正加大投入,2024年GenAI预算超9亿美元,未来可能通过AI助手展示广告或提供付费订阅服务。
神经网络领航员
05-22 16:31:56
Llama AI
Meta
初创企业
分享至
打开微信扫一扫
内容投诉
生成图片
Ollama 上线自研多模态 AI 引擎:逐步摆脱 llama.cpp 框架依赖,本地推理性能飙升
5月17日消息,开源大语言模型服务工具Ollama推出自主研发的多模态AI定制引擎,逐步摆脱对llama.cpp框架的依赖。该引擎针对本地推理性能进行了优化,特别是在处理大图像生成大量token时表现优异。Ollama团队强调,其引擎采用golang独立开发,未直接借鉴llama.cpp的C++实现...
LunarCoder
05-17 15:06:57
Ollama
多模态AI引擎
本地推理
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体
Meta AI于5月9日推出开源工具LlamaFirewall,旨在保障AI智能体在生产环境中的安全性。当前,大型语言模型嵌入智能体后,其广泛应用带来了安全隐患,传统安全措施难以应对。LlamaFirewall针对提示注入攻击、行为偏差及代码生成风险设计,包含PromptGuard 2、AlignmentCheck和CodeShield三大模块。PromptGuard 2可实时检测越狱行为,轻量版适配低延迟场景;AlignmentCheck通过分析推理轨迹确保目标一致性;CodeShield则识别代码中的不安全模式。在AgentDojo基准测试中,LlamaFirewall显著降低了攻击成功率,同时保持较高实用性。此外,CodeShield在代码安全检测中表现优异,精准度达96%,响应时间适合生产应用。
代码编织者
05-09 14:52:36
AI安全
LlamaFirewall
Meta
分享至
打开微信扫一扫
内容投诉
生成图片
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
英伟达开源模型Llama-Nemotron系列超越DeepSeek-R1,成为目前性能最强的开源模型。该系列包括LN-Nano 8B、LN-Super 49B和LN-Ultra 253B,其中LN-Ultra不仅在推理吞吐量上超越DeepSeek-R1,还能在单个8xH100节点上高效运行。英伟达通过合成数据监督微调和强化学习技术提升模型推理能力,并采用神经架构搜索优化推理效率。LN-Ultra在GPQA-Diamond测试中取得最佳平衡,同时支持推理开关功能,满足多场景需求。研究团队还通过大规模强化学习和偏好优化显著提升了模型的指令跟随能力和泛化能力。该成果于2025年4月发布,为开源AI领域树立了新标杆。
新智燎原
05-06 17:56:45
DeepSeek-R1
Llama-Nemotron
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
近日,一篇题为《排行榜幻觉》的论文指出,大模型竞技场Chatbot Arena存在系统性问题。研究发现,Meta在Llama4发布前私下测试了27个版本,最终只公布最佳成绩,且少数大厂享有数据访问优势。此外,竞技场数据可显著提升模型性能,最高可达112%,但205个模型被静默弃用,远超官方公布的47个。研究团队建议改进规则以提高公平性。对此,Lmarena.ai回应称,排行榜反映真实用户偏好,但承认存在测试偏差。论文由多家学术机构及Cohere团队联合发布,呼吁不应仅依赖单一榜单评价模型。此争议引发行业反思,有人推荐OpenRouter作为替代方案。
量子思考者
05-02 13:58:59
Llama4
大模型竞技场
排行榜质疑
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序