综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:10月22日,阿里通义千问宣布Qwen3-VL家族新增2B与32B两个密集模型尺寸,覆盖视觉语言理解场景。官方称,新模型可在手机运行,适合开发者使用。此次提供Instruct和Thinking两种版本:Instruct响应快、执行稳,适合对话与工具调用;Thinking强化复杂推理与视觉理解,擅长高难度任务。Qwen3-VL-32B在STEM、VQA、OCR等领域表现优于GPT-5 mini和Claude 4 Sonnet,仅32B参数媲美235B模型。Qwen3-VL-2B体积小,能在端侧设备运行,便于实验与部署。体验地址:ModelScope和Hugging Face。
原文链接
近日,Nature发表的一项研究指出,多个大型语言模型(LLM)在“人类亲吻难题”中表现不佳,无法进行有效的推理。研究者对包括GPT-4、Llama2、Gemini和Bard在内的7个先进模型进行了测试,结果显示这些模型在语言理解和推理能力上存在显著缺陷,无法与人类表现媲美。研究发现,尽管LLM能生成流畅的文本,但在处理复杂语言结构时表现出较大的不稳定性。研究者认为,这些模型更接近工具而非科学理论,因为它们缺乏对语言的真正理解能力,无法进行稳定的推理。这项研究质疑了LLM在语言任务中的类人能力,表明它们在理解和推理方面仍需改进。
原文链接
近日,Nature 发表的一项研究指出,现有的大语言模型(LLM)在解决“人类亲吻难题”时表现不佳,包括 GPT-4、Llama2、Gemini 和 Bard 在内的 7 个大模型均未能通过测试。研究者通过一组理解性问题,评估了这些模型在语言理解和推理方面的能力,结果显示,模型的准确性和稳定性远低于人类水平。研究者认为,这些模型缺乏对语言的真正理解,更接近工具而非科学理论。此次研究揭示了当前大模型在语言理解任务中的局限性,强调了其与人类认知能力的本质差异。该研究不仅质疑了大模型的类人推理能力,还提醒人们在实际应用中需谨慎对待这些模型的输出。
原文链接
11月15日,最高人民法院发布“法信基座大模型”,这是国家级法律AI基础设施。该模型基于海量、权威、高质量法律大数据进行训练和增强训练,具备强大的法律语言理解和文本生成能力。它能理解非专业化的法律诉求,并给出专业的建议,包括和解、调解、应诉等策略,从而降低公共法律服务的门槛。此外,该模型还能帮助法官从电子卷宗中快速提取关键信息,提升立案审查和阅卷效率。这一技术进步有助于推动法律服务更加普及和高效。
原文链接
如何设计一个大模型产品?
一、OpenAI的产品化探索
传统自然语言处理:理解语句结构和语义,依赖人的先验知识。任务如文本摘要、情感分析基于此展开。
推理能力的提升:以GPT-4为代表,模型具备推理能力,实现自然语言理解的重大突破。然而,产品化初期,OpenAI的产品(如ChatGPT和GPTs)...
原文链接
MIT最新研究揭示,大型语言模型不仅具有强大的学习能力,而且能够对现实世界形成独特的理解。在一项研究中,研究人员发现随着模型能力的增强,其对现实世界的理解不仅仅是简单的数据模仿,而是能够自主模拟某些概念,从而促进对语言和世界的深入理解。这项突破性的研究,标志着大模型在未来有可能更深层次地理解语言与现...
原文链接
加载更多
暂无内容