
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月10日,XAI发布新一代基座大模型Grok 4,包括Grok 4和Grok 4 Heavy两个版本。中信证券研报指出,Grok 4在专业学科和复杂任务上展现出卓越推理能力,具备长流程专业工作的应用潜力,可支持Agent落地高价值场景。未来,其多模态能力有望突破,为行业带来全新应用场景,并推动AI基础设施与算力需求增长。研报建议关注相关投资机会,梳理三大主线:通用管理软件、工具软件及其他重点行业软件、AI基础设施,把握行业发展红利。
原文链接
标题:夸克AI超级框新增“拍照问夸克”功能,强化多模态能力
4月27日,夸克AI超级框推出全新AI相机,上线“拍照问夸克”功能。该功能依托强大的视觉理解与推理模型,从视觉角度创新下一代搜索体验,帮助用户更高效地解答物理世界中的各种问题。作为阿里巴巴旗下AI旗舰应用,夸克AI超级框不断迭代升级,致力于...
原文链接
4月27日,阿里旗下夸克AI超级框推出全新AI相机,新增“拍照问夸克”功能。该功能依托强大的视觉理解和推理模型,让用户可通过拍摄图片获取信息,支持多轮问答、图像处理及创作。无论是文物、商品还是外文资料,夸克均可秒级识别并提供最佳答案。
“拍照问夸克”整合了搜索、翻译、修图等功能,满足复杂任务需求。例如,旅行中可获取景点讲解,工作中能分析图表或生成文档,健康领域则提供体检报告解读和康复建议。此外,它还支持棋牌指导、截图找剧等娱乐功能。
自3月发布“AI超级框”以来,夸克持续优化多模态交互体验。数据显示,其用户活跃率和次日留存率均居行业首位。夸克搜索负责人张帆称,未来将通过AI超级框,深化用户与物理世界的互动方式,覆盖更多场景需求。
原文链接
消息称百度计划在3月中旬发布文心4.5模型,该版本将在推理和多模态能力上有所提升。文心4.5能处理和整合文本、视频、图像、音频等多种数据类型。百度CEO李彦宏表示,文心4.5将是百度迄今为止最强的模型,同时百度计划于6月30日将文心4.5系列正式开源。此举是在面对激烈市场竞争下的策略调整,此前百度曾坚持闭源路线。与此同时,阿里巴巴也宣布开源其视频和图像生成人工智能模型通义万相2.1,加剧了该领域的竞争。
原文链接
巨人网络AI实验室负责人丁超凡在近期举行的2024云栖大会上表示,游戏行业正从聚焦生产环节的降本增效转向玩法创新与体验升级。丁超凡介绍,巨人网络推出“AI残局挑战”玩法,这是业内首款基于多智能体AI原生游戏,AI玩家展现出高智慧行为,与市场上的AI陪伴类和AI NPC游戏有本质区别。该玩法依托巨人网...
原文链接
阿里国际AI团队发布多模态大模型Ovis,该模型在图像理解任务上表现出色,达到行业领先水平。Ovis具备处理多种类型数据的能力,包括文本、图像等,相较于大型语言模型,其优势在于同时处理非文本数据。在多项具体任务中,Ovis取得了SOTA(最新技术)表现,如数学推理问答、物体识别、文本提取及复杂任务决...
原文链接
国产多模态大模型已崭露头角,最新测评基准SuperCLUE-V显示,腾讯的hunyuan-vision与上海AI Lab的InternVL2-40B分别在闭源和开源领域领先,性能超越了Claude-3.5-Sonnet、谷歌的Gemini-1.5-Pro以及GPT-4-Turbo。尽管在某些指标上仍...
原文链接
蚂蚁集团在7月5日的世界人工智能大会上宣布,其自主研发的百灵大模型实现了原生多模态能力,能够理解并处理音频、视频、图像和文本等多种数据形式。这一突破使百灵大模型在中文理解和安全评测中表现出色,已应用于支付宝智能助理,并展现出在生活服务、医疗诊断等领域的广阔应用前景。蚂蚁集团展示了新升级的多模态技术在实际场景中的应用,如个性化搭配建议和医疗咨询。此外,他们还发布了“支付宝多模态医疗大模型”和与武汉大学合作的遥感模型SkySense的开源计划,预示着蚂蚁在多模态AI技术上的持续投入和产业发展实践。
原文链接
蚂蚁集团的百灵大模型升级,强化了多模态能力,使其能进行音、视、图、文理解与生成。这一技术将应用于支付宝智能助理,为用户提供涵盖8000多项生活服务,包括出行、健康、政务及金融领域。AI点单功能已测试中,支持星巴克等11家茶饮品牌。AI金融管家服务于4300万用户,提供个性化金融分析;AI就医助理则助力医疗机构全程服务患者。这一最新进展表明蚂蚁集团在AI智能领域的持续创新。#蚂蚁百灵大模型 #支付宝智能助理 #AI技术应用
原文链接
中国云从科技的从容大模型荣登全球多模态能力排行榜第三,仅次于GPT-4o和Claude3.5-Sonnet,领先国内其他模型。OpenCompass的评测体系采用多维度数据集,全面评估了模型在多个领域的表现,如目标检测、文本理解等。从容大模型在OCRBench上得分最高,展示了其在文本识别和视觉问答中的优势。该模型不仅刷新了多项世界纪录,还在视觉、跨模态领域有深厚积累。云从科技在大模型布局上表现出色,从基础模型到应用生态和智算中心,全面发力,并在交通、消费等领域取得了显著成果。通过与华为等的合作,他们提供了定制化的解决方案,推动了大模型在各行各业的落地。未来,大模型格局的定义需要重新考量,既要关注技术进步,也要重视落地能力和商业价值。
原文链接
加载更多

暂无内容