
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
衡宇 白交 发自 川渝
量子位 | 公众号 QbitAI
眼看蛇年将至,杭州依旧充满活力。阿里通义Qwen今日凌晨4点发布了视觉理解模型Qwen2.5-VL,包含3B、7B和72B三个版本。Qwen...
原文链接
阿里通义千问于1月28日宣布开源全新视觉理解模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。该模型能识别物体、分析图像文本、理解长视频及捕捉事件。Qwen2.5-VL具备代理能力,可推理并使用工具,无需特定任务微调。在测试中,旗舰模型Qwen2.5-VL-72B-Instruct表现优异,涵盖多领域任务。较小模型Qwen2.5-VL-7B-Instruct在多项任务中超越GPT-4o-mini,Qwen2.5-VL-3B亦有出色表现。新模型增强对时空尺度感知,简化网络结构,提升效率。
原文链接
阿里云宣布第三轮大模型降价,通义千问视觉理解模型降价超80%,输入价格低至0.0015元/千tokens。此次降价被视为对字节跳动豆包视觉理解模型的回应,后者千tokens价格为3厘。自大模型浪潮兴起,厂商投入巨大,降价潮对资金实力较弱的企业冲击较大。此外,大模型企业通过巨额广告投放抢夺市场,如Kimi和豆包在三季度广告费用分别达1.5亿和2亿。尽管如此,提升用户留存仍是关键。互联网大厂如阿里和百度正寻求C端突围,阿里将通义App分拆并入智能信息事业群,百度则加强AI搜索布局。
原文链接
12月18日-19日,火山引擎FORCE原动力大会在上海举行,豆包视觉理解模型首次亮相并排名全球第二。该模型具备领先的内容识别、理解和推理能力,尤其在中文通用知识和文字识别方面表现突出。豆包视觉理解模型可识别图像中的物体、关系和场景,进行复杂推理,提取图片文本信息,并能细腻描述图像内容。此次大会还展示了豆包大模型家族的全面升级,包括音乐模型和文生图模型的新功能,以及豆包3D生成模型的首次亮相。
原文链接
火山引擎在12月18日的“2024火山引擎FORCE原动力大会·冬”上发布了豆包视觉理解模型,并升级了火山方舟、扣子和HiAgent三款平台产品。豆包大模型日均tokens使用量超4万亿,7个月内增长超33倍。全资子公司光云科技因获得“钻石级万有伙伴”称号,股价连续两日涨停。字节跳动旗下火山引擎和巨量引擎分别与多家A股上市公司合作,包括华宇软件、中科创达、乐鑫科技、光云科技等。巨量引擎整合多个平台流量资源,为广告主提供精准投放服务。
原文链接
12月20日,针对字节豆包视觉理解模型定价低于同行85%,火山引擎总裁谭待回应称,3厘/千tokens的价格仍能保持合理毛利。他认为,2B业务若毛利为负,规模越大亏损越多,商业模式不可行。字节通过技术优化(如算法预训练、工程错峰混部、P/D推理分离、硬件优化)实现低价。谭待强调,技术领先才能提供优质服务。(财联社)
原文链接
2024年12月18日,字节跳动在‘2024火山引擎FORCE原动力大会·冬’上发布豆包视觉理解模型。该模型每千tokens的输入价格为0.003元,比行业平均价格降低85%。中信证券认为,豆包·视觉理解模型在内容识别、理解和推理以及视觉描述方面表现优秀,低价格有望加速视觉处理在AI终端的应用。中信证券看好该模型带来的产业链投资机会。
原文链接
在12月19日的火山引擎Force大会上,字节跳动发布了豆包视觉理解模型,千tokens输入价格仅需3厘,相比行业价格便宜85%。抖音集团副总裁李亮表示,这并非价格战,而是通过技术创新降低成本,毛利仍然可观。此举旨在以更低的成本推动AI技术的普及和发展。豆包3D生成模型也首次亮相,结合火山引擎数字孪生平台veOmniverse,实现智能训练和数字资产制作。此外,豆包通用模型pro全面对标GPT-4,价格仅为后者1/8;音乐模型能生成3分钟完整作品;文生图模型2.1版本则能精准生成汉字和图像。
原文链接
字节跳动的豆包大模型及相关产品持续引发行业关注。在火山引擎Force大会上,字节跳动发布了豆包视觉理解模型、豆包3D生成模型及全面更新的豆包通用模型pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。豆包视觉理解模型的价格仅为0.003元/千tokens,比行业价格便宜85%。
火山引擎总裁...
原文链接
字节跳动豆包大模型日均tokens使用量超过4万亿,发布7个月增长超33倍。在火山引擎Force原动力大会上,豆包发布视觉理解模型,价格降至0.003元/千Tokens,比行业平均价低85%。新一代视频生成大模型将于明年1月发布。豆包视觉理解模型填补了“豆包全家桶”在视觉交互上的短板。西部证券指出,视觉能力是大模型的核心,将增加对NAND存储芯片需求。国盛证券认为,字节跳动有望成为AI眼镜产品核心玩家。随着视频大模型的推出,字节跳动的算力需求将进一步增大,可能需要更多英伟达H100 GPU。
原文链接
加载更多

暂无内容