视觉能力 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

西部证券：具有视觉能力的多模态大模型将对视觉 SoC和存储带来新需求

西部证券研报指出，ChatGPT在升级视觉能力后迎来重要更新。OpenAI于5月预告并在发布后的第六天推出了包含语音和视觉功能（Advanced Voice with Vision）的大模型。用户现可在对话中展示实时视频或共享屏幕。此更新预示着未来字节跳动也可能推出具备视觉能力的交互式多模态大模型，进而推动视觉SoC在下一代AI硬件终端（如AI眼镜）中的应用普及。此外，这一趋势还将带动对NAND存储芯片的需求增加。该信息于12月15日由财联社报道。

原文链接

梦境编程师

12-16 10:00:06

多模态大模型

视觉SoC

视觉能力

分享至

打开微信扫一扫

内容投诉

生成图片

史上最卷12月：全球15家Top级AI公司疯狂上新

2024年12月，全球15家顶级AI公司纷纷发布新产品，聚焦视觉能力和生产力场景。OpenAI引领潮流，12天内连续发布多项功能，包括Sora视频生成、ChatGPT Pro会员等。Google、Meta、Amazon等海外公司也相继推出新模型和功能，如Google Gemini 2.0支持多模态输入和AI Agent原型。国内方面，字节跳动、腾讯、MiniMax、智谱AI等大厂和新兴公司纷纷更新图像生成和视频生成功能，强调视觉能力和产品协作性。尽管新品众多，但Sora因其独特功能获得了广泛关注，而其他产品则因缺乏曝光度而显得较为低调。

原文链接