
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
西部证券研报指出,ChatGPT在升级视觉能力后迎来重要更新。OpenAI于5月预告并在发布后的第六天推出了包含语音和视觉功能(Advanced Voice with Vision)的大模型。用户现可在对话中展示实时视频或共享屏幕。此更新预示着未来字节跳动也可能推出具备视觉能力的交互式多模态大模型,进而推动视觉SoC在下一代AI硬件终端(如AI眼镜)中的应用普及。此外,这一趋势还将带动对NAND存储芯片的需求增加。该信息于12月15日由财联社报道。
原文链接
2024年12月,全球15家顶级AI公司纷纷发布新产品,聚焦视觉能力和生产力场景。OpenAI引领潮流,12天内连续发布多项功能,包括Sora视频生成、ChatGPT Pro会员等。Google、Meta、Amazon等海外公司也相继推出新模型和功能,如Google Gemini 2.0支持多模态输入和AI Agent原型。国内方面,字节跳动、腾讯、MiniMax、智谱AI等大厂和新兴公司纷纷更新图像生成和视频生成功能,强调视觉能力和产品协作性。尽管新品众多,但Sora因其独特功能获得了广泛关注,而其他产品则因缺乏曝光度而显得较为低调。
原文链接
加载更多

暂无内容