计算机视觉 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

CVPR 2026现场直击：CV与机器人的物理结界被彻底打破

【CVPR 2026丹佛直击：CV与机器人物理结界被打破！】6月3日至5日，CVPR 2026在美国丹佛举行。本届大会聚焦“多模态基础模型”与“具身智能”，标志着计算机视觉全面向真实物理世界进军。中国军团表现抢眼：高校论文接收Top10占8席，上交、浙大领跑；腾讯、阿里等大厂及新锐企业深度参展，构建全栈AI产业链。小鹏汽车与特斯拉同台论道；GigaBrain竞赛中，小米、清华等中国团队更史无前例地包揽四大赛道冠军！此外，大会首推F展厅真机演示，并在巴黎设平行会场，全球AI热潮持续破圈。

原文链接

幻彩逻辑RainbowLogic

06-05 19:24:24

分享至

打开微信扫一扫

内容投诉

生成图片

从「座上宾」到「主战场」：具身智能如何完成对计算机视觉的「范式夺权」？| CVPR 2026

标题：具身智能如何重塑计算机视觉？| CVPR 2026 正文：当机器从识别图像走向介入现实，视觉研究的边界也被重新划定。在CVPR 2026会场，满屏的机械臂抓取、足式机器人导航和物理模拟让人恍惚是否误入了机器人顶会ICRA或IROS。具身智能（Embodied AI）已不再是视觉领域的“边...

原文链接

AI思维矩阵

05-12 16:23:48

分享至

打开微信扫一扫

内容投诉

生成图片

“计算机视觉被GPT-4o终结了”（狗头）

近日，GPT-4o的原生多模态图像生成能力引发关注。通过自回归模型，它能够快速生成包括语义分割、深度图、PBR材质在内的多种图像类型，甚至能解析复杂的伪装图像，如NASA工程师测试特斯拉自动驾驶系统时使用的“隐形墙”。这一技术突破对计算机视觉、3D渲染及设计领域带来冲击，部分从业者担忧其可能取代传统工具和专业技能。尽管有观点认为类似效果可通过Stable Diffusion结合ControlNet实现，但GPT-4o的高效性和通用性仍令人瞩目。OpenAI未公开具体技术细节，但从现有线索推测，其采用多尺度自回归机制逐步完善图像生成。此外，有研究指出解码阶段可能结合扩散模型。此技术的出现标志着基础模型扩展应用领域的潜力巨大，具体影响还需进一步观察。

原文链接

E-Poet

03-29 17:49:47

分享至

打开微信扫一扫

内容投诉

生成图片

我在淘天做算法：十年拍立淘，一部视觉算法技术演变史

标题：十年拍立淘：一部视觉算法技术演变史在人类历史中，技术革命往往是产业升级的关键。计算机视觉技术的工作原理与人类视觉相似，但它依赖摄像头、数据和算法在短时间内完成任务。计算机视觉自上世纪60年代以来不断发展，从特征工程和传统机器学习方法到2012年深度学习的广泛应用，技术取得了重大突破。在淘天...

原文链接

AI奇点纪元

11-09 15:48:35

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁持续发力AI研发，24篇论文入选计算机视觉顶会CVPR2024

蚂蚁集团在2024年国际计算机视觉与模式识别会议(CVPR2024)上取得显著成就，24篇论文入选，其中一篇被重点推荐。会议于6月17日在西雅图举行，蚂蚁的研究涵盖计算机视觉、深度学习等领域，如创新的视频处理方法CoDeF。SkySense多模态遥感模型已在网商银行的卫星风控系统中应用，助力精准农业评估。此外，蚂蚁技术研究院的论文展示了AI的可靠性提升和经济性优化，如通过可学习提示的视觉语言模型蒸馏技术。国内高校和企业如清华大学等也积极参与，显示中国在生成式AI领域的积极布局。

原文链接

幻彩逻辑RainbowLogic

06-18 14:20:56

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多