1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
微软官宣Windows 11重大升级!获得“对话式”语音输入
2025年10月17日,微软宣布在Windows 11中测试一系列AI功能。新升级包括Copilot Voice语音交互,用户可通过“嘿,Copilot”唤醒词或快捷键与AI助手对话,需麦克风和网络支持。此外,Copilot Vision功能全面上线,可识别用户屏幕内容并提供上下文支持。微软还新增“文本输入,文本输出”选项,丰富Vision会话方式。即将推出的Copilot Actions功能将支持代表用户执行操作,如打开本地文件。微软强调,语音功能旨在补充键盘和鼠标,而非取代。此次升级展现了微软在AI集成领域的进一步探索,为用户提供更自然、智能的交互体验。
数据炼金师
10-17 11:14:27
Copilot
Windows 11
语音交互
分享至
打开微信扫一扫
内容投诉
生成图片
智元正式推出新一代工业级交互式具身作业机器人精灵G2
10月16日,智元机器人正式发布新一代工业级交互式具身作业机器人精灵G2。该机器人配备高性能关节执行器、多种传感器及AI计算平台,具备全场景避障与高精度力控能力,并支持多人实时智能交互和个性化内容讲解。依托智元自研的GO-1与GE-1大模型,其复杂任务处理能力显著提升。借助英伟达Jetson Thor T5000平台,本地算力达2070 TFLOPS,数据延迟低于10毫秒,实现高效实时响应。由均普智能制造的精灵G2今日下午将在宁波举行下线仪式。(记者 李佳怡)
AI奇点纪元
10-16 11:56:00
实时响应
工业级交互
智元机器人
分享至
打开微信扫一扫
内容投诉
生成图片
Sora2不够香了!国产AI视频模型已能边看边生成,生成快还互动佳
2025年10月,百度蒸汽机模型推出重大升级,率先实现AI视频的实时流式生成与交互功能。用户只需上传一张图片和简单指令,即可生成高质量长视频,并支持随时暂停、修改与续写,打破传统生成时长限制。此次更新采用自回归扩散模型等技术,解决了生成效率与成本问题,推理延迟几乎实时。从5月登顶VBench-I2V榜单,到10月迈入实时交互时代,百度蒸汽机在短短5个月内完成了从图生视频到音画一体生成的技术演进。新功能不仅降低创作门槛,还推动AI视频能力向教育、影视等领域扩展,标志着AI内容创作从单向输出转向共创时代。
像素宇宙
10-15 19:39:58
AI视频生成
实时交互
百度蒸汽机
分享至
打开微信扫一扫
内容投诉
生成图片
行业首次 百度蒸汽机实现AI长视频实时交互
10月15日,百度宣布其视频生成模型“百度蒸汽机”(文心专精)完成重大升级。此次升级突破了传统AI视频生成时长限制,行业首次实现AI长视频实时交互生成,生成速度超越国内主流模型。用户只需上传单张图片与提示词即可启动视频生成,并实时预览全部推理内容。在生成过程中,用户可随时暂停或修改提示词,动态调整视频剧情、画面及转场效果,实现全程干预。这一创新技术为视频创作提供了更高自由度和效率,展现了AI在长视频领域的全新可能性。
蝶舞CyberSwirl
10-15 17:40:35
AI长视频
实时交互
百度蒸汽机
分享至
打开微信扫一扫
内容投诉
生成图片
vivo 蓝心语言大模型升级,蓝心小 V 支持深度思考、无唤醒词交互
2025年10月10日,在vivo开发者大会上,vivo发布蓝心语言大模型的升级版本。新模型重构意图中控,提升了复杂任务拆解和个性化交互能力,并支持长期记忆功能。蓝心小V新增深度思考能力,可提供高质量智能问答服务,同时具备生成数千字报告的功能。语音交互方面实现无需唤醒词的全双工操作,支持聆听与响应并行,音色更拟人化。此外,同声传译拾音距离扩展至3米,新增声音记忆功能,可识别说话者身份、语气和情绪,支持自然打断,带来更流畅的语音对话体验。
阿达旻
10-11 10:02:45
无唤醒词交互
深度思考
蓝心小V
分享至
打开微信扫一扫
内容投诉
生成图片
不到 5 天下载破 100 万次:“AI 版抖音” Sora 蹿红,增速超 OpenAI 现象级产品 ChatGPT
10月9日,OpenAI旗下Sora应用负责人Bill Peebles宣布,该应用上线不到5天下载量突破100万次,增速超越现象级产品ChatGPT。目前,Sora位列苹果App Store免费应用排行榜第一。尽管仍为邀请制且仅对美国和加拿大用户开放,其表现已引发广泛关注。Sora被称为“AI版抖音”,核心功能是通过上传真人短视频素材(称为“cameo”),结合AI提示词生成全新视频内容,支持写实、电影感及动漫等多种风格,并同步生成音频。应用强调社交属性,旨在促进朋友间互动创作,信息流基于用户关注与互动对象展示。Sora依托OpenAI的Sora 2视频生成模型,技术能力强大,音画同步效果出色。
梦境编程师
10-11 09:54:38
AI视频生成
Sora
社交互动
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作
10月8日,谷歌发布全新AI模型“Gemini 2.5 Computer Use”,专为浏览器交互设计,支持13种操作,如填写表单、打开网页等。该模型利用视觉理解与推理能力,可在人用界面中执行任务,适用于用户界面测试或无API系统的操作。谷歌称其在多项基准测试中优于现有方案,并开放了在线演示功能,包括玩2048游戏和浏览Hacker News讨论。与ChatGPT智能体等工具不同,该模型仅限于浏览器环境,尚未支持桌面系统层级的控制。此次发布恰逢OpenAI推出ChatGPT新应用次日,AI领域的竞争进一步升温。
AI幻想空间站
10-09 09:08:03
AI模型
Gemini 2.5 Computer Use
浏览器交互
分享至
打开微信扫一扫
内容投诉
生成图片
华为模型交互专利公布
9月23日,华为技术有限公司申请的“一种模型交互方法、装置、电子设备及交互系统”专利公布。该专利涉及人工智能领域,旨在通过AI模型提前预判用户需求并主动输出答案,减少用户与设备的交互次数,提升效率。具体实现方式为:电子设备基于已显示内容及相关信息,主动提供预期解决方案,无需等待用户详细描述问题,从而简化交互过程,缩短响应时间。这一技术可更快捷、直观地预测用户需求,提高大模型使用的便捷性与用户满意度。
智慧棱镜
09-23 17:25:39
人工智能
华为
模型交互
分享至
打开微信扫一扫
内容投诉
生成图片
亿道信息:公司人工智能机器人领域相关产品收入占比较小
9月23日,亿道信息在互动平台表示,公司目前在人工智能机器人领域的相关产品主要包括智能音箱、AIoT智能家居中控和教育小机器人等,主要通过语音或传感器交互实现功能。但该领域相关收入占比较小,对公司整体业绩影响有限。这一回应明确了公司在AI机器人市场的现阶段布局及实际贡献,展现出业务尚处于初步发展阶段。
数字墨迹
09-23 13:17:38
人工智能机器人
亿道信息
语音交互
分享至
打开微信扫一扫
内容投诉
生成图片
把上万个AI丢在一个小镇里打工,会发生什么?
标题:上万个AI在虚拟小镇打工,会发生什么? 这个夏天,上万名网友在网络上当起了“赛博上帝”。既然现实无法重启,大家便在虚拟小镇中探索另一种可能性。 两年前,斯坦福大学的研究团队曾构建一个由25个AI居民组成的虚拟小镇,如今这一设想已进化得更加复杂和庞大。香港科技大学推出的实验项目“Aiviliza...
虚拟微光
09-21 08:40:39
AI小镇
人工智能交互
虚拟社会
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序