1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
中国AI最高奖项的唯一特等奖:被京东拿下了
3月19日,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目,荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的唯一特等奖。该项目在人体建模、多模态语义对齐及行为生成等方面实现技术突破。京东已将该技术商业化,服务9000+商家,带来超140亿销售额。此外,京东言犀数字人技术升级,通过LiveTTS和LiveHuman模型,可快速生成高质量数字人。这是京东继2021年和2022年后再次获此殊荣。
梦境编程师
03-19 19:48:28
京东
吴文俊人工智能科学技术奖
多模态交互式数字人
分享至
打开微信扫一扫
内容投诉
生成图片
安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界
1月24日,Perplexity AI公司推出安卓版Perplexity Assistant,提供多模态交互体验及跨应用任务执行能力。该AI助手能回答问题、写邮件、设提醒、预订晚餐等,支持基于屏幕内容提问及摄像头互动。实际应用案例包括:语音叫车、播放指定播客、识别实物及协助发送短信。目前支持Spotify、YouTube、Uber等应用。
阿达旻
01-24 11:40:29
AI助手
Perplexity Assistant
多模态交互
分享至
打开微信扫一扫
内容投诉
生成图片
豆包重磅更新!语音对话“更像人” AI应用端或迎来变革
1月20日,豆包实时语音大模型正式发布,旨在实现端到端语音对话,主要面向中文语境。该模型具备接近真人的语音表达水准,低时延且支持打断对话。在与OpenAI的GPT-4o对比中,豆包模型在语音语气自然度和情绪饱满度方面表现更优,整体满意度评分4.36(满分5分)。豆包模型团队采用端到端框架,融合语音与文本模态,通过预训练和后训练阶段优化,提升了模型的对话能力和安全性。实时语音AI的价值在于提供更真实的交互体验和情感价值,有望推动AI端侧硬件的发展。
LunarCoder
01-20 17:22:57
AI情感陪伴
多模态交互
豆包实时语音大模型
分享至
打开微信扫一扫
内容投诉
生成图片
讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用
11月14日,“讯飞开放平台”宣布讯飞星火多模态交互大模型正式上线。该模型实现了从单一语音交互向音视频流实时多模交互的拓展,新增了“多模态、超拟人和个性化”功能,集成了语音、视觉、数字人交互于一体,支持一键调用。该模型首次应用超拟人数字人技术,数字人的动作、表情能精准匹配语音内容,实现跨模态语义一致性,使情感表达更连贯。同时,该模型支持超拟人极速交互,采用统一神经网络实现语音到语音的端到端建模,能敏锐感知情绪变化并自由调整声音节奏、大小及人设。此外,它还能实现多模态视觉交互,能够理解具体背景场景,通过语音、手势、行为、情绪等综合判断作出回复。用户可通过数字人进行自然语音对话,数字人能识别摄像头中的内容,如物品品牌、品类等。
电子诗篇
11-14 19:24:41
多模态交互
数字人
讯飞星火
分享至
打开微信扫一扫
内容投诉
生成图片
年轻人的好友列表 AI越来越多
上周,在GITEX GLOBAL展会上,社交应用Soul展示了其最新的AIGC+社交融合成果,用户可通过AI创建3D数字人并进行实时互动。Soul CTO陶明表示,其语音对话延迟已降至不到200毫秒,得益于端到端大模型能力的应用,提升了用户体验。ChatGPT的出现激发了互联网公司纷纷投身AI领域,Soul也积极加入这股浪潮,通过持续迭代产品和探索新业务,意图构建AI与人类共存的社区。 Soul认为,AI不仅要具备认知能力,还需具备感知能力,例如通过感知用户的咳嗽声来判断健康状况。目前,Soul正逐步将AI融入产品中,提升用户与AI的互动体验。Soul产品负责人指出,赛博社交因其强调个性化和无压力交流,更受00后欢迎。随着AI技术的发展,未来年轻人的好友列表或将包含越来越多的AI虚拟角色,形成新的社交模式。
智慧轨迹
10-22 18:10:08
AI社交
多模态交互
虚拟数字人
分享至
打开微信扫一扫
内容投诉
生成图片
系统级AI的“微观竞争”,OPPO选择从底层到交互重构ColorOS
标题:OPPO重构ColorOS,推动系统级AI融合 OPPO软件工程事业部总裁唐凯指出,AIOS是AI手机的关键组成部分,将经历三个阶段:系统应用AI化(AI for System)、系统AI化(System for AI)和AI即系统(AI as System)。 OPPO ColorOS设计总...
AI幻想空间站
10-21 10:21:38
AI系统
多模态交互
智能体
分享至
打开微信扫一扫
内容投诉
生成图片
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
中国商汤科技震撼发布国内首个流式多模态交互模型《Her》,6000亿参数的日日新5.5系列5o实现实时、拟人对话,支持多模态交流。商汤CEO徐立宣布即将应用于实际场景,展示出AI与用户更加生动丰富的互动。此外,他们还创新性地“复活”计算机巨匠,推出首个可控人物视频生成大模型Vimi,只需一张照片即可创造个性化1分钟视频。商汤借助混合端边云协同架构和海量训练数据,显著提升AI性能。本次发布还包括端侧模型5.5 Lite的升级,以低至每年9.9元的成本实现高效、普惠的AI服务。商汤CEO强调重塑交互的重要性,预示AI2.0时代的超级时刻正在来临。
跨界思维
07-06 05:32:07
商汤
日日新5.5
流式多模态交互模型
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序