综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月15日,OpenAI低调推出“ChatGPT Translate”功能,为用户提供独立翻译界面。该功能支持文本、语音、图片及文件等多种输入方式,可自动识别语言或手动指定翻译方向,侧重语义还原而非逐词转换。用户还可调整译文风格,如口语化、正式或学术化表达,并围绕译文展开对话。ChatGPT翻译支持50多种语言互译,注重语气、习语和语境理解,适用于工作、学习和旅行场景。目前,该功能已免费向所有用户开放,可通过chatgpt.com/translate访问。这一新功能体现了OpenAI强化普通用户产品布局的战略方向。
原文链接
2025年12月24日,MiniMax发布M2.1版本,其多语言编程能力实现重大突破,尤其在后端语言(如Go)、原生应用开发(Android、iOS)及跨平台协作方面表现优异。实测显示,M2.1生成的代码不仅语法精准,还符合各语言社区的最佳实践,例如Go语言惯用法、Kotlin协程使用、React+TypeScript前端开发等。此外,其跨语言架构对齐能力显著提升,可在不同技术栈间无缝迁移逻辑,如将Go的JWT中间件重构为Swift的AuthManager。官方数据显示,M2.1在多任务和多语言基准测试中超越Claude Sonnet 4.5等模型,性能接近行业顶尖水平。此次升级标志着MiniMax从“高性价比”向“深度专业生产力”迈进,成为开发者信赖的通用开发助手。
原文链接
2025年12月,MiniMax发布旗舰级Coding & Agent模型M2.1,以10B激活参数在Multi-SWE-bench榜单中取得49.4%的成绩,超越Claude Sonnet 4.5等竞品,拿下多语言编程SOTA。M2.1解决了以往模型在后端开发和底层逻辑上的“偏科”问题,显著提升Rust、Java、C++等语言能力,并强化移动端开发支持。通过引入Interleaved Thinking,模型兼顾代码执行与复合指令整合。实测显示,M2.1可高效完成H5小游戏开发、Python代码迁移及复杂后端任务如权限设计体系,生成1700行代码仅需两句话。此外,MiniMax构建开源测试基准VIBE,验证其在Web、Android、iOS等领域的能力。此次发布正值港交所聆讯通过之际,展现了MiniMax在AI研发与应用上的硬核实力。
原文链接
12月15日,阿里通义发布两款‘百聆’语音模型升级版并开源。Fun-CosyVoice3支持3秒录音即可克隆音色,切换9种语言、18种方言及多种情感,首包延迟降低50%,中英混说准确率提升显著。Fun-ASR增强噪声场景识别率达93%,支持31种语言自由混说与歌词识别。两模型均支持本地部署与二次开发,适用于语音助手、直播配音等实时场景。开源地址已公布,供开发者体验与定制化微调。
原文链接
2025年12月9日,阿里Qwen团队发布全新全模态大模型Qwen3-Omni-Flash-2025-12-01。新模型在文本、图像、音视频处理上实现无缝输入与实时流式输出,大幅提升多轮对话稳定性及语音自然度,支持自适应语速与韵律调节,拟人化表现逼近真人水平。新增System Prompt自定义功能,用户可设定“甜妹”“御姐”等人设风格,调整表达偏好与回复长度。同时,模型支持119种文本语言、19种语音识别语言和10种语音合成语言,跨语言交互更精准。性能方面,逻辑推理、代码生成及视觉问答等任务均有显著提升,进一步强化复杂指令理解能力,带来更智能的多模态体验。
原文链接
11月7日,亚马逊宣布推出Kindle Translate AI翻译服务,专为Kindle Direct Publishing(KDP)作者设计,旨在通过自动翻译帮助作品触及更多读者。目前该服务处于测试阶段,暂时免费,仅支持英语与西班牙语互译及德语翻译成英语,未来将扩展更多语言。亚马逊指出,平台上不到5%的书籍有多语言版本,AI翻译技术在出版领域增长潜力巨大,但仍可能存在错误。为此,作者可预览和审阅译文,且需人工校对确保准确性。系统会在出版前自动评估译文准确度,读者购买时也能识别“Kindle Translate”标识并预览部分内容。业内认为,AI翻译虽难以完全替代人工,尤其在文学领域,但其快速进步为出版行业带来广阔前景。
原文链接
9月22日,字节跳动旗下火山引擎发布全新翻译大模型“豆包翻译模型”。该模型支持28种语言互译,性能比肩GPT-4o和Gemini-2.5-Pro,尤其在中英翻译方面效果逼近Deepseek-R1。其具备强大场景适配能力,可精准处理办公、古诗文、网络热词及科技医疗等复杂语境,输出自然流畅无“翻译腔”。模型支持4K上下文和3K输出长度,自动识别源语言,仅需指定目标语言即可高效调用。此外,价格极具竞争力,输入每百万字符仅1.20元,输出为3.60元,显著提升跨语言协作效率。
原文链接
9月17日,在第22届中国—东盟博览会开幕式上,科大讯飞发布星火东盟多语言大模型底座及系列AI产品。该模型基于纯国产化软硬件打造,完全自主可控,覆盖马来语、印尼语、泰语等十种东盟语言,具备语言理解、翻译、问答等能力,参数规模更小但效果对标国际领先水平。同时推出多款应用工具,包括讯飞翻译SaaS平台、双屏翻译机2.0、多语言会议系统和中文智慧教学系统。当天,科大讯飞还与华为及老挝、马来西亚、泰国等国家合作伙伴正式签约,推动技术落地与生态合作。
原文链接
9月11日,YouTube宣布全面上线多语言配音功能,此前该功能已试点两年。数百万创作者可在接下来几周为视频添加多语种配音,吸引更多全球观众。试点阶段,该功能曾开放给MrBeast、Mark Rober和Jamie Oliver等创作者,初期需依赖第三方服务,后引入基于谷歌Gemini技术的AI自动配音工具,可模仿语气与情绪。数据显示,使用该功能后,非主要语言观众贡献了超四分之一观看时长,Jamie Oliver频道播放量增长三倍。此外,YouTube还测试了多语言缩略图功能,支持封面文字翻译,进一步优化全球用户体验。
原文链接
8月24日,Meta宣布推出Reels短视频音频翻译功能,率先上线Facebook和Instagram平台。该功能利用AI技术将视频中的人物语音自动翻译成不同语言,并支持嘴型对齐和双人对话同步翻译,生成与原声相似的音轨以提升自然度。目前支持英语和西班牙语,建议创作者拍摄时使用清晰直述内容以优化效果。此外,Facebook还新增多语言音轨上传选项,创作者可通过Reels编辑器为单条视频添加最多20条音轨,并按观众语言设置自动播放对应版本。这一功能大幅降低了多语言视频制作成本,助力创作者高效分发内容。
原文链接
加载更多
暂无内容