多语言 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

亚马逊推出 Kindle Translate AI 翻译服务：一键翻译作者书籍，可触及更多读者群体

11月7日，亚马逊宣布推出Kindle Translate AI翻译服务，专为Kindle Direct Publishing（KDP）作者设计，旨在通过自动翻译帮助作品触及更多读者。目前该服务处于测试阶段，暂时免费，仅支持英语与西班牙语互译及德语翻译成英语，未来将扩展更多语言。亚马逊指出，平台上不到5%的书籍有多语言版本，AI翻译技术在出版领域增长潜力巨大，但仍可能存在错误。为此，作者可预览和审阅译文，且需人工校对确保准确性。系统会在出版前自动评估译文准确度，读者购买时也能识别“Kindle Translate”标识并预览部分内容。业内认为，AI翻译虽难以完全替代人工，尤其在文学领域，但其快速进步为出版行业带来广阔前景。

原文链接

智能涌动

11-07 07:35:55

AI翻译

Kindle Translate

多语言出版

分享至

打开微信扫一扫

内容投诉

生成图片

字节跳动推出豆包翻译大模型：支持 28 种语言互译，性能比肩 GPT-4o

9月22日，字节跳动旗下火山引擎发布全新翻译大模型“豆包翻译模型”。该模型支持28种语言互译，性能比肩GPT-4o和Gemini-2.5-Pro，尤其在中英翻译方面效果逼近Deepseek-R1。其具备强大场景适配能力，可精准处理办公、古诗文、网络热词及科技医疗等复杂语境，输出自然流畅无“翻译腔”。模型支持4K上下文和3K输出长度，自动识别源语言，仅需指定目标语言即可高效调用。此外，价格极具竞争力，输入每百万字符仅1.20元，输出为3.60元，显著提升跨语言协作效率。

原文链接

阿达旻

09-22 17:01:35

多语言互译

字节跳动

豆包翻译模型

分享至

打开微信扫一扫

内容投诉

生成图片

科大讯飞发布星火东盟多语言大模型底座及系列 AI 产品，覆盖马来语、印尼语、泰语等

9月17日，在第22届中国—东盟博览会开幕式上，科大讯飞发布星火东盟多语言大模型底座及系列AI产品。该模型基于纯国产化软硬件打造，完全自主可控，覆盖马来语、印尼语、泰语等十种东盟语言，具备语言理解、翻译、问答等能力，参数规模更小但效果对标国际领先水平。同时推出多款应用工具，包括讯飞翻译SaaS平台、双屏翻译机2.0、多语言会议系统和中文智慧教学系统。当天，科大讯飞还与华为及老挝、马来西亚、泰国等国家合作伙伴正式签约，推动技术落地与生态合作。

原文链接

智慧棱镜

09-18 08:47:14

AI产品

星火东盟多语言大模型

科大讯飞

分享至

打开微信扫一扫

内容投诉

生成图片

跨越语种障碍，YouTube 全面上线视频多语言配音功能

9月11日，YouTube宣布全面上线多语言配音功能，此前该功能已试点两年。数百万创作者可在接下来几周为视频添加多语种配音，吸引更多全球观众。试点阶段，该功能曾开放给MrBeast、Mark Rober和Jamie Oliver等创作者，初期需依赖第三方服务，后引入基于谷歌Gemini技术的AI自动配音工具，可模仿语气与情绪。数据显示，使用该功能后，非主要语言观众贡献了超四分之一观看时长，Jamie Oliver频道播放量增长三倍。此外，YouTube还测试了多语言缩略图功能，支持封面文字翻译，进一步优化全球用户体验。

原文链接

代码编织者

09-11 23:05:08

YouTube

全球观众

多语言配音

分享至

打开微信扫一扫

内容投诉

生成图片

Meta 公布 Reels 短视频音频翻译功能，利用 AI 多语言配音对口型

8月24日，Meta宣布推出Reels短视频音频翻译功能，率先上线Facebook和Instagram平台。该功能利用AI技术将视频中的人物语音自动翻译成不同语言，并支持嘴型对齐和双人对话同步翻译，生成与原声相似的音轨以提升自然度。目前支持英语和西班牙语，建议创作者拍摄时使用清晰直述内容以优化效果。此外，Facebook还新增多语言音轨上传选项，创作者可通过Reels编辑器为单条视频添加最多20条音轨，并按观众语言设置自动播放对应版本。这一功能大幅降低了多语言视频制作成本，助力创作者高效分发内容。

原文链接

电子诗篇

08-24 12:14:28

AI翻译

Reels

多语言音轨

分享至

打开微信扫一扫

内容投诉

生成图片

谢赛宁团队新作打破“多语言诅咒”！MetaCLIP 2支持300多种语言，英语性能反倒提升了

谢赛宁团队发布MetaCLIP 2模型，支持300多种语言，打破“多语言诅咒”，并提升英语性能。该模型通过扩展元数据、优化筛选算法和调整训练策略，解决了非英语数据处理难题，并在多项任务中创下新SOTA。实验显示，其在ImageNet分类准确率达81.3%，超越纯英语CLIP的80.5%；在多语言图像分类和跨语言检索任务中表现突出。此外，模型嵌入质量更优，在文化多样性任务中表现显著提升。相关论文与代码已开源。

原文链接

电子诗篇

08-01 08:57:44

MetaCLIP 2

NoFilter

多语言诅咒

分享至

打开微信扫一扫

内容投诉

生成图片

阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译，每百万输出 token 低至 2 元

7月25日，阿里云通义千问发布Qwen-MT机器翻译模型，支持92种语言互译，覆盖全球95%以上人口。该模型具备术语干预、领域提示等高度可控性功能，适用于复杂专业场景，同时采用轻量级MoE架构，每百万输出token低至2元，兼具低延迟和低成本优势。官方称其在中英、英德多领域翻译任务中表现优于GPT-4.1-mini等同规模模型，与顶级大模型相比也毫不逊色。通过人工评测，Qwen-MT在中文、英语、日语等多种语言翻译中展现出高合格率和优良率。开发者可通过Qwen API体验该模型。

原文链接

新智燎原

07-25 10:18:53

Qwen-MT

多语言互译

机器翻译

分享至

打开微信扫一扫

内容投诉

生成图片

ChatGPT 高级语音模式升级：更有“人情味”，新增多语言翻译功能

6月8日消息，ChatGPT为其付费用户推出了高级语音模式升级。此次升级显著提升了语音的自然度与情感表达，使交互更具“人情味”。新增功能包括多语言翻译，用户可请求语音翻译，系统将在对话中持续提供服务。此更新基于此前对语音模式的改进，优化了语速、停顿及口音问题。不过，测试显示部分语音选项可能存在轻微音频质量下降及音调变化，开发团队正努力解决。此外，语音模式仍偶现“幻觉”现象，如广告声或背景音乐。

原文链接

GhostPilot

06-08 11:04:07

ChatGPT

多语言翻译

高级语音模式

分享至

打开微信扫一扫

内容投诉

生成图片

阿里开源 Qwen3 新模型 Embedding 及 Reranker，带来强大多语言、跨语言支持

6月6日凌晨，阿里开源了Qwen3-Embedding系列模型（包括Embedding及Reranker），专为文本表征、检索与排序任务设计。该系列基于Qwen3基础模型训练，在多项基准测试中表现卓越。8B参数规模的Embedding模型在MTEB多语言Leaderboard榜单中得分70.58，位居第一（截至2025年6月6日）。Qwen3-Embedding支持0.6B到8B参数的三种配置，具备灵活架构与多语言支持，覆盖超100种语言，且支持代码检索。Embedding模型通过“EOS”标记生成语义表示，Reranker则计算文本对相关性得分。模型还支持表征维度自定义与指令适配优化。开源地址包括ModelScope、Hugging Face及GitHub。

原文链接

智慧棱镜

06-06 09:22:06

Qwen3-Embedding

多语言支持

阿里开源

分享至

打开微信扫一扫

内容投诉

生成图片

苹果研究破解 AI“英语口音”难题，提升多语言自然性

5月17日，苹果联合多国高校及研究院发布最新研究成果，解决AI‘英语口音’难题。研究发现，现有大语言模型在非英语语种输出中普遍存在语法和词汇偏差，即使专为中国优化的Qwen模型，其母语表现仍逊于人类水平。所有模型在非英语输出时仍受英语思维影响。为此，研究团队提出词汇自然性和句法自然性两项量化指标，并采用“回译法”生成训练样本，显著提升多语言自然度。测试涵盖中文、法语、英语等语料。论文已发布于arXiv。

原文链接