为了应对AI数据短缺,字节等互联网大厂开始亲自招募AI录音员,定制语料库。通过在北京大钟寺的办公室招募素人,进行长达3小时的录音任务,每次支付300元。录音过程中,至少有两名字节员工全程陪同监督,确保对话质量。这一做法已在成都、太原、贵州等二线城市发展成为常态,大厂寻求通过购买高质量数据来训练AI大模型。然而,AI大模型面临数据枯竭的问题,预计到2032年,科技公司将耗尽可用于训练的公开数据。因此,大厂纷纷探索新途径,以获取稀缺的高质量数据资源。 目前,字节已在全国多个城市开展AI录音员招募活动,包括上海、杭州、重庆、南京、成都和天津等地。这种模式虽然成本较高且耗时,但为大厂提供了直接控制数据质量和来源的机会。同时,大厂还通过第三方公司购买数据,甚至直接雇佣“大数据标注师”和“AI编辑”等外包岗位。然而,高质量数据的获取面临挑战,尤其是小语种数据和特定领域知识的收集。AI创业公司和四小龙企业面临数据成本高昂的问题,需要支付高额费用以获得关键数据。 此外,AI大模型的生成效果受到数据质量的影响,大模型经常出现“幻觉”,生成的内容与实际不符。为了提高生成内容的质量,大厂需要投入更多资源来获取高质量数据,这成为影响AI大模型商业化和用户吸引力的关键因素。因此,亲自下场“为AI编剧本”成为大厂获取数据资源、提升AI模型性能的一种策略,预示着未来大模型厂商的竞争焦点将转向数据获取能力。
原文链接
本文链接:https://kx.umi6.com/article/5802.html
转载请注明文章出处
相关推荐
.png)
换一换
AI数据告急,大厂盯上廉价年轻人
2024-09-03 19:23:09
硬件搭上AI,字节美团相中万亿新赛道
2024-06-21 14:41:46
互联网大厂2026届校招开启抢人大战:字节有实习生日薪5000元
2025-08-11 16:08:28
进击中的生成式AI,互联网大厂们的先手棋
2024-06-18 17:32:09
互联网大厂密集启动校招,腾讯、阿里重点面向AI招揽人才
2025-08-06 16:36:54
游戏、卖货和广告,仍是中国互联网大厂最强印钞机
2025-03-27 08:32:51
互联网大厂的逻辑更替
2025-07-01 09:52:51
黄仁勋提到的机器人世界,还需要AI数据来“调教” | CVPR 2024
2024-06-20 16:24:44
AI多模态数据需求大增 海天瑞声2024年扭亏为盈 成立数据科技公司涉及多项AI业务
2025-02-25 21:09:53
互联网大厂,不再需要AI Lab
2025-05-08 14:33:29
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
OpenAI杀入招聘市场:打造AI技能认证体系+人才对接平台
2025-09-05 06:12:15
新一轮AI浏览器大战,谷歌将掉队了?
2025-09-05 10:20:22
513 文章
166348 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08