埃隆马斯克也认为用于训练AI的真实世界数据所剩无几 未来只能靠合成数据
埃隆马斯克的观点与其他人工智能行业专家的观点基本相同,那就是用于训练人工智能模型的真实世界 (区别于机器生成) 数据已经所剩无几。
本周埃隆马斯克与 STAGWELL 董事长在 X/Twitter 进行直播时埃隆马斯克表示,我们现在基本上已经耗尽人类在人工智能训练方面积累的全部知识,这基本上发生在 2024 年。
有鉴于人类自己产生的数据已经被耗尽,所以埃隆马斯克认为合成数据也就是由人工智能模型本身生成的数据是未来的发展方向,补充的唯一方法就是使用合成数据,有了合成数据后人工智能就会自我评分并经历自我学习的过程。
值得注意的是由于无法获取到最后多的真实世界新数据,包括埃隆马斯克的 xAI、微软、Meta、OpenAI 和 Anthropic 等科技巨头都已经开始使用合成数据训练 AI 模型。
市场调查公司 Gartner 的预计则是在 2024 年用于人工智能和分析项目中的数据可能有高达 60% 都是合成的而非人类产生的真实数据。
微软在最新推出的 Phi-4 系列模型中也同样使用合成数据和真实数据进行训练,谷歌开源的 Gemma 模型同样如此,都是靠合成数据才完成模型的最终训练。
使用合成数据的优点很多,包括获取方式相对来说比较容易、节省成本还可以规避某些版权问题等。但缺点也很明显,某些研究表明合成数据可能会导致模型崩溃,即模型的输出不那么有创意而且会更加偏颇。
如果用于训练的合成数据本身存在偏见和局限性,那么训练出来的人工智能模型也同样会存在这样的缺点或受到影响,最终影响到人工智能模型的质量。
-
GitHub独立性似乎正在快速下降 微软计划将其数据中心迁移到Microsoft Azure
多年前微软收购 GitHub 后就允许后者继续独立运营,因此在后续的多年里 GitHub 受到的微软直接影响还是比较小的,直到早些时候 GitHub 首席执行官宣布将离职。2025 年 8 月份 Gi
-
浦发银行部分万事达卡出现盗刷问题 受影响用户电话报案后无需承担责任
最近上海浦发银行发行的万事达无价世界卡出现盗刷事件,在发现异常后浦发银行和万事达中国公司 (万事网联) 均已发布声明承诺调查问题并为用户提供安全保障。从小红书上的用户反馈来看,这些信用卡出现在世界各地
-
谷歌在印尼市场推出Google AI Plus订阅 每月仅2.28美元还附带200GB存储空间
谷歌日前宣布在印度尼西亚推出订阅价格非常便宜的 Google AI Plus 套餐,该套餐旨在帮助更多用户积极利用人工智能服务创造并提升生产力,谷歌计划后续将该订阅方案推广到更多新兴市场。Google
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 蟹太太回应卷入辛巴三只羊纠纷
- 谷歌CEO:Google One 订阅人数已突破 1 亿人
- 华为nova 12活力版真机首曝!确认骁龙778G 4G
- 刷刷洗车 v2.0.9最新版本2022下载地址
- 消防支队一科长被妻子举报婚内出轨、逼迫堕胎,泉州消防回应
- 小画家 v2.9.0.4最新版本2022下载地址
- 大西游 v1.0最新版本2022下载地址
- 高铁站近9成是按摩椅?工作人员回应
- 赛猫购购返利浏览器 1.9.3841.8217最新版本2022下载地址
- 极品五笔输入法手机版 V2.0.1最新版本2022下载地址
- 系统不休息 v1.2最新版本2022下载地址
- 国元证券 9.0最新版本2022下载地址