埃隆马斯克也认为用于训练AI的真实世界数据所剩无几 未来只能靠合成数据
埃隆马斯克的观点与其他人工智能行业专家的观点基本相同,那就是用于训练人工智能模型的真实世界 (区别于机器生成) 数据已经所剩无几。
本周埃隆马斯克与 STAGWELL 董事长在 X/Twitter 进行直播时埃隆马斯克表示,我们现在基本上已经耗尽人类在人工智能训练方面积累的全部知识,这基本上发生在 2024 年。
有鉴于人类自己产生的数据已经被耗尽,所以埃隆马斯克认为合成数据也就是由人工智能模型本身生成的数据是未来的发展方向,补充的唯一方法就是使用合成数据,有了合成数据后人工智能就会自我评分并经历自我学习的过程。
值得注意的是由于无法获取到最后多的真实世界新数据,包括埃隆马斯克的 xAI、微软、Meta、OpenAI 和 Anthropic 等科技巨头都已经开始使用合成数据训练 AI 模型。
市场调查公司 Gartner 的预计则是在 2024 年用于人工智能和分析项目中的数据可能有高达 60% 都是合成的而非人类产生的真实数据。
微软在最新推出的 Phi-4 系列模型中也同样使用合成数据和真实数据进行训练,谷歌开源的 Gemma 模型同样如此,都是靠合成数据才完成模型的最终训练。
使用合成数据的优点很多,包括获取方式相对来说比较容易、节省成本还可以规避某些版权问题等。但缺点也很明显,某些研究表明合成数据可能会导致模型崩溃,即模型的输出不那么有创意而且会更加偏颇。
如果用于训练的合成数据本身存在偏见和局限性,那么训练出来的人工智能模型也同样会存在这样的缺点或受到影响,最终影响到人工智能模型的质量。
-
谷歌向发现Chrome沙盒逃逸漏洞的研究人员奖励25万美元表彰其出色工作
日前在 Chromium 项目中最新公布的某个问题详细介绍安全研究人员在 2025 年 4 月 23 日发现的高危安全漏洞,该漏洞属于 Chrome 浏览器沙盒逃逸并且具有极高的危害。有趣的是发现漏洞
-
GitHub首席执行官宣布辞职 GitHub并入微软不再独立运营 不再设立CEO职位
微软在 2018 年以 75 亿美元成功收购代码托管平台 GitHub,彼时有传闻称谷歌也准备参与收购但最终 GitHub 被微软成功收购,对微软来说收购 GitHub 也是个非常成功的交易。而被收购
-
Cloudflare电子邮件路由现已支持+号替代邮箱 使用abc+d替代abcd邮箱
Cloudflare 为所有用户提供免费电子邮件路由,使用该功能可以轻松构建自己的域名邮箱不需要单独构建邮箱服务器,当收到邮件时可以转发到指定邮箱,这样可以构建多个邮箱路由进行转发而不需要公开真实邮箱
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 男子将全裸女子扛出地铁 警方回应
- 幸福泾源app v1.0最新版本2022下载地址
- 小鹏汽车法务部重拳出击:某造谣自媒体道歉并赔偿
- 四六级必过app v2.6.1最新版本2022下载地址
- Coowon 1.6.1.0最新版本2022下载地址
- 飞凡积分app V4.21.0最新版本2022下载地址
- 风云PDF转换器 6.0.0.1最新版本2022下载地址
- 东方不败(手游电脑版) 1.0.1290.123最新版本2022下载地址
- 李世民传位于哪位皇子
- Office资源宝库-SoEasy办公效率平台 4.1.0.0最新版本2022下载地址
- 唯凡优品 v2.6.2.2最新版本2022下载地址
- 男子对女子吹口哨被打身亡 警方通报