埃隆马斯克也认为用于训练AI的真实世界数据所剩无几 未来只能靠合成数据
埃隆马斯克的观点与其他人工智能行业专家的观点基本相同,那就是用于训练人工智能模型的真实世界 (区别于机器生成) 数据已经所剩无几。
本周埃隆马斯克与 STAGWELL 董事长在 X/Twitter 进行直播时埃隆马斯克表示,我们现在基本上已经耗尽人类在人工智能训练方面积累的全部知识,这基本上发生在 2024 年。
有鉴于人类自己产生的数据已经被耗尽,所以埃隆马斯克认为合成数据也就是由人工智能模型本身生成的数据是未来的发展方向,补充的唯一方法就是使用合成数据,有了合成数据后人工智能就会自我评分并经历自我学习的过程。
值得注意的是由于无法获取到最后多的真实世界新数据,包括埃隆马斯克的 xAI、微软、Meta、OpenAI 和 Anthropic 等科技巨头都已经开始使用合成数据训练 AI 模型。
市场调查公司 Gartner 的预计则是在 2024 年用于人工智能和分析项目中的数据可能有高达 60% 都是合成的而非人类产生的真实数据。
微软在最新推出的 Phi-4 系列模型中也同样使用合成数据和真实数据进行训练,谷歌开源的 Gemma 模型同样如此,都是靠合成数据才完成模型的最终训练。
使用合成数据的优点很多,包括获取方式相对来说比较容易、节省成本还可以规避某些版权问题等。但缺点也很明显,某些研究表明合成数据可能会导致模型崩溃,即模型的输出不那么有创意而且会更加偏颇。
如果用于训练的合成数据本身存在偏见和局限性,那么训练出来的人工智能模型也同样会存在这样的缺点或受到影响,最终影响到人工智能模型的质量。
-
微软高管透露新的绩效裁员计划不包含印度
早前有消息指出微软正在进行新一轮裁员,此次裁员将按照员工绩效来定,也就是大多数部门的成员在绩效靠后的情况下都可能面临着裁员。后续微软官方也证实了裁员计划,微软发言人表示:微软注重高绩效人才,我们致力于
-
英国国家域名UK注册局Nominet遭到黑客攻击 但目前还未发现数据泄露
负责管理英国国家顶级域名 UK 的域名注册机构 / 注册局 Nominet 日前披露该公司遭到黑客攻击,攻击时间发生在 2024 年年末,黑客通过 Ivanti VPN 零日漏洞展开攻击。Ivanti
-
由于代码签名问题容器应用Docker for macOS版被阻止启动
容器应用 Docker 日前发出警告称,由于某些文件使用错误的代码签名证书进行签名,这导致 Docker Desktop 无法在苹果的 macOS 上正常启动,因为安全机制拦截并弹出恶意软件警告。最初
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
随时掌握互联网精彩
- 国足0-7输给日本比赛直播崩溃 爱奇艺退款了:网友晒图已到账
- 泰坦军团推出新款27寸显示器:2K 180Hz屏首发999元
- 沈腾马丽十年之约:《抓娃娃》猫眼映前评分9.5分
- iPhone 16全球首发!苹果A18系列爆料汇总
- 广东网上办事大厅app v3.9.2最新版本2022下载地址
- st联盟is做单助手 v1.4最新版本2022下载地址
- 刘恺威10岁女“小糯米”罕露面成焦点
- 木及简历-在线 Markdown 简历制作工具木及简历-
- 阿米健康 v2.2.0最新版本2022下载地址
- 阅读星专业版 v3.2最新版本2022下载地址
- 搜狗阅读加强版 v6.5.00最新版本2022下载地址
- 正则表达式测试工具 1.0.1.0最新版本2022下载地址