OpenAI开启调查:GPT-4o及4o-mini模型性能下降
据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
近期,科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。
实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的长文本生成任务时,仍暴露出显著的改进需求。
具体而言,尽管所有参测模型均宣称其上下文窗口大小超过32K tokens,但实际情况却大相径庭。开源模型在处理仅含2K tokens的任务时便显露疲态,而诸如GPT-4o等闭源模型,在应对8K tokens任务时性能也明显下滑。
以GPT-4o为例,在要求其生成详细旅行规划的任务中,即便提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即产生了“幻觉”现象。
实验进一步揭示,即便是最前沿的模型,在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需要输出8k tokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型(LLM)研究的一个极具潜力的方向。
-
OpenAI董事长:行业正处于AI泡沫中 许多人会损失惨重
据媒体报道,OpenAI董事长布雷特·泰勒(Bret Taylor)近日表示,人工智能行业目前正处在泡沫阶段,并预计将有许多投资者和企业遭受重大损失。泰勒同时担任AI智能体创业公司Sierra的CEO
-
OpenAI新论文揭示AI模型出现幻觉的原因:并非神秘故障而是模型训练的奖励机制问题
目前人工智能模型普遍存在幻觉问题,所谓幻觉就是模型偶尔会自信满满地输出错误信息,此前曾有报道称连研究人员都搞不清幻觉的根源,因为模型在运行中属于黑盒模式。不过 OpenAI 研究团队最新发布的论文已经
-
GPT-5发布后ChatGPT Plus用户权限被缩减引起用户抗议 萨姆奥特曼亲自道歉
本周五 OpenAI 发布大家期待已久的 GPT-5 系列模型,该模型在推理、编码和工具调用等方面取得重大进步,而且所有用户都可以免费通过 ChatGPT 使用 GPT-5 模型。然而根据 ChatG
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 警惕!苹果应用商店DeepSeek“李鬼”横行 多人充值上当被骗
- PS5 Pro性能曝光:原生2160P稳60帧、支持8K
- 英镑兑换人民币汇率2024年2月20日
- 克鲁马努人的一天 v1.0最新版本2022下载地址
- 芥末时差app v1.0最新版本2022下载地址
- 智络会员管理系统 6.9.0.1最新版本2022下载地址
- 放开那三国3(手游电脑版) 3.10.586.100最新版本2022下载地址
- 陪爸妈app v3.0.2最新版本2022下载地址
- 中琅条码标签打印软件 6.3.9最新版本2022下载地址
- 透明头像生成器 v2.6最新版本2022下载地址
- 小奶狗太可爱男子偷3只后自首
- 星火货主端app v1.2最新版本2022下载地址