OpenAI开启调查:GPT-4o及4o-mini模型性能下降
据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
近期,科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。
实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的长文本生成任务时,仍暴露出显著的改进需求。
具体而言,尽管所有参测模型均宣称其上下文窗口大小超过32K tokens,但实际情况却大相径庭。开源模型在处理仅含2K tokens的任务时便显露疲态,而诸如GPT-4o等闭源模型,在应对8K tokens任务时性能也明显下滑。
以GPT-4o为例,在要求其生成详细旅行规划的任务中,即便提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即产生了“幻觉”现象。
实验进一步揭示,即便是最前沿的模型,在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需要输出8k tokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型(LLM)研究的一个极具潜力的方向。
-
宇宙尽头是带货!ChatGPT搜索上线网购功能
据报道,人工智能公司OpenAI近日宣布为其ChatGPT Search新增购物功能,标志着AI助手正式进军电商领域。首批上线的商品类别涵盖时尚、美妆、家居用品和电子产品等日常消费领域。这项创新功能允
-
ChatGPT推出轻量版深度研究工具 现在免费用户亦可使用深度研究
深度研究是 OpenAI 为 ChatGPT 付费订阅用户开发的专属功能,该功能可以搜寻全网内容并生成专业详实的报告,但需要处理的数据非常多因此对 OpenAI 来说使用成本也非常高。为了平衡成本问题
-
OpenAI要买谷歌浏览器 这么抽象的事竟然是真的
最近这几周,应该算是谷歌的“至暗时刻”了。在美国司法部的压力下,谷歌自家的浏览器Chrome,可能要被迫卖掉了。而OpenAI见状直接表态,愿意收购Chrome浏览器。这事儿要真成了,会成为继标准石油
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 人工智能3D建模初创公司 Backflip完成3000万美元融资
- 死侍与金刚狼高能台词:本田奥德赛车主躺枪
- 5singKTV录歌 2009.5.12.0最新版本2022下载地址
- 飞速WORD转换成PDF转换器 2.0.1034.0最新版本2022下载地址
- 抖音网红小雪被造黄谣,“建群疯传裸照”
- 西安地税 v1.0.0最新版本2022下载地址
- 萌白酱甜味弥漫jk透明白丝
- PowerDesigner 12.5.0.2169最新版本2022下载地址
- 家乐购app v1.0最新版本2022下载地址
- 古剑奇谭2(QQ游戏版) 5.22.57218.0最新版本2022下载地址
- 猜诗词 v1.1.5最新版本2022下载地址
- 易点到 v1.1.4最新版本2022下载地址