性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent

互联网 来源:快科技 2025-06-23 10:44:11

据媒体报道,月之暗面(Moonshot AI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。

该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不同,它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。

例如,它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力始终是任务的实际解决效果。

作为一款深度研究模型,Kimi-Researcher 整合了多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。月之暗面表示,未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。

延伸阅读
  • 男子坐网约车时羽绒服突然“爆炸”:车里全是羽绒

    12月31日消息,据媒体报道,一名网友发布视频称,他坐网约车时羽绒服突然“爆炸”,车里全是羽绒。当事人表示,他挺不好意思的,事后赔了司机几十元清洗费。根据网络平台上公布的视频,网约车里飘满了羽绒,司机

  • vivo X300 Ultra获认证:蓝厂最强影像旗舰蓄势待发

    回顾蓝厂过去的两代超大杯,每一代旗舰都在影像上有新突破,蓝厂也因此拥有了“影像灭霸”的称号。这是数码圈对vivo X系列超大杯旗舰手机的一种夸赞,指其在影像体验上达到了顶尖、无敌的水平,如同《复仇者联

  • 小马智行Robotaxi车队超额完成2025年度目标

    小马智行今日宣布,公司Robotaxi规模已突破1159辆,超额完成2025年千辆Robotaxi战略目标。2025年是小马智行加速规模化布局与商业化落地的一年:作为国内首个“吃螃蟹”的企业,它率先在

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
内容推荐