PlanningBench是什么PlanningBench 是腾讯混元团队联合中国人民大学高瓴人工智能学院等机构推出的开源框架,专注于大语言模型的规划能力评测与训练。框架从真实场景出发,构建一套覆盖六
PawBench是什么PawBench 是通义实验室推出的通用智能体评测基准,面向个人助理与 Agent 场景,将底座模型与运行框架(Harness)纳入同一评测体系。PawBench v1.0 构建
Toonflow是什么Toonflow 是开源的一站式 AI 短剧创作工具,将小说、剧本通过多 Agent 协作自动转化为结构化剧本、智能分镜、角色视觉和动画视频,实现小说→剧本→分镜→视频,全流程
BrowserAct Skills是什么BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核心痛点,无 Cookie 环境、
JoyAI-Echo是什么JoyAI-Echo 是京东推出的开源长音视频生成框架,专为分钟级多镜头故事生成设计。框架通过跨模态记忆库、记忆驱动后训练、Director Agent 对话式编辑和轻量化实
Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采用单纯形旋转编码保证智能体身份对称,配合稀疏枢纽注意力将通信
Qwen-Image-Bench是什么Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采
PilotDeck是什么PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每
Hy-Memory是什么Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化
Step 3.7 Flash是什么Step 3.7 Flash 是阶跃星辰面向 Agent 生产化阶段推出的新一代开源 Flash 模型,采用稀疏 MoE 架构,最高生成速度达 400 Tokens/
Aholo Viewer是什么Aholo Viewer是群核科技开源的基于 3D 高斯溅射(3DGS)的高性能 Web 端渲染引擎。工具采用 chunk-level LOD 流式加载技术,让 3D 内
LLM Council是什么LLM Council 是 Andrej Karpathy 开源的多模型协作框架,通过 OpenRouter 将用户问题同时分发给多个大模型(如 Claude、GPT、Ge