Intern-S2-Preview – 上海 AI Lab 开源的科学多模态大模型

互联网 来源:AI工具集 2026-05-18 23:57:25

Intern-S2-Preview是什么

Intern-S2-Preview 是上海人工智能实验室开源的新一代书生科学多模态大模型预览版,以35B参数规模实现比肩万亿参数模型的科学能力。模型通过”通专融合”全链路训练与强化学习驱动,首次在开源通用大模型中实现材料晶体结构生成,MolecularIQ评测得分57.26,晶体结构生成通过率超40%,显著超越主流闭源模型。同时支持复杂科学推理、生物多组学理解与智能体任务执行,基于昇腾Atlas 900 A3超节点实现算法—系统—算力协同优化,为科研创新提供高效、低门槛的AI基础设施。

Intern-S2-Preview的主要功能

  • 科学多模态理解:支持多组学序列分析、生物显微图像问答、生物分子指令理解、分子结构推理、科学多模态任务、遥感感知与推理及综合科学推理。
  • 材料晶体结构生成:首次在开源通用大模型中实现材料晶体结构生成,引入实数预测模块,支持高精度坐标回归与分子结构空间建模。
  • 数学与复杂推理:覆盖国际数学奥赛解题、多模态数学推理、高中数学竞赛等任务,支持思维链折叠与极致压缩的高效推理。
  • 长程文本与多模态推理:支持长程纯文本及多模态推理,具备处理超长科学文献与复杂跨模态信息的能力。
  • 科学图表与数据问答:针对科学图表、数据可视化内容进行专业问答与解析。
  • 科学代码生成:在科学编程与算法求解场景中表现优异,可高效支撑科学计算、算法开发与科研脚本编写。
  • 通用智能体任务执行:具备科学智能体交互、科学竞赛与研究智能体任务执行、OpenClaw编码智能体及软件工程智能体等复杂任务规划与自主执行能力。
  • 指令跟随与代码生产:支持高精度指令跟随与通用代码生产任务。

Intern-S2-Preview的技术原理

  • 通专融合全链路训练:将数百项专业科学任务从预训练扩展至强化学习阶段,为每个任务配备从预训练到后训练的高质量数据与训练策略,实现多任务融合训练,使不同任务间形成相互促进的协同效应。
  • 任务Scaling机制:通过提升任务难度与丰富任务多样性实现能力Scaling,当大量高难度科学任务统一融合训练时,35B参数模型可在多项科学任务上达到万亿参数模型的表现水平。
  • 强化学习驱动科学推理:延长RL训练步长并引入研究生级别学科推理问题;引导模型利用思维链完成生物多组学理解等专业任务,依托思维链泛化优势实现小参数比肩大模型性能。
  • 数据思维密度优化(IQPT):在Intelligence Quality per token理念指导下,探索思维链折叠等创新算法,通过构建数据思维密度杠杆,在数学推理中以相同单位智能比肩8倍参数量模型。
  • 分子结构空间建模技术:引入傅里叶位置编码(FoPE)、重构时序编码器,并新增实数预测模块,实现高精度坐标回归,首次在开源通用大模型中完成材料晶体结构生成。
  • 训推一体化架构:基于XTuner训练框架与LMDeploy推理引擎,引入共享MTP权重计算方式,减少训练与推理阶段不一致性,提升draft token接受率与生成有效性。
  • 昇腾算力协同优化:基于昇腾Atlas 900 A3超节点,在训练框架中引入SP、chunk loss、activation offload等显存优化技术;针对变长输入优化数据分块与主机设备交互;通过离线模拟视觉与语言模块算力占比,实现多模态长序列训练的均衡资源分配。

如何使用Intern-S2-Preview

  • 在线对话体验:访问书生大模型官方体验平台,直接进行多轮对话,测试科学问答、分子结构理解、代码生成等能力。
  • API 服务接入:通过 ChatAPI 调用模型,在 model 字段填写 intern-s2-preview,默认开启深度思考模式(thinking_mode),适合需要集成到科研工具链或自动化工作流的场景。
  • 智能体任务执行:若需使用智能体能力(如接入 OpenClaw 等 harness 执行复杂科研任务),强烈建议保持 thinking_mode 开启,以保障任务拆解、工具调用与多步决策的稳定性。
  • 开源模型本地部署:从 HuggingFace 或 ModelScope 下载模型权重,结合官方推荐的 LMDeploy 推理引擎进行本地部署,支持高效推理与多模态长序列处理。
  • 科研微调与训练:基于 XTuner 训练框架,利用开源权重进行领域微调;训练阶段支持多 token 预测强化学习及共享 MTP 权重计算,便于训推一体化迭代。
  • 晶体结构生成任务:针对材料科学场景,直接调用模型进行晶体结构生成与分子坐标回归,无需依赖扩散模型即可获得高精度空间坐标预测结果。

Intern-S2-Preview的项目地址

  • 书生大模型:https://chat.intern-ai.org.cn/
  • HuggingFace:https://huggingface.co/internlm/Intern-S2-Preview
  • ModelScope:https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S2-Preview

Intern-S2-Preview的核心优势

  • 35B参数比肩万亿级模型:以极小参数规模实现多个核心科学领域比肩万亿参数模型的能力,大幅降低科研使用门槛与部署成本。
  • 首次开源晶体结构生成:引入实数预测模块,在开源通用大模型中首次实现材料晶体结构生成,MolecularIQ得分57.26,通过率超40%,显著超越GPT-5.5等闭源模型。
  • 科学智能体能力领先:在综合科学场景编程、科学发现任务中超越Claude-Haiku-4.5、GPT5.4-Nano等主流闭源模型,SciCode与PinchBench评测位居同量级前列。
  • 通专融合全链路训练:将专业科学任务从预训练延伸至强化学习阶段,多任务融合形成协同效应,避免单一阶段优化的能力此消彼长。
  • 强化学习驱动高效推理:依托思维链引导与思维链折叠算法,在数学推理中以相同单位智能比肩8倍参数量模型,实现性能与效率双重突破。
  • 昇腾软硬件协同优化:基于昇腾Atlas 900 A3超节点实现算法—系统—算力协同演进,训练稳定性与推理效率大幅提升,验证国产算力生态价值。
  • 训推一体化架构:XTuner训练框架与LMDeploy推理引擎深度协同,共享MTP权重减少训推不一致,支持多模态长序列高效训练与部署。

Intern-S2-Preview的同类竞品对比

对比维度Intern-S2-PreviewQwen3.6-35B-A3BStep3.5-Flash
发布机构上海人工智能实验室阿里巴巴通义千问团队阶跃星辰
参数规模35B35B196B
模型定位科学多模态大模型(通专融合)通用多模态大模型通用多模态大模型
开源情况开源(HuggingFace/ModelScope)开源开源
MolecularIQ 分子结构推理57.2632.6245.94
晶体结构生成首次开源实现,通过率>40%不支持不支持
SciCode 科学编程39.6440.6046.15
SGI-Bench 科学智能体交互52.5237.3036.16
MMLU Pro 通用知识推理88.0085.1283.44
IMO-Bench 国际数学奥赛84.0081.0079.0
PinchBench 通用智能体编码88.2287.0585.00
FrontierScience-Research 科研智能体19.4410.0010.00
训练范式全链路通专融合 + RL强化学习通用预训练 + 后训练通用预训练 + 后训练
算力生态昇腾 Atlas 900 A3 深度优化多元算力多元算力
核心差异以35B参数实现晶体结构生成等专有科学能力,科学智能体与推理效率显著领先同/更大规模模型通用能力强,但在专业科学任务(分子结构、科研智能体)上明显落后参数规模大,科学编程略优,但科学发现、分子推理与智能体任务落后,且不具备晶体结构生成能力

Intern-S2-Preview的应用场景

  • 分子生物学与药物研发:用于多组学序列分析、生物分子指令理解与分子结构推理,辅助靶点发现、化合物筛选及药物作用机制研究。
  • 材料科学创新发现:直接生成材料晶体结构并输出高精度空间坐标,加速新型半导体、催化剂、电池材料等研发迭代。
  • 科学计算与算法开发:支撑科学编程、算法求解与科研脚本编写,为物理模拟、化学计算、生物信息学处理提供自动化代码生成。
  • 生物显微图像与遥感分析:对生物显微图像进行专业问答与特征识别,同时支持遥感感知与推理,服务医学影像与地球科学领域。
  • 数学与复杂科学推理:覆盖国际数学奥赛、高中数学竞赛及研究生级别学科推理,辅助数学证明、公式推导与逻辑验证。
  • 科研智能体自动化执行:作为科学竞赛智能体、研究智能体或OpenClaw编码智能体,自主完成文献调研、实验设计、数据分析等多步骤科研任务。
延伸阅读

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
内容推荐