热门资讯

Intern-S2-Preview – 上海 AI Lab 开源的科学多模态大模型

互联网来源：AI工具集 2026-05-18 23:57:25

Intern-S2-Preview是什么

Intern-S2-Preview 是上海人工智能实验室开源的新一代书生科学多模态大模型预览版，以35B参数规模实现比肩万亿参数模型的科学能力。模型通过”通专融合”全链路训练与强化学习驱动，首次在开源通用大模型中实现材料晶体结构生成，MolecularIQ评测得分57.26，晶体结构生成通过率超40%，显著超越主流闭源模型。同时支持复杂科学推理、生物多组学理解与智能体任务执行，基于昇腾Atlas 900 A3超节点实现算法—系统—算力协同优化，为科研创新提供高效、低门槛的AI基础设施。

Intern-S2-Preview的主要功能

科学多模态理解：支持多组学序列分析、生物显微图像问答、生物分子指令理解、分子结构推理、科学多模态任务、遥感感知与推理及综合科学推理。
材料晶体结构生成：首次在开源通用大模型中实现材料晶体结构生成，引入实数预测模块，支持高精度坐标回归与分子结构空间建模。
数学与复杂推理：覆盖国际数学奥赛解题、多模态数学推理、高中数学竞赛等任务，支持思维链折叠与极致压缩的高效推理。
长程文本与多模态推理：支持长程纯文本及多模态推理，具备处理超长科学文献与复杂跨模态信息的能力。
科学图表与数据问答：针对科学图表、数据可视化内容进行专业问答与解析。
科学代码生成：在科学编程与算法求解场景中表现优异，可高效支撑科学计算、算法开发与科研脚本编写。
通用智能体任务执行：具备科学智能体交互、科学竞赛与研究智能体任务执行、OpenClaw编码智能体及软件工程智能体等复杂任务规划与自主执行能力。
指令跟随与代码生产：支持高精度指令跟随与通用代码生产任务。

Intern-S2-Preview的技术原理

通专融合全链路训练：将数百项专业科学任务从预训练扩展至强化学习阶段，为每个任务配备从预训练到后训练的高质量数据与训练策略，实现多任务融合训练，使不同任务间形成相互促进的协同效应。
任务Scaling机制：通过提升任务难度与丰富任务多样性实现能力Scaling，当大量高难度科学任务统一融合训练时，35B参数模型可在多项科学任务上达到万亿参数模型的表现水平。
强化学习驱动科学推理：延长RL训练步长并引入研究生级别学科推理问题；引导模型利用思维链完成生物多组学理解等专业任务，依托思维链泛化优势实现小参数比肩大模型性能。
数据思维密度优化（IQPT）：在Intelligence Quality per token理念指导下，探索思维链折叠等创新算法，通过构建数据思维密度杠杆，在数学推理中以相同单位智能比肩8倍参数量模型。
分子结构空间建模技术：引入傅里叶位置编码（FoPE）、重构时序编码器，并新增实数预测模块，实现高精度坐标回归，首次在开源通用大模型中完成材料晶体结构生成。
训推一体化架构：基于XTuner训练框架与LMDeploy推理引擎，引入共享MTP权重计算方式，减少训练与推理阶段不一致性，提升draft token接受率与生成有效性。
昇腾算力协同优化：基于昇腾Atlas 900 A3超节点，在训练框架中引入SP、chunk loss、activation offload等显存优化技术；针对变长输入优化数据分块与主机设备交互；通过离线模拟视觉与语言模块算力占比，实现多模态长序列训练的均衡资源分配。

如何使用Intern-S2-Preview

在线对话体验：访问书生大模型官方体验平台，直接进行多轮对话，测试科学问答、分子结构理解、代码生成等能力。
API 服务接入：通过 ChatAPI 调用模型，在 model 字段填写 intern-s2-preview，默认开启深度思考模式（thinking_mode），适合需要集成到科研工具链或自动化工作流的场景。
智能体任务执行：若需使用智能体能力（如接入 OpenClaw 等 harness 执行复杂科研任务），强烈建议保持 thinking_mode 开启，以保障任务拆解、工具调用与多步决策的稳定性。
开源模型本地部署：从 HuggingFace 或 ModelScope 下载模型权重，结合官方推荐的 LMDeploy 推理引擎进行本地部署，支持高效推理与多模态长序列处理。
科研微调与训练：基于 XTuner 训练框架，利用开源权重进行领域微调；训练阶段支持多 token 预测强化学习及共享 MTP 权重计算，便于训推一体化迭代。
晶体结构生成任务：针对材料科学场景，直接调用模型进行晶体结构生成与分子坐标回归，无需依赖扩散模型即可获得高精度空间坐标预测结果。

Intern-S2-Preview的项目地址

书生大模型：https://chat.intern-ai.org.cn/
HuggingFace：https://huggingface.co/internlm/Intern-S2-Preview
ModelScope：https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S2-Preview

Intern-S2-Preview的核心优势

35B参数比肩万亿级模型：以极小参数规模实现多个核心科学领域比肩万亿参数模型的能力，大幅降低科研使用门槛与部署成本。
首次开源晶体结构生成：引入实数预测模块，在开源通用大模型中首次实现材料晶体结构生成，MolecularIQ得分57.26，通过率超40%，显著超越GPT-5.5等闭源模型。
科学智能体能力领先：在综合科学场景编程、科学发现任务中超越Claude-Haiku-4.5、GPT5.4-Nano等主流闭源模型，SciCode与PinchBench评测位居同量级前列。
通专融合全链路训练：将专业科学任务从预训练延伸至强化学习阶段，多任务融合形成协同效应，避免单一阶段优化的能力此消彼长。
强化学习驱动高效推理：依托思维链引导与思维链折叠算法，在数学推理中以相同单位智能比肩8倍参数量模型，实现性能与效率双重突破。
昇腾软硬件协同优化：基于昇腾Atlas 900 A3超节点实现算法—系统—算力协同演进，训练稳定性与推理效率大幅提升，验证国产算力生态价值。
训推一体化架构：XTuner训练框架与LMDeploy推理引擎深度协同，共享MTP权重减少训推不一致，支持多模态长序列高效训练与部署。

Intern-S2-Preview的同类竞品对比

对比维度	Intern-S2-Preview	Qwen3.6-35B-A3B	Step3.5-Flash
发布机构	上海人工智能实验室	阿里巴巴通义千问团队	阶跃星辰
参数规模	35B	35B	196B
模型定位	科学多模态大模型（通专融合）	通用多模态大模型	通用多模态大模型
开源情况	开源（HuggingFace/ModelScope）	开源	开源
MolecularIQ 分子结构推理	57.26	32.62	45.94
晶体结构生成	首次开源实现，通过率>40%	不支持	不支持
SciCode 科学编程	39.64	40.60	46.15
SGI-Bench 科学智能体交互	52.52	37.30	36.16
MMLU Pro 通用知识推理	88.00	85.12	83.44
IMO-Bench 国际数学奥赛	84.00	81.00	79.0
PinchBench 通用智能体编码	88.22	87.05	85.00
FrontierScience-Research 科研智能体	19.44	10.00	10.00
训练范式	全链路通专融合 + RL强化学习	通用预训练 + 后训练	通用预训练 + 后训练
算力生态	昇腾 Atlas 900 A3 深度优化	多元算力	多元算力
核心差异	以35B参数实现晶体结构生成等专有科学能力，科学智能体与推理效率显著领先同/更大规模模型	通用能力强，但在专业科学任务（分子结构、科研智能体）上明显落后	参数规模大，科学编程略优，但科学发现、分子推理与智能体任务落后，且不具备晶体结构生成能力