1.Well全称The Well: A Large-Scale Collection of Diverse Physics Simulations for Machine Learning核心特点多样性与真实科学场景。内容这是一个极其庞大的物理模拟数据集集合约 15TB。它不仅仅包含流体力学还涵盖了 16 个不同的物理领域包括天体物理如超新星爆炸、星系形成、地球物理、声学、生物系统等。作用在 Walrus 的训练中Well 数据集提供了跨学科的广度帮助模型学习不同物理场如磁场、密度场、流速场之间的通用规律。文中提到的“高分辨率、来源于真实科学问题”正是指它包含了许多由科学家生成的、用于实际研究的高精度模拟数据。2.FlowBench全称FlowBench: A Large Scale Benchmark for Flow Simulation over Complex Geometries核心特点几何复杂性与标准流体场景。内容这是一个专注于流体力学CFD的数据集包含超过 10,000 个流体流动的样本。它的特色在于引入了各种复杂的几何形状如机翼、管道中的障碍物、不规则物体并模拟流体流过这些物体时的速度、压力和温度变化。作用在 Walrus 的训练中FlowBench 弥补了单纯科学数据的不足重点训练模型处理“边界条件”的能力——即当流体遇到复杂的障碍物时该如何流动。这对应了文中提到的“引入几何复杂障碍物”和“复杂流动模式”。3. 总结来说Well 负责教模型“物理世界有多广阔”跨领域的物理规律FlowBench 负责教模型“环境有多复杂”复杂几何结构下的流体细节。4. 参考文献覆盖天体物理/地球科学/流变学/声学等19种场景Polymathic AI构建1.3B模型实现精确连续介质仿真