一级方程式 (F1) 汽车是世界上最快的受监管的公路赛车。 尽管这些开轮式汽车的时速仅比顶级跑车快 20-30 公里(或 12-18 英里),但由于强大的空气动力学特性,它们在转弯时的速度可高达 XNUMX 倍他们创造的下压力。 下压力 是由空气动力学表面产生的垂直力,将汽车压向道路,增加轮胎的抓地力。 F1 空气动力学家还必须监测限制直线速度的空气阻力或阻力。
F1 工程团队负责设计下一代 F1 赛车并制定这项运动的技术法规。 在过去的 3 年中,他们的任务是设计一款能够保持当前高水平下压力和峰值速度的汽车,但也不会因在另一辆车后面行驶而受到不利影响。 这很重要,因为上一代汽车在紧跟在另一辆车后面比赛时,由于机翼和车身产生的湍流尾流,可能会损失高达 50% 的下压力。
F1 不再依赖耗时且昂贵的赛道或风洞测试,而是使用计算流体动力学 (CFD),它提供了一个虚拟环境来研究流体的流动(在这种情况下是 F1 赛车周围的空气),而无需制造单个零件。 借助 CFD,F1 空气动力学家可以测试不同的几何概念,评估其空气动力学影响,并迭代优化他们的设计。 在过去的 3 年里,F1 工程团队与 AWS 合作建立了一个 可扩展且经济高效的 CFD 工作流程 这使 CFD 运行的吞吐量增加了三倍,并将每次运行的周转时间缩短了一半。
F1 正在研究 AWS 机器学习 (ML) 服务,例如 亚马逊SageMaker 通过使用 CFD 仿真数据构建具有更多洞察力的模型,帮助优化汽车的设计和性能。 目的是发现有前景的设计方向并减少 CFD 模拟的数量,从而减少收敛到最佳设计所需的时间。
在这篇文章中,我们将解释 F1 如何与 AWS专业服务 团队开发由 ML 提供支持的定制实验设计 (DoE) 工作流程,以建议 F1 空气动力学家在 CFD 中测试哪些设计概念,以最大限度地提高学习和性能。
问题陈述
在探索新的空气动力学概念时,F1 空气动力学家有时会采用称为实验设计 (DoE) 的过程。 这个过程系统地研究了多个因素之间的关系。 在尾翼的情况下,这可能是翼弦、跨度或外倾角,相对于空气动力学指标,例如下压力或阻力。 DoE 过程的目标是有效地对设计空间进行采样,并在收敛到最佳结果之前最大限度地减少测试的候选者数量。 这是通过迭代地改变多个设计因素、测量空气动力学响应、研究因素之间的影响和关系,然后在最优化或提供信息的方向上继续测试来实现的。 在下图中,我们展示了 F1 从其 UNIFORM 基线中与我们分享的示例尾翼几何形状。 标记了 F1 空气动力学家可以在 DoE 例行程序中研究的四个设计参数。
在这个项目中,F1 与 AWS 专业服务合作,研究使用 ML 来增强 DoE 例程。 传统的 DoE 方法需要一个填充良好的设计空间,以便了解设计参数之间的关系,因此依赖于大量的前期 CFD 仿真。 ML 回归模型可以使用先前 CFD 模拟的结果来预测给定设计参数集的空气动力学响应,并为您提供每个设计变量的相对重要性的指示。 您可以使用这些见解来预测最佳设计,并帮助设计人员以更少的前期 CFD 模拟收敛到最佳解决方案。 其次,您可以使用数据科学技术来了解设计空间中的哪些区域尚未被探索并且可能隐藏最佳设计。
为了说明定制的 ML 驱动的 DoE 工作流程,我们将通过一个设计前翼的真实示例进行演示。
设计前翼
F1 赛车依靠前翼和后翼等机翼来产生大部分下压力,我们在整个示例中都使用系数 锆。 在整个示例中,下压力值已被标准化。 在此示例中,F1 空气动力学家利用他们的专业知识将机翼几何参数化如下(请参阅下图以获取视觉表示):
- LE-高度 – 前缘高度
- 最小Z – 最小离地间隙
- 中左角 – 第三元素的前缘角
- TE-角度 – 后缘角
- TE-身高 – 后缘高度
这种前翼几何形状由 F1 共享,是 UNIFORM 基线的一部分。
选择这些参数是因为它们足以有效地描述几何的主要方面,并且因为过去,空气动力学性能对这些参数表现出显着的敏感性。 这个 DoE 例程的目标是找到五个设计参数的组合,以最大限度地提高空气动力学下压力(Cz)。 设计自由度也受到设置设计参数的最大值和最小值的限制,如下表所示。
. | 最低限度 | 最大 |
TE-身高 | 250.0 | 300.0 |
TE-角度 | 145.0 | 165.0 |
中左角 | 160.0 | 170.0 |
最小Z | 5.0 | 50.0 |
LE-高度 | 100.0 | 150.0 |
确定了设计参数、目标输出指标和设计空间的界限后,我们就拥有了开始 DoE 例程所需的一切。 我们的解决方案的流程图如下图所示。 在下一节中,我们将深入探讨不同的阶段。
设计空间的初始抽样
DoE 工作流程的第一步是在 CFD 中运行一组初始候选对象,这些候选对象可以有效地对设计空间进行采样,并允许我们构建第一组 ML 回归模型来研究每个特征的影响。 首先,我们生成一个池 N 样本 运用 拉丁超立方抽样 (LHS) 或常规网格方法。 然后,我们选择 k 候选人通过贪心输入算法在 CFD 中进行测试,该算法旨在最大限度地探索设计空间。 从基线候选(当前设计)开始,我们迭代地选择距离所有先前测试的候选最远的候选。 假设我们已经测试过 k 设计; 对于剩余的设计候选,我们找到最小距离 d 关于被测试的 k 设计:
贪心输入算法选择在特征空间中与先前测试的候选者的距离最大化的候选者:
在这个 DoE 中,我们选择了三个贪心输入候选并在 CFD 中运行它们以评估它们的空气动力下压力(Cz)。 贪婪输入候选者探索了设计空间的界限,在这个阶段,它们都没有被证明在空气动力学下压力方面优于基线候选者(Cz)。 下表显示了初始 CFD 测试的结果以及设计参数。
. | TE-身高 | TE-角度 | 中左角 | 最小Z | LE-高度 | 归一化 Cz |
底线 | 292.25 | 154.86 | 166 | 5 | 130 | 0.975 |
胃肠道 0 | 250 | 165 | 160 | 50 | 100 | 0.795 |
胃肠道 1 | 300 | 145 | 170 | 50 | 100 | 0.909 |
胃肠道 2 | 250 | 145 | 170 | 5 | 100 | 0.847 |
初始 ML 回归模型
回归模型的目标是预测 Cz 对于五个设计参数的任意组合。 有了这么小的数据集,我们优先考虑简单的模型,应用模型正则化以避免过度拟合,并尽可能结合不同模型的预测。 构建了以下 ML 模型:
- 普通最小二乘法(OLS)
- 具有 RBF 内核的支持向量回归 (SVM)
- 具有 Matérn 内核的高斯过程回归 (GP)
- XGBoost
此外,还建立了一个两级堆叠模型,其中 GP、SVM 和 XGBoost 模型的预测被 Lasso 算法同化以产生最终响应。 这个模型在这篇文章中被称为 堆叠模型. 为了对我们描述的五个模型的预测能力进行排名,实施了重复的 k 折交叉验证程序。
生成下一个设计候选以在 CFD 中进行测试
选择接下来要测试的候选人需要仔细考虑。 F1 空气动力学家必须平衡利用 ML 模型预测的选项以提供高下压力的好处与未能探索设计空间未知区域的成本,这可能会提供更高的下压力。 出于这个原因,在这个 DoE 例程中,我们提出了三个候选者:一个是性能驱动的,两个是探索驱动的。 探索驱动候选的目的还在于在设计空间的预测不确定性最高的区域中为 ML 算法提供额外的数据点。 这反过来又会导致在下一轮设计迭代中进行更准确的预测。
遗传算法优化以最大化下压力
为了获得具有最高预期空气动力学下压力的候选者,我们可以对所有可能的设计候选者进行预测。 但是,这不会是有效的。 对于这个优化问题,我们使用遗传算法 (GA)。 目标是有效地搜索一个巨大的解决方案空间(通过 ML 预测获得 Cz) 并返回最佳候选者。 GA 在解空间复杂且非凸的情况下具有优势,因此梯度下降等经典优化方法是寻找全局解的无效手段。 遗传算法是进化算法的一个子集,受自然选择、遗传交叉和变异概念的启发来解决搜索问题。 在一系列迭代(称为世代)中,最初随机选择的一组设计候选中的最佳候选被组合(很像复制)。 最终,这种机制可以让您以有效的方式找到最优化的候选人。 有关 GA 的更多信息,请参阅 在AWS上使用遗传算法来解决优化问题.
生成探索驱动的候选者
在生成我们称之为探索驱动的候选者时,一个好的抽样策略必须能够适应以下情况 效果稀疏,其中只有一部分参数会显着影响解决方案。 因此,抽样策略应在输入设计空间中分散候选者,但也要避免不必要的 CFD 运行,改变对性能影响不大的变量。 采样策略必须考虑 ML 回归器预测的响应面。 采用两种抽样策略来获得探索驱动的候选者。
在高斯过程回归器 (GP) 的情况下,标准差 预测响应面的大小可用作模型不确定性的指示。 抽样策略包括从池中选择 N 样本 , 最大化的候选者 . 通过这样做,我们在回归器对其预测最不自信的设计空间区域进行采样。 用数学术语来说,我们选择满足以下等式的候选者:
或者,我们采用贪婪的输入和输出采样策略,最大化特征空间和响应空间中提议的候选和已经测试的设计之间的距离。 这解决了 效果稀疏 这是因为修改相关性很小的设计参数的候选者具有相似的响应,因此响应面中的距离最小。 在数学术语中,我们选择满足以下等式的候选者,其中函数 f 是 ML 回归模型:
候选者选择、CFD 测试和优化循环
在这个阶段,向用户展示了性能驱动和探索驱动的候选者。 下一步包括选择提议的候选者的子集,使用这些设计参数运行 CFD 模拟,并记录空气动力学下压力响应。
在此之后,DoE 工作流程重新训练 ML 回归模型,运行遗传算法优化,并提出一组新的性能驱动和探索驱动的候选者。 用户运行建议候选的子集并继续以这种方式迭代,直到满足停止标准。 当获得被认为是最佳的候选时,通常满足停止标准。
成果
在下图中,我们记录了归一化的空气动力下压力(Cz) 来自 CFD 模拟(蓝色)和使用选择的 ML 回归模型(粉红色)为 DoE 工作流程的每次迭代预先预测的模拟。 目标是最大化空气动力下压力(Cz)。 前四次运行(红线左侧)是基线和之前概述的三个贪婪输入候选。 从那时起,测试了性能驱动和探索驱动的候选人组合。 特别是,第 6 次和第 8 次迭代的候选者是探索性候选者,两者都显示出比基线候选者(迭代 1)更低的下压力水平。 正如预期的那样,随着我们记录更多候选者,ML 预测变得越来越准确,这表现为预测和实际之间的距离越来越小 锆。 在第 9 次迭代中,DoE 工作流设法找到了与基线具有相似性能的候选者,在第 12 次迭代中,当性能驱动的候选者超过基线时,DoE 工作流结束。
下表列出了最终设计参数以及最终的标准化下压力值。 基准候选的标准化下压力水平为 0.975,而 DoE 工作流程的最佳候选记录的标准化下压力水平为 1.000。 这是一个重要的 2.5% 的相对增长。
就上下文而言,具有五个变量的传统 DoE 方法需要 25 次前期 CFD 模拟,然后才能达到足够好的拟合以预测最佳值。 另一方面,这种主动学习方法在 12 次迭代中收敛到最优值。
. | TE-身高 | TE-角度 | 中左角 | 最小Z | LE-高度 | 归一化 Cz |
底线 | 292.25 | 154.86 | 166 | 5 | 130 | 0.975 |
最佳 | 299.97 | 156.79 | 166.27 | 5.01 | 135.26 | 1.000 |
功能重要性
了解预测模型的相对特征重要性可以提供对数据的有用洞察。 它可以在移除不太重要的变量的情况下帮助进行特征选择,从而降低问题的维数并潜在地提高回归模型的预测能力,尤其是在小数据情况下。 在这个设计问题中,它让 F1 空气动力学家了解哪些变量是最敏感的,因此需要更仔细的调整。
在这个例程中,我们实现了一种与模型无关的技术,称为 排列重要性. 每个变量的相对重要性是通过计算模型预测误差的增加量来衡量的,该误差是在随机打乱该变量的值之后。 如果一个特征对模型很重要,则预测误差会大大增加,反之亦然,对于不太重要的特征。 在下图中,我们展示了预测气动下压力的高斯过程回归器 (GP) 的排列重要性 (Cz)。 后缘高度(TE-Height)被认为是最重要的。
结论
在这篇文章中,我们解释了 F1 空气动力学家在设计新颖的空气动力学几何形状时如何在 DoE 工作流程中使用 ML 回归模型。 AWS Professional Services 开发的 ML 支持的 DoE 工作流程提供了有关哪些设计参数将最大限度地提高性能或探索设计空间中未知区域的见解。 与以网格搜索方式在 CFD 中迭代测试候选对象不同,基于 ML 的 DoE 工作流程能够在更少的迭代中收敛到最佳设计参数。 这节省了时间和资源,因为需要的 CFD 模拟更少。
无论您是希望加快化学成分优化的制药公司,还是希望找到最稳健设计的设计尺寸的制造公司,DoE 工作流程都可以帮助更有效地获得最佳候选者。 AWS 专业服务随时准备为您的团队补充专业的 ML 技能和经验,以开发工具来简化 DoE 工作流程并帮助您实现更好的业务成果。 有关详细信息,请参阅 AWS专业服务,或者通过您的客户经理与您取得联系。
作者简介
巴勃罗·赫莫索·莫雷诺 是 AWS 专业服务团队的数据科学家。 他与各行各业的客户合作,使用机器学习用数据讲述故事并更快地做出更明智的工程决策。 Pablo 的背景是航空航天工程,曾在赛车运动行业工作过,他对将物理和领域专业知识与 ML 联系起来很感兴趣。 业余时间,他喜欢划船和弹吉他。
- "
- 000
- 100
- 28
- 9
- 关于
- 账号管理
- 精准的
- 实现
- 横过
- 要积极。
- 增加
- 额外
- 航空航天
- 算法
- 算法
- 所有类型
- 已经
- 尽管
- Amazon
- 另一个
- 的途径
- 围绕
- AWS
- 背景
- 底线
- before
- 作为
- 得益
- 最佳
- 建立
- 商业
- 候选人
- 候选人
- 能力
- 汽车
- 汽车
- 充
- 化学
- 选择
- 客户
- 组合
- 结合
- 公司
- 复杂
- 信心
- 考虑
- 继续
- 汇集
- 可以
- 创建信息图
- 电流
- data
- 数据科学
- 数据科学家
- 决定
- 描述
- 描述
- 设计
- 设计
- 设计
- 开发
- 发达
- 不同
- 距离
- 域
- 驾驶
- 动力学
- 边缘
- 效果
- 高效
- 有效
- 工程师
- 环境
- 成熟
- 例子
- 预期
- 体验
- 专门知识
- 勘探
- 探索
- 因素
- 时尚
- 高效率
- 快
- 专栏
- 特征
- 数字
- 姓氏:
- 适合
- 流
- 以下
- 如下
- Freedom
- 前
- 功能
- 天然气
- 通常
- 生成
- 发电
- 代
- 代
- 全球
- 目标
- 非常好
- GP
- 非常
- 格
- 有
- 高度
- 帮助
- 隐藏
- 高
- 更高
- 创新中心
- 但是
- HTTPS
- 巨大
- 图片
- 影响力故事
- 实施
- 重要性
- 重要
- 改善
- 增加
- 增加
- 日益
- 行业中的应用:
- 影响
- 信息
- 信息
- 通知
- 输入
- 洞察
- 可行的洞见
- 灵感
- 兴趣
- 调查
- IT
- 已知
- 大
- 领导
- 信息
- 学习
- Level
- 有限
- Line
- 小
- 寻找
- 机
- 机器学习
- 管理
- 经理
- 方式
- 制造业
- 数学的
- 手段
- 方法
- 指标
- 可能
- 最低限度
- ML
- 模型
- 模型
- 显示器
- 更多
- 最先进的
- 赛车
- 多
- 自然
- 数
- 获得
- 优化
- 优化
- 最佳
- 附加选项
- 秩序
- 其他名称
- 部分
- 特别
- 尤其
- 性能
- 制药
- 物理
- 播放
- 点
- 池
- 可能
- 强大
- 预测
- 预测
- 预测
- 当下
- 以前
- 市场问题
- 过程
- 生产
- 所以专业
- 项目
- 有希望
- 提供
- 建议
- 提供
- 提供
- 目的
- 赛车
- 达到
- 记录
- 减少
- 减少
- 定期
- 税法法规
- 关系
- 其余
- 表示
- 复制
- 要求
- 必须
- 需要
- 资源
- 响应
- 成果
- 回报
- 圆
- 运行
- 运行
- 科学
- 科学家
- 搜索
- 选
- 系列
- 特色服务
- 集
- 设置
- 共用的,
- 如图
- 类似
- 简易
- 模拟
- 技能
- 小
- So
- 方案,
- 解决方案
- 解决
- 太空
- 专门
- 速度
- 运动
- 运动
- 传播
- 阶段
- 实习
- 标准
- 开始
- 故事
- 策略
- 策略
- 研究
- 学习
- 优于
- 磁化面
- 目标
- 团队
- 文案
- 技术
- test
- 测试
- 测试
- 世界
- 因此
- 通过
- 始终
- 次
- 耗时的
- 时
- 轮胎
- 一起
- 工具
- 触摸
- 向
- 跟踪时
- 传统
- 揭露
- 理解
- us
- 使用
- 验证
- 折扣值
- 车辆
- 在线会议
- 什么是
- 维基百科上的数据
- 风
- 也完全不需要
- 工作
- 合作
- 世界
- 将
- 年