使用 Amazon SageMaker 多模型终端节点和 TorchServe 在 GPU 上运行多个生成式 AI 模型,最多可节省 75% 的推理成本 | 亚马逊网络服务 源群集: AWS机器学习 源节点: 1887176时间戳记: 2023 年 9 月 6 日