华纳兄弟探索借力 AWS Graviton:机器学习推理更快、成本更低

华纳兄弟探索公司(WBD)是全球知名的媒体与娱乐企业,内容覆盖电视、电影与流媒体等多个领域。随着用户对个性化内容的期待持续提升,WBD 决定升级其 AI/ML 推理基础设施来优化用户体验。在这个过程中,他们引入了 AWS Graviton 处理器与 Amazon SageMaker AI 实例,取得了明显的成本下降与性能提升。

image.png

WBD 面向全球超过 1.25 亿用户,其推荐系统需要在实时场景中高效稳定地运行。为应对不断增长的访问需求与成本压力,在 AWS 的协助下,WBD 着手迁移到 Graviton 实例。借助这次迁移,他们不仅压缩了基础设施费用,还让推理更快,平均成本节约约 60%;在某些场景(尤其是目录排序模型)中,节约幅度最高达到 88%。

在速度方面,WBD 的改造同样成效显著。优化后的环境让不同模型的 P99延迟降低了 7% 至 60%,其中 XGBoost 模型的延迟降幅达到 60%。更快、更精准的推荐让用户获取内容的体验更顺滑,也提升了用户活跃度与留存。

这次迁移推进顺畅,从小规模验证到全面上线仅用了一个月。WBD 还计划将更多推荐相关的工作负载转移到 Graviton 实例,以进一步提升运营效率、降低成本。

划重点:

🌟 成本平均降至 60%:通过迁移到 AWS Graviton 实例,个性化推荐系统的运行成本显著下降。  

⚡ 推理更快:不同模型的 P99延迟下探 7%–60%,用户获得内容推荐更及时。  

🔧 迁移节奏快:从测试到全面部署只用一个月,项目高效落地。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享