机器人基础设施:在 Azure 上部署 DeepMind 的 MuJoCo,第 2 部分:Microsoft 听到了我们的声音

机器人基础设施:在 Azure 上部署 DeepMind 的 MuJoCo,第 2 部分:Microsoft 听到了我们的声音

TL;DR 上周,我们发布了一份现场指南,介绍在 Azure ML 上部署 MuJoCo 时遇到的文件系统问题。

微软Azure团队直接回应,给出了详细的技术解释:我们不是在CIFS上,我们是在Blobfuse2上。

下载模式(在执行之前将数据暂存在本地 NVMe)是我们错过的正确修复方法。

最初的文章诚实地讲述了伤害的根源。

这个人诚实地讲述了我们错过的事情。

CIFS 上的符号链接损坏、元数据延迟终止训练脚本、本地磁盘和网络存储本身都不够好的存储钳。

来源:HackerNews New