应用场景

使用高性能计算集群进行深度学习等需要高速的数据传输能力的作业时,需要将文件存储 EPFS 与 GPU 云服务器之间建立 IB 网路,可参考如下步骤进行。

操作步骤

  1. 登录 QingCloud 管理控制台,点击产品与服务 > 计算 > 云服务器

  2. 在云服务器列表页面,点击+创建

  3. 弹出的购买云服务器的页面中,创建 GPU 加速型云服务器,并且选择 CentOS 且 支持 IB 网络的标准镜像。

    lustre 1
  4. 其他参数根据实际情况进行设置后,点击立即购买即可。

  5. GPU 云服务器创建完成后,点击顶部导航栏产品与服务 > 存储服务 > 文件存储 EPFS

  6. 点击右侧导航栏中的文件存储,选择挂载至 HPC 或 EHPC 集群上的文件存储,点击其名称/ID

  7. 进入相应文件存储目录的详情页面,在权限组页签,点击添加规则

    lustre 2
  8. 在弹出的添加规则的窗口中,输入步骤 4 已创建完成的主机的 IP 地址,点击确定即可。

    lustre 3
  9. 登录至步骤 4 创建完成的主机,执行如下命令将文件存储系统挂载至相应的挂载点上。

    // 创建挂载点
    $ mkdir /mnt/data_lustre
    
    // 执行挂载命令
    $  mount -t  lustre 10.103.100.93@o2ib:10.103.100.94@o2ib:/es01  /mnt/data_lustre
    说明
    • /mnt/data_lustre 为挂载点名称,可根据实际情况进行修改。

    • 10.103.100.93@o2ib:10.103.100.94@o2ib:/es01 为固定 Lustre 信息,无需修改。

    • 登录主机可参考云服务器相关内容。