管理场景
依据常见的管理场景介绍管理员的基本操作。
新建集群 & 集群添加机器的场景
当集群刚刚建立或者集群刚刚增加了新的 GPU 机器后通常需要做以下工作:
- 配置 「GPU」 类型和个数
- 依据集群规模创建「算力资源(Resource)」,并设置合理的个数
增加用户
两种方式:
用户资源添加
在「管理用户资源」 下为用户增加相应的资源。
修改用户的并行限制
如果用户需要同时运行多个任务,可以在「管理用户资源」 下修改用户的并行限制。
组织创建与赋权场景
组织 (Org) 是供多名用户共享计算资源和集中管理额度的主要方式,通常由普通用户(即组织 Owner)自行创建与维护。系统管理员的主要管理场景如下:
- 赋予创建权限:系统管理员可以控制并赋予特定用户创建组织 (Org) 的权限。
- 分配席位上限:在组织成立后,系统管理员可以设定或调整该组织的「席位总数」,以控制组织的扩张规模。
- 放权管理:具体的成员邀请、角色分配以及内部资源的细粒度流转,均由组织的 Owner 自行在组织控制面板完成,系统管理员通常无需直接下场进行组织内的操作。