分区信息查询-sinfo
用户在使用时,首先需要了解哪些分区可以使用。在曙光智算计算服务平台中,使用sinfo命令查询队列信息。
根据命令输出,可以看到当前节点所在集群的作业调度系统的队列情况,并可看到每个分区可访问的空闲节点数量、节点名称。
命令的默认输出中,PARTITION表示分区、NODES表示节点数、STATE表示节点运行状态、NODELIST表示节点列表。
其中状态一列中idle表示节点处于空闲状态,可接收新的作业;
allocated表示节点已经分配了一个或者多个作业且所有核心用满,在作业释放前不能再被分配作业;
mix状态为使用部分核心,仍可以被分配作业;
drain状态表示对应节点已经下线;
drng表示已下线但仍有作业在运行。
需要关注的是PARTITION和STATE两列。PARTITION指示任务可提交到的分区(即队列)。
下表列出关于sinfo命令常用选项,更多选项可通过man sinfo命令查看sinfo手册。
sinfo 参数 | 说明 |
---|---|
-a, --all | 查看所有分区信息 |
-d, --dead | 查看处于dead状态的详细信息 |
-l, --long | 查看分区详细信息 |
-N, --Node | 查看节点信息 |
-p <patition>, --partition=<partition> | 查看指定分区信息 |
-t <states>, --state=<state> | 查看指定状态的节点 |