系统简介
本计算集群为提供超高计算量需求,每个节点配置1颗32核心2.5GHz主频的x86处理器和4块加速卡,每节点配置8根16GB DDR4 2666 ECC REG内存,并配置两套曙光Parastor300S并行存储系统,提供大容量数据存储。网络通信方面,集群采用全线速、无阻塞的200Gb HDR Infiniband专用计算网络,是目前最先进的通信网络,能极大提升计算的速度和扩展性。此外,集群配置有完整、高效、专业的基础软件,包括操作系统、并行编译开发环境等,支持CPU和加速卡的多种编译环境及应用,主要包括编译器、调试器、mpi并行开发环境及数学库等。使用计算服务实现集群监控管理和作业调度功能,极大简化集群管理和监控工作,提升集群使用的灵活性和利用效率。计算服务提供高级别的任务队列管理和调度功能,可以针对不同用户、不同应用设置不同的优先级别,从而保障关键业务的正常运行。
加速卡是计算服务提供的一种高速计算卡,可以广泛应用于大气海洋环境、物理化学材料、工程仿真、人工智能、生命科学、遥感、石油勘测等领域。计算服务为用户提供两种类型的队列:kshctest和kshdtest。其两种队列的差异化配置,如下表所示,kshctest可用节点168个,kshdtest可用节点40个。
队列名 | kshctest | kshdtest |
---|---|---|
队列包含节点数 | 168 | 40 |
节点配置 | 32核心 | 32核心,4卡 |
操作系统 | Centos7.6 | Centos7.6 |
最大用户作业提交数 | 50 | 50 |
最大作业运行时长 | 72h | 72h |
单用户资源权限 | 320核心 | 64核心,8卡 |
单用户存储空间 | 500GB | 500GB |