使用
本项目面向开发和测试人员,基于Vagrant,采用VirtualBox作为Provider,提供slurm+OpenSCOW集群一键部署方案,极大简化了部署流程和部署门槛。
部署slurm+OpenSCOW四节点集群,节点角色及默认配置如下表所示:
节点名称/角色 | 主要服务 | 私网IP | 配置 |
---|---|---|---|
scow | scow:portal、mis、auth、gateway | 192.168.88.100 | 4C4G |
slurm | slurmdbd、slurmctld、slurmd、mariadb、nfs-server、slapd、sssd | 192.168.88.101 | 2C2G |
login | slurmd、sssd、nfs、Xfce、KDE、MATE、cinnamon | 192.168.88.102 | 2C2G |
cn01 | slurmd、sssd、nfs、Xfce、KDE、MATE、cinnamon | 192.168.88.103 | 2C2G |
1. 集群一键部署
把scow-vagrant项目clone下来,在这个项目根目录下执行以下命令:
git clone https://github.com/PKUHPC/scow-vagrant.git
部署前准备:
- 下载最新Release的openscow-cli,拷贝至
scow\scow-deployment
目录,并命名为cli
; - 编译生成最新的适配器可执行程序(CentOS7.9),替换
adapter
目录下的scow-slurm-adapter-amd64
(默认为与OpenSCOWv1.2.3
匹配版本),编译参考文档; - 修改配置文件
scow\scow-deployment\install.yaml
,imageTag
修改为与cli
匹配的版本,例如v1.2.3
。
一键部署命令:
vagrant up
- 第一次部署需要从vagrant clould拉取vagrant镜像,速度会比较慢,请耐心等待。