SCOW升级:从v0.4.0(及以上)到v1.0.0
· 阅读需 4 分钟
本文档适用于从v0.4.0(及以上)升级到v1.0.0。
# 两种方式升级cli
# 1. 直接下载替换本地cli
wget https://github.com/PKUHPC/OpenSCOW/releases/download/v1.0.0/cli-x64
# 2. 使用命令升级
./cli update --release v1.0.0
2. 添加审计日志功能
在install.yaml添加如下配置:
# 可添加审计日志功能,并配置审计日志数据库密码
audit:
dbPassword: "must!chang3this"
install.yaml配置参考(极简配置):
port: 80
basePath: /
imageTag: v1.0.0
portal:
portMappings: {}
mis:
dbPassword: must!chang3this
portMappings: {}
log:
fluentd:
logDir: /var/log/fluentd
auth:
portMappings: {}
audit:
dbPassword: "must!chang3this"
gateway:
proxyReadTimeout: 36000s
添加审计日志配置文件,在./config
目录下添加audit.yaml
# 审计系统数据库的信息。可以不修改
db:
host: audit-db
port: 3306
user: root
dbName: scow_audit
3. 修改mis.yaml
修改mis.yaml,去掉源作业数据库相关配置,去掉fetchJobs.db
配置,类似如下:
fetchJobs:
# 源作业信息数据库的数据 库信息
db:
host: 192.168.188.11
port: 3306
user: root
password: "aUTx373~5pU@!&^6"
dbName: hpc
tableName: job_table
type: mysql
mis.yaml配置参考(极简配置):
db:
host: db
port: 3306
user: root
dbName: scow
fetchJobs:
periodicFetch:
enabled: true
cron: "*/10 * * * *"
predefinedChargingTypes:
- 测试
accountNamePattern:
regex: "(a_)[a-z]+$"
4. 部署适配器
适配器编译部署可参考文档。
提示
由于github代码仓库下载的适配器可执行程序是由github action生成,glibc版本(2.34)较高,若slurm适配器部署节点的glibc版本低于该版本,建议下载源码,自行编译。
5. 修改集群配置文件
displayName: hpc01
loginNodes:
- name: hpc01_login01
address: hpc01_login01
adapterUrl: "192.168.188.102:8999"
提示
注意将登录节点loginNodes.address
参数和适配器urladapterUrl
修改为实际集群的值。详细配置可参考该文档。
6. 交互式应用增加图标(可选)
支持为交互式应用配置图标:将图标文件上传至./public/apps/
目录,并在应用配置文件中添加图标的路径。
例如给jupyter添加一个图标(已将jupyter.png
上传至./public/apps/
),在jupyter.yaml中添加如下内容:
logoPath: /apps/jupyter.png
提示
多集群下交互式应用配置可参考该文档。
7. 登录页面添加slogan(可选)
支持登录界面自定义slogan内容,修改./config/auth.yaml
文件,添加如下内容:
ui:
backgroundImagePath: "./assets/background.png"
backgroundFallbackColor: "#9a0000"
logoType: "dark"
slogan:
color: "white"
title: "开源算力中心门户和管理平台"
texts:
- "图形化界面,使用方便"
- "功能丰富,管理简单"
- "一体化部署,开箱即用"
- "标准化平台,支持算力融合"
- "开源中立,独立自主"
提示
详细配置可参考该文档。
8. 重启服务
./cli compose down
./cli compose up -d