CraneSched功能和特点

资源管理功能

  • 资源查看
  • 资源调度
  • 资源管理(增加/减少/节点状态变化等)
  • 资源审计(节点状态变化事件记录)

作业管理功能

  • 作业提交
  • 作业取消
  • 作业修改,时间延长等
  • 作业状态查询
  • 作业审计

特点

  • 完全开源
  • 支持高性能计算与智能计算两种作业模式
  • 高可靠故障恢复,容错性高
  • 资源和节点状态可持续化,宕机之后重启自动恢复
  • 高度可扩展性,可以同时支持提交/取消/管理多个独立作业
  • 高性能,每秒可处理多个作业,为作业分配资源并运行

常用命令

常用术语

  • job: 作业
  • node: 计算节点
  • core: CPU核
  • tasks: 任务数,一般一个任务使用一个CPU核,可理解为作业所需的CPU核数
  • partition: 分区
  • user: 用户名
  • account: 账户
  • stdout: 标准输出文件,程序运行正常时输出信息的文件,一般指输出到屏幕的信息
  • stderr: 标准错误文件,程序运行错误时输出信息的文件,一般指输出到屏幕的信息

results matching ""

    No results matching ""