鹤思¶
面向高性能计算和人工智能工作负载的分布式调度系统 — 专为性能、规模和简单性而构建。
为什么选择鹤思?¶
-
高性能
每秒超过 10 万次调度决策,快速的作业资源匹配。
-
可扩展性
经过验证的设计,支持百万核心集群和大规模部署。
-
易用性
为用户和管理员提供简洁一致的命令行界面(cbatch、cqueue、crun、calloc、cinfo 等)。
-
安全性
内置基于角色的访问控制(RBAC)和加密通信。
-
弹性
自动作业恢复,无单点故障,快速状态恢复。
-
开源
社区驱动,具有可插拔架构的可扩展性。
快速开始¶
架构¶

鹤思引入了资源管理器以同时支持 HPC 和 AI 工作负载:
- HPC 作业:Cgroup Manager 分配资源并提供基于 cgroup 的隔离。
- AI 作业:Container Manager 使用 Kubernetes 进行资源分配和容器生命周期管理。
命令行参考¶
链接¶
- 演示集群:https://hpc.pku.edu.cn/demo/cranesched
- 后端:https://github.com/PKUHPC/CraneSched
- 前端:https://github.com/PKUHPC/CraneSched-FrontEnd
许可证¶
鹤思采用 AGPLv3 和商业许可证双重许可。有关商业许可,请查看 LICENSE 文件或联系 mayinping@pku.edu.cn。