跳转至

鹤思

面向高性能计算和人工智能工作负载的分布式调度系统 — 专为性能、规模和简单性而构建。

快速开始 体验演示 GitHub


为什么选择鹤思?

  • 高性能


    每秒超过 10 万次调度决策,快速的作业资源匹配。

  • 可扩展性


    经过验证的设计,支持百万核心集群和大规模部署。

  • 易用性


    为用户和管理员提供简洁一致的命令行界面(cbatch、cqueue、crun、calloc、cinfo 等)。

  • 安全性


    内置基于角色的访问控制(RBAC)和加密通信。

  • 弹性


    自动作业恢复,无单点故障,快速状态恢复。

  • 开源


    社区驱动,具有可插拔架构的可扩展性。


快速开始


架构

鹤思架构

鹤思引入了资源管理器以同时支持 HPC 和 AI 工作负载:

  • HPC 作业:Cgroup Manager 分配资源并提供基于 cgroup 的隔离。
  • AI 作业:Container Manager 使用 Kubernetes 进行资源分配和容器生命周期管理。

命令行参考


链接


许可证

鹤思采用 AGPLv3 和商业许可证双重许可。有关商业许可,请查看 LICENSE 文件或联系 mayinping@pku.edu.cn。