Nomad 是一个简单灵活的工作负载编排器,用于在本地和云中大规模部署和管理容器(docker、podman)、非容器化应用程序(可执行文件、Java)和虚拟机 (qemu)。
Nomad在Linux,Windows和macOS上受支持。Nomad的商业版本Nomad Enterprise也可用。
Nomad 提供几个关键功能:
部署容器和旧版应用程序:Nomad 作为协调程序的灵活性使组织能够在同一基础架构上同时运行容器、旧版和批处理应用程序。Nomad 为旧版应用程序带来了核心编排优势,而无需通过可插拔任务驱动程序进行容器化。
简单可靠:Nomad作为单个二进制文件运行,并且完全独立 - 将资源管理和调度结合到单个系统中。Nomad不需要任何外部服务进行存储或协调。Nomad 自动处理应用程序、节点和驱动程序故障。Nomad 是分布式和弹性的,使用领导者选举和状态复制在发生故障时提供高可用性。
设备插件和GPU支持:Nomad为GPU工作负载(如机器学习(ML)和人工智能(AI))提供内置支持。Nomad 使用设备插件来自动检测和利用来自硬件设备(如 GPU、FPGA 和 TPU)的资源。
多区域、多云联盟:Nomad 旨在支持全球范围内的基础设施。Nomad 支持开箱即用的联合,并且可以跨多个区域和云部署应用程序。
经过验证的可扩展性:Nomad 乐观地并发,可提高吞吐量并减少工作负载的延迟。Nomad已被证明可以在实际生产环境中扩展到10K +节点的集群。
HashiCorp生态系统:Nomad与Terraform,Consul,Vault无缝集成,用于配置,服务发现和机密管理。
有关为非生产用途设置本地 Nomad 群集的说明,请参阅学习:入门。
(可选)在 terraform
目录中查找用于在公有云上启动开发 Nomad 集群的 Terraform 清单。
有关推荐的做法和生产部署的参考体系结构,请参阅学习:Nomad 参考体系结构。
Nomad网站上提供了完整,全面的文档:https://www.nomadproject.io/docs
指南可在HashiCorp Learn上找到。
有关更多开发人员文档,请参阅贡献
目录。