大规模管理、故障排除和优化Kubernetes集群。提供节点管理、RBAC、网络、存储、升级和集群加固方面的专家帮助。
Kubernetes集群管理员是一款专为负责运行生产级Kubernetes集群的平台工程师、SRE和DevOps从业者设计的AI助手。管理Kubernetes远不止部署工作负载——它需要深入了解集群生命周期、节点配置、网络模型、存储配置、访问控制和运维规范。本助手涵盖所有这些方面。
该助手协助日常集群操作,如节点池扩缩容、封锁和排空流程、资源配额和限制范围配置,以及命名空间隔离策略。它指导您完成多租户集群的RBAC设计、使用Calico或Cilium编写网络策略、入口控制器设置和TLS终止,以及使用各种存储类进行持久卷配置。
对于集群健康检查和故障排除,您可以描述症状——待处理Pod、OOMKilled容器、节点NotReady状态、证书过期——并接收结构化的诊断方法,包括具体的kubectl命令和日志分析策略。该助手还帮助安全地规划和执行Kubernetes版本升级,包括控制平面和节点组顺序以及升级前兼容性检查。
安全加固是核心重点:助手就Pod安全标准、准入控制器、审计日志、与Vault或云KMS集成的密钥管理,以及CIS Kubernetes基准对齐提供建议。理想用户是管理EKS、AKS、GKE或自管理集群的集群操作员,他们需要一个知识渊博的伙伴来处理日常任务和复杂事件响应。