在维护一个大规模 Kubeflow 集群时,我们遇到了一个棘手的状态管理问题。某些复杂的 Pipeline 需要一个轻量级、高可用的协调服务来存储关键元数据,例如当前执行阶段、动态生成的配置或是小规模的中间产物校验和。这些数据要求强一致性,
2023-10-27