网易(孟祥勇):中间件同城多云高可用平台建设

2025-05-03ASPCMS社区 - fjmyhfvclm

今天分享的是:网易(孟祥勇):中间件同城多云高可用平台建设

报告共计:29页

本文围绕网易数帆中间件同城多云高可用平台建设展开,由云原生资深架构师孟祥勇分享,涵盖背景、方案、成果、复盘及计划等内容。

1. 亮点介绍:轻舟中间件集群联邦架构具备灵活的调度策略,同步资源少,具有高可用特性,对管控、监控和日志的侵入性小。该架构支持多云故障情况下的高可用调度与迁移,实现多云生命周期管理。

2. 案例背景:业务创新和快速迭代对中间件的生命周期管理与高可用提出更高要求。云原生技术和多云管理技术为中间件发展提供支撑,但也面临挑战,如组件选择困难、对有状态应用支持不足、集群故障时实例迁移问题等。

3. 破题思路与成果:采用Karmada进行资源模版传播和调度,其调度功能包括集群亲和、实例拓扑、集群拓扑、污点容忍等。通过联邦调度器、联邦控制器、集群联邦组件和跨集群流量治理组件协同工作,满足中间件联邦调度需求,实现故障迁移和跨集群流量治理。该平台已在银行、证券等行业落地,减少了机房故障导致的业务不可用时长。

4. 案例复盘与总结:在跨集群调度方面,结合多种调度能力自研调度器;联邦组件选型上,对比了karmada、Virtual Kubelet等开源组件;还提出了便捷系统的跨集群流量治理方案。同时得出启示,基于云原生的业务创新需要积累云原生技术,且避免对成熟组件进行改造。

5. 下一步计划:将自研调度器功能回馈社区,推动有状态应用在多云时代的高可用建设;基于云原生把联邦集群应用于异地多活、单元化场景,进一步拓展中间件联邦的应用范围。

以下为报告节选内容

全部评论