找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2335

积分

0

好友

313

主题
发表于 3 小时前 | 查看: 2| 回复: 0

为应对千万级终端接入、毫秒级实时响应以及跨地域业务连续性等挑战,长城汽车联合阿里云完成车联网消息总线全面升级,基于云消息队列 RocketMQ 版构建跨云多活架构,为全球车主提供“永远在线”的智能服务体验。本文将介绍长城汽车在消息总线跨云双活的实践,通过引入云消息队列 RocketMQ 版的 Global Replicator,实现多云之间消息秒级同步,并结合 Serverless 的极致弹性能力进一步提升系统可靠性与成本效率。

长城汽车加速转型发展,消息总线升级护航业务

在智能汽车产业快速发展的背景下,车联网服务(TSP)已成为主机厂从“硬件制造”向“数据驱动服务”转型的关键引擎。长城汽车正加速从传统汽车制造商向“全球化智能科技公司”转型,以智能网联技术为核心,构建覆盖研发、生产、服务全链条的数字化生态。其云平台战略聚焦“软件定义汽车”,通过云原生技术、分布式架构与数据驱动能力,打造“车路云一体化”的智能出行解决方案。

消息总线作为云平台核心基础设施,承载跨业务异步集成与事件驱动,是支撑复杂业务流程自动化与实时数据交换的关键。随着业务规模与接入系统持续增长,长城汽车对消息总线提出更高的稳定性、可用性与扩展性要求。同时,在业务全球化与合规要求趋严的背景下,多云架构可增强运营韧性,实现资源优化与灵活调度,避免单点故障影响关键业务流程,保障业务连续性与体验一致性。

基于上述诉求,长城汽车对消息总线进行全面升级,核心目标是构建跨云双活能力:在故障场景下快速切换并保持业务连续,同时提升高并发接入下的稳定性与运维效率。本次升级引入阿里云云消息队列 RocketMQ 版的 Global Replicator,实现多云之间消息秒级同步,并结合 Serverless 弹性伸缩进一步增强系统可靠性,为全球车主“永远在线”的智能服务提供更稳固的消息底座。

长城汽车消息总线的核心特点

长城汽车消息总线的设计目标,是构建“消息、事件一体”、“中心、边缘一体”的事件总线平台,核心特点包括:

  1. 标准化接入协议(HTTP): 采⽤ HTTP 协议作为统一接入协议,构建标准化的消息⼊⼝和出⼝接⼊点,降低系统接⼝门槛,便于精细化流量管理与控制。
  2. 稳定可靠的消息存储组件: 选用 Apache RocketMQ 作为消息存储组件,凭借其稳定可靠、高性能与功能丰富等优势,充分满足企业级消息服务需求。
  3. 支持高级消息特性: 支持顺序消息(按特定顺序消费)与定时/延时消息(按指定时间投递)等能力,满足时间敏感、流程复杂场景的精确控制需求。
  4. 集成长城集团云平台周边系统: 打通主题创建、消费组配置、权限分配等资源管理与现有工单系统,实现从请求提交到资源分配的全流程⾃动化;对接钉钉通知实现业务通知与告警;对接服务治理平台实现全链路灰度。
  5. 跨云高可用部署架构: ⽀持跨多云环境双活/多活部署,确保单数据中⼼故障时可⽆缝切换⾄备⽤节点继续运⾏,并通过一致性机制保障业务连续性与数据完整性。

长城汽车消息总线核心架构流程图

构建跨云双活架构的关键挑战

作为云平台消息中枢,消息总线支撑跨业务实时数据流转,其可靠性直接影响业务连续性和用户体验。为满足核心业务的高可用诉求,跨公有云双活成为关键目标,但在设计与落地过程中主要面临以下挑战:

▍ 1. 跨云传输实时性与业务容限的权衡

  • 网络延迟叠加: 跨公有云通常依赖公网传输,端到端延迟显著增加;叠加多云环境下的跨地域距离与同步协议开销,总延迟可能突破业务容忍阈值。
  • 一致性代价: 为保障双活集群数据强一致性,需引入额外的同步机制,会进一步加剧延迟。

▍ 2. 混合云环境的兼容性与安全性挑战

  • 版本与协议兼容性: 现有自建 RocketMQ 4.x 集群存在深度定制,引入云上托管 RocketMQ 5.x 服务以降低运维复杂度,需要兼容开源 Apache RocketMQ 4.x 和云上托管服务 RocketMQ 版本。
  • 多云安全隔离: 跨云消息同步链路需加密传输与访问鉴权(如基于 VPC 对等连接的流量隔离)。

▍ 3. 特殊消息类型的跨云一致性保障

  • 顺序消息: 如流水单、订单状态变更等场景,要求消息严格按 Key 分组并有序消费。跨云同步需确保同一分组消息不乱序(如阿里云集群主节点故障时,其他云备节点接管且不破坏顺序)。
  • 延时消息: 如营销活动定时通知等场景,依赖精确的时间控制。跨云同步需保证延时触发时间在毫秒级误差范围内,避免业务逻辑错乱。

▍ 4. 成本与高可用性的平衡难题
双活部署需要在两朵云上独立部署完整集群(包括 Broker、NameServer、存储节点等)来保障高可用性,基础资源与运维成本接近翻倍。

跨云业务域与消息总线架构图

长城汽车消息总线跨云双活方案

长城汽车消息总线跨云双活架构要点如下:

  • 消息总线基于其他云和阿里云跨云部署,通过专线通信确保网络可靠性。
  • 管理服务部署在其他云,与消息总线服务解耦,避免管理服务故障影响消息总线运行。
  • 跨云消息同步采用云消息队列 RocketMQ 版的 Global Replicator 实现秒级数据同步。
  • 基于动态 DNS 实现双活节点流量按自定义比例分配,并在单云故障时支持一键切流。

跨云双活架构实施流程图

▍ 1. 双活与容灾能力
采用其他云自建 RocketMQ 与阿里云云消息队列 RocketMQ 版构建多云双活架构,云消息队列 RocketMQ 版提供全球消息备份的容灾能力。

  • 消息数据一致性: 两地消息全量互备,数据可靠性更高;重试策略可在⽹络分割等极端场景下确保数据⼀致性和完整性;同步策略与备份方式可灵活配置,降低开发成本;内置消息过滤机制,避免消息在跨云传输过程中重复复制。
  • 服务可用性: 消息服务提供两地容灾能力,服务可用性更高,业务恢复更快,延续性更强。
  • 高级消息支持: 顺序消息按顺序复制,保障顺序语义;延时消息在源集群对消费者可见后(已到延时时间)再复制到目标集群,保障延时语义,消费端可⽴即消费。
  • 同步能力弹性可扩展: Global Replicator 同步链路可弹性扩展,以满足低延时同步要求。
  • 流量自定义分配: 动态 DNS 支持灵活分配双活节点流量,并可结合健康检测自动切换。

▍ 2. 版本兼容

  • 云消息队列 RocketMQ 版 5.x 系列兼容开源 RocketMQ 4.9 SDK,业务逻辑无需改造;在收发可靠性与多副本存储方面提供保障,并提供弹性规格以应对突发流量。
  • 服务可用性: 自建集群缺少 SLA 保障,故障恢复依赖自运维。而云消息队列 RocketMQ 版天然支持多可用区部署,具备同城容灾能力,服务可用性最高可达 99.99%。
  • 管控适配: 云消息队列 RocketMQ 版提供标准管控 API 与可观测数据,便于与消息总线进行管控与运维集成。

开源自建与商业版消息队列架构对比图

▍ 3. 高级特性消息
云消息队列 RocketMQ 版全球消息备份能力,在传输过程中保障源集群数据语义。

  • 顺序消息: 同步到目标集群时保持与写入源集群的顺序一致。
  • 定时消息: 以“源集群消息对消费者可见”为同步触发条件。

▍ 4. 降本增效
汽车行业流量波动明显,云消息队列 RocketMQ 版 5.x Serverless 系列可根据实时负载自动弹性伸缩、按量付费,无需预估和配置实例规格。相比“按峰值预留并叠加冗余”的方式,可显著降低资源闲置成本。

Serverless实例TPS峰值监控图

消息总线全面升级的关键价值

▍ 1. 能力升级:面向全球业务的消息底座

  • 技术领先性: 依托云消息队列 RocketMQ 版千万级 TPS 吞吐与毫秒级低延迟,构建跨云多活架构的车联网消息平台。通过“多地域集群 + 逻辑 Topic 分区”实现车辆数据就近接入与跨云无缝路由,突破传统架构单云单点的瓶颈,支撑全球化业务布局。智能流量调度跨域传输延迟降低 30% 以上。
  • 架构先进性: 云消息队列 RocketMQ 版 5.0 采用云原生架构(计算存储分离、无状态代理层),实现资源弹性伸缩与故障秒级隔离。结合Serverless化部署,提升扩容效率与资源利用率,支撑突发流量场景(如大规模 OTA 推送)平稳运行。

▍ 2. 稳定可靠:多云互联下的全链路容灾
面对服务商级网络中断等极端场景,基于云消息队列 RocketMQ 版的跨云、跨地域的多活容灾体系,通过三级容灾防护实现“零数据丢失、零感知切换”的高可用性

  • 同城双活: 基于阿里云多可用区(AZ)部署,RPO=0、RTO<30 秒;
  • 跨云灾备: 跨云异步复制,保障核心业务数据跨地域冗余;
  • 智能故障自愈: 通过流量染色与灰度路由自动隔离异常节点,结合 AIOps 预测潜在风险,故障恢复时间缩短至分钟级。

▍ 3. 弹性降本:Serverless 系列按需弹性
借助云消息队列 RocketMQ 版 Serverless 系列,实现“按量付费 + 弹性容量”的轻量化运维:

  • 成本直降 50%+: 按实际吞吐计费,闲时资源自动释放,降低资源与运维成本;
  • 敏捷创新: 开发人员通过 API 分钟级接入消息服务,无需关注底层基础设施,新功能上线周期缩短 20%。

重塑车联网服务边界,驱动产业智能升级

长城汽车车联网 TSP 平台的跨云多活升级,不仅是技术架构的迭代,更是对“用户价值优先”理念的践行。借助阿里云云消息队列 RocketMQ 版,长城汽车构建了高可靠、高性能、高性价比的全球车联网服务基座,为未来 V2X 协同与个性化用户服务奠定坚实基础。

面向智能汽车竞争的“下半场”,长城汽车将持续以技术领先定义行业标准,让每一辆车成为万物互联世界中最可靠的智能节点,与全球合作伙伴共建车联网新生态。这一实践也为面临类似挑战的企业提供了可参考的高可用架构范本。欢迎在云栈社区与我们交流更多关于云原生与消息中间件的实践经验。




上一篇:Rust I/O 编程:write_all 方法如何防御数据部分写入风险
下一篇:Metasploit Pro 5.0.0发布:红队演练新利器,网络拓扑与AD CS漏洞检测全面升级
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-15 12:00 , Processed in 0.462150 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表