PmaControl logo PmaControl
  • 首页
  • PmaControl
    • AI智能代理 13个本地代理
    • 定价方案 Community、Cloud、On-Premise、Premium
    • 文档 指南、API、架构
    • 客户 28+企业
    • 常见问题 25个问题 / 7个类别
    数据库
    • MariaDB 30 篇文章
    • MySQL 10 篇文章
    • Galera Cluster 6 篇文章
    • MaxScale 3 篇文章
    • ProxySQL 2 篇文章
    • Amazon Aurora MySQL 0 篇文章
    • Azure Database 0 篇文章
    • ClickHouse 0 篇文章
    • GCP CloudSQL 0 篇文章
    • Percona Server 0 篇文章
    • SingleStore 0 篇文章
    • TiDB 0 篇文章
    • Vitess 0 篇文章
    解决方案
    • 全天候支持 MariaDB & MySQL紧急支持
    • Observabilité SQL 监控、告警、拓扑
    • Haute disponibilité 复制、故障转移、Galera
    • Disaster Recovery 备份、恢复、RPO/RTO
    • Sécurité & conformité 审计、GDPR、SOC2
    • Migration & upgrade 零停机、pt-osc、gh-ost
  • 定价方案
  • 资源
    • 文档 技术指南与API
    • 常见问题 25个常见问题
    • 客户评价 客户反馈与案例
    • 博客 文章与洞察
    • 路线图 即将推出的功能
    专业领域
    • Observabilité SQL 监控、告警、Dot3拓扑
    • Haute disponibilité 复制、故障转移、Galera
    • Sécurité & conformité 审计、GDPR、SOC2、ISO 27001
    • Disaster Recovery 备份、恢复、RPO/RTO
    • Performance & optimisation Digests、EXPLAIN、调优
    • Migration & upgrade 零停机、pt-osc
    快速链接
    • GitHub Wiki 26页 — 安装、引擎、插件
    • 源代码 GitHub官方仓库
    • 全天候支持 MariaDB & MySQL紧急支持
    • 预约演示 30分钟 — 真实架构
  • 全天候支持
  • 预约演示
预约演示
🇫🇷 FR Français 🇬🇧 EN English 🇵🇱 PL Polski 🇷🇺 RU Русский 🇨🇳 ZH 中文
← 返回博客

掌控不可控:数据中心崩溃事故剖析

发布于 2026年3月15日 作者 Aurélien LEQUOY
incident disaster-recovery galera
分享 X LinkedIn Facebook Email PDF
掌控不可控:数据中心崩溃事故剖析

背景

一个周五晚上,22:47。Telegram 告警触发:主数据中心宕机。不是一台服务器,不是一个机柜——而是整个数据中心。级联电力故障,UPS 系统未能撑住。

28 个 MariaDB / MySQL 实例、3 个 Galera 集群、2 个 ProxySQL。全部离线。

事件时间线

时间 操作
22:47 PmaControl 告警 — 数据中心不可达
22:49 OVH 确认 — 数据中心发生电力事故
22:51 DNS 故障切换到备用数据中心
22:54 在存活节点上引导 Galera 集群
22:58 ProxySQL 自动重新配置
23:01 在备用集群上首次 SELECT 成功

经验总结

  1. 备份远远不够 — 没有经过测试的恢复计划,备份就毫无用处
  2. Galera IST 与 SST — 恢复时间是 2 分钟还是 2 小时的差别
  3. PmaControl 在 12 秒内检测到事故 — 甚至早于 OVH 的告警

总结

从告警到首次 SELECT,14 分钟。这是充分准备的结果,而不是运气。

"备份无法替代恢复策略。" — PmaControl

分享 X LinkedIn Facebook Email PDF
← 返回博客

评论 (0)

暂无评论。

发表评论

PmaControl
+33 6 63 28 27 47 contact@pmacontrol.com
法律声明 GitHub 联系我们
不要等到故障发生才了解您的架构。 © 2014-2026 PmaControl — 68Koncept