PmaControl logo PmaControl
  • Главная
  • PmaControl
    • ИИ-агенты 13 on-premise агентов
    • Тарифы Community, Cloud, On-Premise, Premium
    • Документация Руководства, API, архитектура
    • Клиенты 28+ компаний
    • FAQ 25 вопросов / 7 категорий
    Базы данных
    • MariaDB 30 статей
    • MySQL 10 статей
    • Galera Cluster 6 статей
    • MaxScale 3 статьи
    • ProxySQL 2 статьи
    • Amazon Aurora MySQL 0 статьи
    • Azure Database 0 статьи
    • ClickHouse 0 статьи
    • GCP CloudSQL 0 статьи
    • Percona Server 0 статьи
    • SingleStore 0 статьи
    • TiDB 0 статьи
    • Vitess 0 статьи
    Решения
    • Поддержка 24×7 Экстренная помощь MariaDB & MySQL
    • Observabilité SQL Мониторинг, алерты, топология
    • Haute disponibilité Репликация, failover, Galera
    • Disaster Recovery Backup, restore, RPO/RTO
    • Sécurité & conformité Аудит, GDPR, SOC2
    • Migration & upgrade Zero downtime, pt-osc, gh-ost
  • Тарифы
  • Ресурсы
    • Документация Технические руководства и API
    • FAQ 25 частых вопросов
    • Отзывы Отзывы клиентов и кейсы
    • Блог Статьи и аналитика
    • Roadmap Планируемые функции
    Области экспертизы
    • Observabilité SQL Мониторинг, алерты, топология Dot3
    • Haute disponibilité Репликация, failover, Galera
    • Sécurité & conformité Аудит, GDPR, SOC2, ISO 27001
    • Disaster Recovery Backup, restore, RPO/RTO
    • Performance & optimisation Digests, EXPLAIN, tuning
    • Migration & upgrade Zero downtime, pt-osc
    Быстрые ссылки
    • Wiki GitHub 26 страниц — установка, движок, плагины
    • Исходный код Официальный репозиторий GitHub
    • Поддержка 24×7 Экстренная помощь MariaDB & MySQL
    • Записаться на демо 30 мин — реальная архитектура
  • Поддержка 24×7
  • Записаться на демо
Записаться на демо
🇫🇷 FR Français 🇬🇧 EN English 🇵🇱 PL Polski 🇷🇺 RU Русский 🇨🇳 ZH 中文
← Вернуться в блог

Контролировать неконтролируемое: анатомия краха дата-центра

Опубликовано March 15, 2026 Автор Aurélien LEQUOY
incident disaster-recovery galera
Поделиться X LinkedIn Facebook Email PDF
Контролировать неконтролируемое: анатомия краха дата-центра

Контекст

Пятница, 22:47. Приходит алерт в Telegram: основной дата-центр недоступен. Не сервер, не стойка — весь ДЦ. Каскадное отключение электропитания, ИБП не выдержали.

28 экземпляров MariaDB / MySQL, 3 кластера Galera, 2 ProxySQL. Всё в оффлайне.

Хронология

Время Действие
22:47 Алерт PmaControl — ДЦ недоступен
22:49 Подтверждение от OVH — инцидент с электропитанием
22:51 Переключение DNS на резервный ДЦ
22:54 Bootstrap Galera на выжившем узле
22:58 Автоматическая переконфигурация ProxySQL
23:01 Первые успешные SELECT на резервном кластере

Извлечённые уроки

  1. Бэкапов недостаточно — без протестированного плана восстановления они бесполезны
  2. Galera IST vs SST — разница между 2 минутами и 2 часами восстановления
  3. PmaControl обнаружил инцидент за 12 секунд — раньше алерта от OVH

Заключение

14 минут между алертом и первым SELECT. Это результат подготовки, а не везения.

«Бэкап не заменяет стратегию восстановления.» — PmaControl

Поделиться X LinkedIn Facebook Email PDF
← Вернуться в блог

Комментарии (0)

Комментариев пока нет.

Оставить комментарий

PmaControl
+33 6 63 28 27 47 contact@pmacontrol.com
Юридическая информация GitHub Контакты
Не ждите инцидента, чтобы понять свою архитектуру. © 2014-2026 PmaControl — 68Koncept