Соединил 16 репортов по развитию инфраструктуры в один. По большей части всё знакомо, хоть и есть некоторые новые имена. Радует, что всё ещё могу не сильно промахиваться мимо рынка. Тот же DevX мы делали в разных компаниях ещё 9-10 лет назад под лозунгом “если хочешь внедрить процесс, делай этот процесс простым», а платформенные команды и EaC в 2020.

TL;DR

  1. Автоматизация CI/CD и интеграция DevSecOps: Конвейеры переходят к принципу «everything as code»: декларативные CI/CD-процессы (через YAML) с обязательными проверками безопасности (статический анализ, сканирование зависимостей и контейнеров).
  2. Массовое внедрение GitOps: Управление развертываниями через Git обеспечивает прозрачность изменений, автоматизацию откатов и обратимость конфигураций. Популярные инструменты (Argo CD, FluxCD) демонстрируют устойчивое развитие.
  3. Эволюция Infrastructure as Code (IaC): Декларативное управление инфраструктурой остаётся ключевым. Изменение лицензии Terraform спровоцировало появление альтернатив (например, OpenTofu) и развитие инструментов на базе Pulumi, AWS CDK, Bicep, а также экспериментальных подходов (Winglang, Cue, Dhall).
  4. Развитие наблюдаемости и мониторинга (Observability): Расширяются традиционные столпы (метрики, логи, трассировки) с добавлением непрерывного профилирования (Parca, Grafana Phlare) и использования eBPF для глубокого анализа. OpenTelemetry становится единым стандартом для сбора телеметрии.
  5. Повышение отказоустойчивости и устойчивости к сбоям: Архитектурные подходы (multi-AZ, active-active/passive, паттерны Circuit Breaker и Bulkhead) и интеграция Chaos Engineering (LitmusChaos, Chaos Mesh) позволяют системам предсказывать сбои и быстро восстанавливаться.
  6. Формализация аварийного восстановления (DR):Внедрение формальных DR-планов с регулярными тестами, резервным копированием (Velero, Percona XtraBackup) и multi-region/multi-cloud стратегиями для минимизации простоя.
  7. Появление платформенной инженерии и улучшение Developer Experience (DevX): Создаются внутренние платформы, предоставляющие разработчикам самообслуживаемую инфраструктуру и «golden paths» для ускорения разработки. Формируются специализированные команды, отвечающие за платформенные решения.
  8. Применение SRE-подходов: Внедрение SRE-практик (SLO/SLI, error budgets, автоматизация устранения инцидентов) происходит как в крупных, так и в малых организациях. Отделение продуктовых и платформенных SRE улучшает процессы.
  9. Развитие облачных и мультиоблачных стратегий: Гиперскейлеры расширяют набор managed-сервисов, организации активно внедряют multi-cloud и гибридные стратегии для повышения отказоустойчивости и контроля затрат.
  10. Новые направления: генеративный AI, автономные системы и WebAssembly: • Генеративный AI – помощь в анализе логов, создании инфраструктурного кода и оптимизации процессов. • Автономные системы – разработка самовосстанавливающихся инфраструктур с автоскейлингом и автоматической диагностикой. • WebAssembly (WASM) – исследуется как легковесная альтернатива контейнерам, особенно для edge-вычислений.

Пока не очень понятно куда все идет дальше, кроме подчищения legacy. Из больших задач пока видится:

  • упрощение конфигурации
  • гетерогенные решения, включая bare-metal (при отсутствии Terraform для него)
  • увеличение capacity команд благодаря использованию LLM (непонятно как)