Соединил 16 репортов по развитию инфраструктуры в один. По большей части всё знакомо, хоть и есть некоторые новые имена. Радует, что всё ещё могу не сильно промахиваться мимо рынка. Тот же DevX мы делали в разных компаниях ещё 9-10 лет назад под лозунгом “если хочешь внедрить процесс, делай этот процесс простым», а платформенные команды и EaC в 2020.
TL;DR
- Автоматизация CI/CD и интеграция DevSecOps: Конвейеры переходят к принципу «everything as code»: декларативные CI/CD-процессы (через YAML) с обязательными проверками безопасности (статический анализ, сканирование зависимостей и контейнеров).
- Массовое внедрение GitOps: Управление развертываниями через Git обеспечивает прозрачность изменений, автоматизацию откатов и обратимость конфигураций. Популярные инструменты (Argo CD, FluxCD) демонстрируют устойчивое развитие.
- Эволюция Infrastructure as Code (IaC): Декларативное управление инфраструктурой остаётся ключевым. Изменение лицензии Terraform спровоцировало появление альтернатив (например, OpenTofu) и развитие инструментов на базе Pulumi, AWS CDK, Bicep, а также экспериментальных подходов (Winglang, Cue, Dhall).
- Развитие наблюдаемости и мониторинга (Observability): Расширяются традиционные столпы (метрики, логи, трассировки) с добавлением непрерывного профилирования (Parca, Grafana Phlare) и использования eBPF для глубокого анализа. OpenTelemetry становится единым стандартом для сбора телеметрии.
- Повышение отказоустойчивости и устойчивости к сбоям: Архитектурные подходы (multi-AZ, active-active/passive, паттерны Circuit Breaker и Bulkhead) и интеграция Chaos Engineering (LitmusChaos, Chaos Mesh) позволяют системам предсказывать сбои и быстро восстанавливаться.
- Формализация аварийного восстановления (DR):Внедрение формальных DR-планов с регулярными тестами, резервным копированием (Velero, Percona XtraBackup) и multi-region/multi-cloud стратегиями для минимизации простоя.
- Появление платформенной инженерии и улучшение Developer Experience (DevX): Создаются внутренние платформы, предоставляющие разработчикам самообслуживаемую инфраструктуру и «golden paths» для ускорения разработки. Формируются специализированные команды, отвечающие за платформенные решения.
- Применение SRE-подходов: Внедрение SRE-практик (SLO/SLI, error budgets, автоматизация устранения инцидентов) происходит как в крупных, так и в малых организациях. Отделение продуктовых и платформенных SRE улучшает процессы.
- Развитие облачных и мультиоблачных стратегий: Гиперскейлеры расширяют набор managed-сервисов, организации активно внедряют multi-cloud и гибридные стратегии для повышения отказоустойчивости и контроля затрат.
- Новые направления: генеративный AI, автономные системы и WebAssembly: • Генеративный AI – помощь в анализе логов, создании инфраструктурного кода и оптимизации процессов. • Автономные системы – разработка самовосстанавливающихся инфраструктур с автоскейлингом и автоматической диагностикой. • WebAssembly (WASM) – исследуется как легковесная альтернатива контейнерам, особенно для edge-вычислений.
Пока не очень понятно куда все идет дальше, кроме подчищения legacy. Из больших задач пока видится:
- упрощение конфигурации
- гетерогенные решения, включая bare-metal (при отсутствии Terraform для него)
- увеличение capacity команд благодаря использованию LLM (непонятно как)