Поєднав 16 репортів з розвитку інфраструктури в один. Переважно все знайоме, хоча є й кілька нових імен. Тішить, що все ще можу не сильно промахуватися повз ринок. Той самий DevX ми робили в різних компаніях ще 9–10 років тому під лозунгом «якщо хочеш впровадити процес — роби цей процес простим», а платформні команди та EaC — у 2020.

TL;DR

  1. Автоматизація CI/CD та інтеграція DevSecOps: Конвеєри переходять до принципу «everything as code»: декларативні CI/CD-процеси (через YAML) з обов’язковими перевірками безпеки (статичний аналіз, сканування залежностей і контейнерів).
  2. Масове впровадження GitOps: Керування розгортаннями через Git забезпечує прозорість змін, автоматизацію відкатів і зворотність конфігурацій. Популярні інструменти (Argo CD, FluxCD) демонструють стабільний розвиток.
  3. Еволюція Infrastructure as Code (IaC): Декларативне керування інфраструктурою залишається ключовим. Зміна ліцензії Terraform спричинила появу альтернатив (наприклад, OpenTofu) і розвиток інструментів на базі Pulumi, AWS CDK, Bicep, а також експериментальних підходів (Winglang, Cue, Dhall).
  4. Розвиток спостережуваності та моніторингу (Observability): Розширюються традиційні стовпи (метрики, логи, трасування) з додаванням безперервного профілювання (Parca, Grafana Phlare) та використання eBPF для глибокого аналізу. OpenTelemetry стає єдиним стандартом збору телеметрії.
  5. Підвищення відмовостійкості та стійкості до збоїв: Архітектурні підходи (multi-AZ, active-active/passive, патерни Circuit Breaker і Bulkhead) та інтеграція Chaos Engineering (LitmusChaos, Chaos Mesh) дозволяють системам передбачати збої та швидко відновлюватися.
  6. Формалізація аварійного відновлення (DR): Впровадження формальних DR-планів із регулярними тестами, резервним копіюванням (Velero, Percona XtraBackup) і multi-region/multi-cloud стратегіями для мінімізації простою.
  7. Поява платформної інженерії та покращення Developer Experience (DevX): Створюються внутрішні платформи, що надають розробникам самообслуговувану інфраструктуру та «golden paths» для прискорення розробки. Формуються спеціалізовані команди, відповідальні за платформні рішення.
  8. Застосування SRE-підходів: Впровадження SRE-практик (SLO/SLI, error budgets, автоматизація усунення інцидентів) відбувається як у великих, так і в малих організаціях. Відокремлення продуктових і платформних SRE покращує процеси.
  9. Розвиток хмарних і мультихмарних стратегій: Гіперскейлери розширюють набір managed-сервісів, організації активно впроваджують multi-cloud і гібридні стратегії для підвищення відмовостійкості та контролю витрат.
  10. Нові напрями: генеративний AI, автономні системи та WebAssembly: • Генеративний AI – допомога в аналізі логів, створенні інфраструктурного коду та оптимізації процесів. • Автономні системи – розробка самовідновлюваної інфраструктури з автоскейлінгом і автоматичною діагностикою. • WebAssembly (WASM) – досліджується як легковагова альтернатива контейнерам, особливо для edge-обчислень.

Поки не дуже зрозуміло, куди все йде далі, окрім підчищення legacy. З великих задач поки видно:

  • спрощення конфігурації
  • гетерогенні рішення, включно з bare-metal (за відсутності Terraform для нього)
  • збільшення capacity команд завдяки використанню LLM (незрозуміло як)