| korchasa@*ops

---

title:

date: 2025-04-06

tags: [#devops, #infrastructure, #platform-engineering, #sre ]

draft: false

---

Събрах 16 доклада за развитието на инфраструктурата в един. В по-голямата си част всичко е познато, макар да има и някои нови имена. Радва ме, че все още не пропускам съществено пазара. Същия DevX го правехме в различни компании още преди 9–10 години под лозунга „ако искаш да внедриш процес, направи този процес прост“, а платформени екипи и EaC — през 2020.

TL;DR

Автоматизация на CI/CD и интеграция на DevSecOps: Конвейерите преминават към принципа „everything as code“: декларативни CI/CD процеси (чрез YAML) със задължителни проверки за сигурност (статичен анализ, сканиране на зависимости и контейнери).
Масово внедряване на GitOps: Управлението на разгръщанията чрез Git осигурява прозрачност на промените, автоматизирани връщания и обратимост на конфигурациите. Популярните инструменти (Argo CD, FluxCD) показват устойчиво развитие.
Еволюция на Infrastructure as Code (IaC): Декларативното управление на инфраструктурата остава ключово. Промяната на лиценза на Terraform предизвика появата на алтернативи (например OpenTofu) и развитие на инструменти на база Pulumi, AWS CDK, Bicep, както и експериментални подходи (Winglang, Cue, Dhall).
Развитие на наблюдаемостта и мониторинга (Observability): Разширяват се традиционните стълбове (метрики, логове, трасировки) с добавяне на непрекъснато профилиране (Parca, Grafana Phlare) и използване на eBPF за дълбок анализ. OpenTelemetry става единен стандарт за събиране на телеметрия.
Повишаване на устойчивостта и отказоустойчивостта: Архитектурните подходи (multi-AZ, active-active/passive, патърни Circuit Breaker и Bulkhead) и интеграцията на Chaos Engineering (LitmusChaos, Chaos Mesh) позволяват на системите да предвиждат сривове и бързо да се възстановяват.
Формализация на аварийното възстановяване (DR): Въвеждане на формални DR планове с регулярни тестове, резервни копия (Velero, Percona XtraBackup) и multi-region/multi-cloud стратегии за минимизиране на престоя.
Поява на платформено инженерство и подобряване на Developer Experience (DevX): Създават се вътрешни платформи, които предоставят на разработчиците self-service инфраструктура и „golden paths“ за ускоряване на разработката. Формират се специализирани екипи, отговорни за платформените решения.
Прилагане на SRE подходи: Внедряването на SRE практики (SLO/SLI, error budgets, автоматизация на отстраняването на инциденти) се случва както в големи, така и в малки организации. Разделянето на продуктови и платформени SRE подобрява процесите.
Развитие на облачни и мултиоблачни стратегии: Хиперскейлърите разширяват набора от managed услуги, организациите активно внедряват multi-cloud и хибридни стратегии за по-добра устойчивост и контрол на разходите.
Нови направления: генеративен AI, автономни системи и WebAssembly: • Генеративен AI – помощ при анализ на логове, създаване на инфраструктурен код и оптимизация на процесите. • Автономни системи – разработка на самовъзстановяваща се инфраструктура с автоскейлинг и автоматична диагностика. • WebAssembly (WASM) – изследва се като лека алтернатива на контейнерите, особено за edge изчисления.

Засега не е много ясно накъде вървят нещата, освен почистването на legacy. От големите задачи засега се виждат:

опростяване на конфигурацията
хетерогенни решения, включително bare-metal (при липса на Terraform за него)
увеличаване на капацитета на екипите чрез използване на LLM (неясно как)