Best Practices: Reliability

Die Reliability Best Practices vertiefen die technische Umsetzung der 10 WAF-REL Controls. Jede Best Practice enthält Kontext, Zielbild, konkrete Terraform-Beispiele, typische Fehlmuster und Metriken.

Übersicht

Best Practice	Thema	Zugehörige Controls
SLO & SLA Definition	SLOs definieren, messen und mit Error Budgets verbinden	WAF-REL-010, WAF-REL-100
Health Checks & Probes	Readiness, Liveness und Startup Probes konfigurieren	WAF-REL-020
Multi-AZ & High Availability	HA-Architektur mit Multi-AZ Compute, DB und LB	WAF-REL-030
Backup & Recovery	Backup-Strategie, Restore-Tests und DR-Verfahren	WAF-REL-040, WAF-REL-070
Circuit Breaker & Timeouts	Resilience Patterns: CB, Timeouts, Retry, Bulkhead	WAF-REL-050, WAF-REL-080
Incident Response	IR-Plan, Runbooks, On-Call und Post-Mortems	WAF-REL-060
Chaos Engineering	Strukturierte Fault-Injection und GameDay-Durchführung	WAF-REL-090

Best Practice

Thema

Zugehörige Controls

SLO & SLA Definition

SLOs definieren, messen und mit Error Budgets verbinden

WAF-REL-010, WAF-REL-100

Health Checks & Probes

Readiness, Liveness und Startup Probes konfigurieren

WAF-REL-020

Multi-AZ & High Availability

HA-Architektur mit Multi-AZ Compute, DB und LB

WAF-REL-030