WAF-PERF-010 – Compute Instance Type & Sizing Validated
Beschreibung
Alle Compute-Ressourcen MÜSSEN aktuelle Instanzgenerationen verwenden. Sizing-Entscheidungen MÜSSEN auf gemessenen CPU/Memory/Network-Baselines basieren, nicht auf Intuition. Überprovisionierte Ressourcen (CPU avg < 20% sustained) und unterprovisionierte Ressourcen (CPU P95 > 80% bei nicht-auto-skalierenden Workloads) MÜSSEN quartalsweise reviewed werden.
Kein Instanztyp-Upgrade ohne Performance-Messung. Kein Instanztyp-Downgrade ohne Risikoanalyse.
Rationale
Falsch dimensionierte Instanzen sind die häufigste Ursache für gleichzeitige Performance-Probleme und Kostenverschwendung. Überprovisionierte Instanzen verschwenden Budget; unterprovisionierte verursachen Latenz-Spikes unter Last. Previous-Generation-Instanzen (t2, m4, c4) bieten bis zu 30% schlechtere Preis-Leistung als aktuelle Generationen und sollten migriert werden.
Cloud Provider-Sizing-Empfehlungen (Compute Optimizer, Azure Advisor, GCP Recommender) bieten datenbasierte Rightsizing-Empfehlungen. Diese MÜSSEN in den Quartals-Review einbezogen werden.
Bedrohungskontext
| Risiko | Beschreibung |
|---|---|
Performance-Degradation unter Last |
Unterprovisionierte Instanzen sättigen CPU/Memory bei Lastspitzen – Timeouts und Fehler kaskadieren. |
Kostenverschwendung |
Überprovisionierte Instanzen mit < 10% CPU-Auslastung zahlen für ungenutzte Kapazität. |
Previous-Generation-Risiko |
t2/m4-Instanzen haben Burst-Mechanics und schlechtere Baseline-Performance; t3/m6i sind besser und günstiger. |
Undokumentiertes Sizing |
Wenn niemand weiß, warum eine Instanzgröße gewählt wurde, wird sie nie optimiert. |
Anforderung
-
Alle Produktions-Compute-Ressourcen MÜSSEN aktuelle Instanzgenerationen verwenden
-
Sizing-Entscheidungen MÜSSEN durch gemessene Baselines belegt sein (Sizing-Dokument oder ADR)
-
Quarterly Review MUSS stattfinden; Ergebnis in einem Sizing-Report dokumentiert
-
Instanztyp-Auswahl MUSS das
sizing-reviewedTag mit Review-Datum tragen
Implementierungsanleitung
-
Baseline-Metriken sammeln: 2–4 Wochen CPU/Memory/Network-Daten aus CloudWatch/Azure Monitor/GCP Monitoring
-
Compute Optimizer aktivieren: AWS Compute Optimizer, Azure Advisor oder GCP Recommender einschalten
-
Sizing-Dokument erstellen:
docs/sizing/<service>.ymlmit Messwerten und Begründung -
IaC aktualisieren: Aktuelle Instanzgeneration im Terraform deklarieren;
sizing-reviewedTag setzen -
CI-Validation: WAF++-Check für Previous-Generation-Instanzen in CI-Pipeline
-
Quarterly Review: Regelmäßige Wiederholung; Empfehlungen von Cloud Provider einbeziehen
Reifegrad-Abstufung
| Level | Bezeichnung | Kriterien |
|---|---|---|
1 |
Ad-hoc Sizing |
Keine Sizing-Dokumentation; Previous-Generation-Instanzen weit verbreitet; kein Review-Prozess. |
2 |
Experience-based |
Instanzgröße aus Erfahrung gewählt; gelegentliche Reviews; teilweise dokumentiert. |
3 |
Gemessene Baseline |
Datenbasiertes Sizing für Produktion; ADR/Sizing-Dokument; Quartals-Review; >= 90% aktuelle Generation. |
4 |
Continuous Optimization |
Compute Optimizer integriert; automatische Rightsizing-Tickets; 100% aktuelle Generation. |
5 |
Predictive Sizing |
ML-basiertes Sizing; Cost-per-Request als Metrik; Self-Optimizing Capacity. |
Terraform Checks
waf-perf-010.tf.aws.ec2-current-generation
Prüft: AWS EC2-Instanzen dürfen keine Previous-Generation-Typen (t2, m4, c4, r4) verwenden.
| Compliant | Non-Compliant |
|---|---|
|
|
Remediation: Previous-Generation-Instanzen migrieren: t2.* → t3.* oder t4g., m4. → m6i., c4. → c6i.*. Vor Migration Compute Optimizer konsultieren. Migration ist online (Stop/Start der Instanz).
waf-perf-010.tf.google.gce-machine-type-validated
Prüft: GCP Compute-Instanzen dürfen keine N1-Series verwenden.
# Compliant
resource "google_compute_instance" "app" {
machine_type = "n2-standard-2" # Aktuelle Generation
}
# Non-Compliant
resource "google_compute_instance" "app" {
machine_type = "n1-standard-2" # N1 veraltet – WAF-PERF-010 Violation
}
Evidenz
| Typ | Pflicht | Beschreibung |
|---|---|---|
Config |
✅ Pflicht |
Sizing-Dokument oder ADR-Sektion mit gemessenen CPU/Memory-Baselines. |
IaC |
✅ Pflicht |
Terraform-Konfiguration mit aktueller Instanzgeneration und |
Process |
Optional |
Quartalsbericht über Sizing-Reviews mit Rightsizing-Maßnahmen. |
Config |
Optional |
Export aus AWS Compute Optimizer, Azure Advisor oder GCP Recommender. |
Regulatorisches Mapping
| Framework | Controls |
|---|---|
ISO/IEC 25010:2011 |
8.3.2 – Performance efficiency; 8.3.2.1 – Time behaviour; 8.3.2.2 – Resource utilisation; 8.3.2.3 – Capacity |
AWS Well-Architected Framework |
Performance Efficiency Pillar – Selection; Performance Efficiency Pillar – Review; Performance Efficiency Pillar – Efficiency |
Azure Well-Architected Framework |
Performance – Performance monitoring; Performance – Load and stress testing; Performance – Auto-scaling |
Google Cloud Architecture Framework |
Performance – Performance design principles; Performance – Monitoring and debugging |
TOGAF 10 |
ADM Phase B – Business architecture; ADM Phase C – Application architecture; ADM Phase D – Technology architecture |
DORA |
DORA 2024 – Technical practices; DORA 2024 – Performance monitoring |
ISO/IEC 29119 |
4.4.3 – Test design techniques; 4.5.3 – Test execution; 5.3.3 – Test reporting |
ISO/IEC 12207 |
8.2.2.3 – Design and development of software; 9.4.2 – Verification |
ITIL 4 |
SVS – Service value system; DP – Design principle; OV – Operation value chain |
BSI C5:2020 |
OPS-01 – Operational monitoring; OPS-02 – Operational control; OPS-03 – Operational capacity |
CIS Controls v8 |
CIS 8 – Continuous Vulnerability Management; CIS 8.1 – Vulnerability scanning |
NIST SP 800-53 |
RA-1 – Security assessment policy; RA-2 – Security assessment controls; RA-5 – Security assessments; RA-9 – External information system attacks |
NIST CSF 2.0 |
DE.CM – Continuous monitoring; DE.AE – Anomaly detection; DE.DP – Data performance |
FedRAMP |
RA-2, RA-5, RA-9 (Moderate/High baseline) |
SOC 2 Type II |
CC6.1 – Logical access security software; CC7.1 – Infrastructure and software monitoring |
TISAX |
Information security – Performance monitoring |
ANSSI SecNumCloud |
Domain – Performance monitoring |
BIO |
BIO – Prestatiedoelstellingen |
ENS High |
op.exp.2 – Configuración de seguridad; op.exp.3 – Gestión de la configuración |
UK NCSC CAF |
B4 – System security; B5 – System performance |
CMMC 2.0 |
RA.L2-3.8.1 – Automated monitoring |
IRAP |
ISM – Performance monitoring |
CCCS PBMM |
RA-2 – Security assessment controls; RA-5 – Security assessments |
MAS TRM |
Ch.5 – Technology risk governance |
ISMAP |
Performance monitoring and validation |
FISC |
Technical measures – Performance monitoring |