WAF++

Back to WAF++ Homepage

Agent Safety

Agenten müssen:

In einem Sandbox-Umfeld laufen
Guardrails haben (Altersbeschränkungen, Inhalt)
Fail-Safe-Mechanismen haben

Guardrails

Content filters
Action boundaries
Human-in-the-Loop für sensible Entscheidungen

Alignment

Agenten-Verhalten muss mit Organisationswerten ausgerichtet sein.