WAF++ WAF++
Back to WAF++ Homepage

Agent Safety

Agenten müssen:

  • In einem Sandbox-Umfeld laufen

  • Guardrails haben (Altersbeschränkungen, Inhalt)

  • Fail-Safe-Mechanismen haben

Guardrails

  • Content filters

  • Action boundaries

  • Human-in-the-Loop für sensible Entscheidungen

Alignment

Agenten-Verhalten muss mit Organisationswerten ausgerichtet sein.