Operator Governance

Scope, Eskalationskette, Emergency Freeze und Gate Override — das vollständige HITL-Operator-Governance-Modell.

1. HITL Operator — Rolle und Zweck1. HITL Operator — Role and Purpose

Der HITL Operator (Human-in-the-Loop Operator) ist die Brücke zwischen automatisierten Prozessen und menschlicher Aufsicht. Er interveniert dort, wo Gating, Sicherheitskontrollen oder Eskalation ein menschliches Urteil erfordern.

Kein Allzweck-Admin Scope-gebunden (Schichten) Fail-Closed Default TX-Pflicht bei allen Aktionen

KernprinzipCore Principle

Der Operator interveniert — er hat keinen privilegierten Dauerzugriff. Jede Operator-Aktion muss als Transaction geloggt werden. Der Operator ist ein Actor, der innerhalb des normalen Governance-Rahmens agiert.

Der aktuell betreibende Tenant wird zudem maschinenlesbar im Space gehalten. Manual-Header und andere Operator-Kontextanzeigen lesen diesen Zustand ueber specs/root/SPACE-OPERATOR-CONFIG.yaml und den daraus synchronisierten public/data/workspace-state.js.

2. Scope-Schichten (P-OPS-001)2. Scope Layers (P-OPS-001)

Der Operator agiert in drei distinkten Scope-Zonen:

ZoneSchichtenLayersBedeutungMeaning
PRIMARY
(volle Operator-Kontrolle)
guardrails, runtime, operations, transaction, integration Operator kann Gates setzen, Prozesse anhalten, Entscheidungen treffen. Direkte Intervention erlaubt.
READ-ONLY
(nur beobachten)
architecture, projection, learning, publishing, migration Operator kann lesen und eskalieren, aber nicht direkt eingreifen. Änderungen erfordern Spec-Prozess.
UPSTREAM SPEC ONLY
(kein direkter Zugriff)
Alles außerhalb der obigen Kategorien Operator hat keinen Operator-Zugriff. Änderungen nur über formellen Spec-Prozess mit vollständig definierten Artefakten.

Wird eine Operator-Aktion außerhalb von PRIMARY ausgeführt, ohne Eskalation → Violation (P-OPS-001).

3. Eskalationskette (P-OPS-002)3. Escalation Chain (P-OPS-002)

Drei Eskalationsstufen, streng geordnet. Überspringen = Violation:

LEVEL 1
Responsible Owner
Auslöser

Gate blockiert. Automatisierter Prozess kann nicht fortschreiten ohne menschliche Freigabe.

Deadline & Pflicht

Gleicher Werktag. Responsible Owner antwortet mit Gate-Entscheidung oder eskaliert selbst zu L2.

LEVEL 2
Space Lead
Auslöser

Responsible Owner nicht erreichbar ODER Owner konnte nicht entscheiden (z.B. Interessenskonflikt).

Deadline & Pflicht

Ende nächsten Werktags. Eskalation muss als Escalation-TX geloggt werden (Actor ID + Timestamp + Grund).

LEVEL 3
Emergency Freeze
Auslöser

Space Lead nicht erreichbar ODER unmittelbares Sicherheitsrisiko (keine Zeit für L1/L2).

Aktion

Alle Automatisierungen sofort einfrieren. Kein LLM-Aufruf erforderlich. Jeder aktive HITL Operator kann dies einleiten.

Eskalations-TX FormatEscalation TX Format

escalation_tx:
  actor_id: <operator_id>
  timestamp: <ISO-8601>
  from_level: 1
  to_level: 2
  reason: "Owner unreachable after 4h business hours"
  gate_ref: <gate_id>
  prior_actions: [<action_tx_id_1>, ...]

4. Emergency Freeze (P-OPS-003)4. Emergency Freeze (P-OPS-003)

⚠ Emergency Freeze — sofortige Vollbremsung

  • Wird von jedem aktiven HITL Operator ausgelöst (kein LLM-Aufruf nötig)
  • Hält alle Automatisierungen des Scope sofort an
  • Gilt bis zur expliziten Aufhebung durch: human_owner ODER space_lead
  • Keine Self-Service-Aufhebung — Operator der eingefroren hat, kann nicht selbst aufheben

Pflichtfelder für Freeze-TXRequired Fields for Freeze TX

FeldFieldTypTypeBeschreibungDescription
actor_idstringID des auslösenden HITL Operators
timestampISO-8601Zeitpunkt des Freeze-Auslösens
scopelistBetroffene Schichten / Prozesse
reasonstringKlarer, verifizierbarer Grund. Kein Freitext ohne Ursache.
escalation_traillistVorherige Eskalations-TXs (falls vorhanden)
lift_authorityenumNur: human_owner | space_lead

Lift-ProzedurLift Procedure

  1. Lift-Autorität (Owner oder Space Lead) loggt Lift-TX mit eigenem Actor ID + Review-Zusammenfassung
  2. Freeze-Grund wurde adressiert (oder als False-Positive klassifiziert)
  3. Betroffene Automatisierungen werden explizit neu gestartet (kein Auto-Resume)
  4. Follow-up Review-Meeting within 2 Werktage

5. Gate Override (P-OPS-004)5. Gate Override (P-OPS-004)

In extremen Ausnahmesituationen kann ein HITL Operator ein Review Gate manuell übersteuern. Dies ist das letzte Mittel — nicht ein normales Verfahren.

Bedingungen: alle 3 müssen erfüllt sein

  • Automatisierter Gate-Check ist fehlgeschlagen im No-AI-Mode (nicht wegen inhaltlicher Ablehnung)
  • Vollständige Eskalationskette wurde ausgeschöpft (L1 → L2 dokumentiert)
  • Aktion ist zeitkritisch und Verzögerung verursacht messbar größeren Schaden

VERBOTEN bei Gate OverrideFORBIDDEN during Gate Override

Stilles Override (kein TX) Derselbe Actor der den Gate getriggert hat Override ohne Review-Commitment Override ohne dokumentierte Eskalation

Override-TX-PflichtfelderOverride TX Required Fields

gate_override_tx:
  actor_id: <operator_id>          # NICHT der Gate-Auslöser
  timestamp: <ISO-8601>
  gate_ref: <gate_id>              # Welcher Gate übersteuert wird
  override_reason: "..."            # Präzise Begründung
  escalation_evidence:
    - <l1_tx_id>
    - <l2_tx_id>
  time_criticality_evidence: "..."  # Messbarer Schaden durch Verzögerung
  follow_up_review_committed_by: <ISO-date>
  review_assignee: <actor_id>

Nachverfolgungs-PflichtMandatory Follow-up

Jedes Override erfordert ein formelles Review-Meeting innerhalb von 5 Werktagen. Ergebnisse werden als Governance-Lektionen in die Spec rückgespielt. Drei Override-Incidents ohne Spec-Update = Eskalation zu Space Lead automatisch.

6. No-AI-Vollständigkeit (P-OPS-005)6. No-AI Completeness (P-OPS-005)

Alle Operator-Governance-Prozesse sind so gestaltet, dass ein erfahrener Operator ohne LLM-Unterstützung alle kritischen Entscheidungen ausführen kann.

ProzessProcessLLM-optional?Human-only Fallback
Gate-EntscheidungJaOperator liest Review-Artefakt direkt, entscheidet auf Basis von Checklist
Emergency FreezeJaOperator führt Freeze-TX manuell aus (Vorlage in HITL Manual)
Eskalation L1→L2JaOperator loggt Escalation-TX manuell
Gate OverrideJaOverride-TX manuell, Review-Commitment schriftlich
Lift Emergency FreezeJaLift-TX manuell, kein automatischer Prozess
P-OPS-001 P-OPS-002 P-OPS-003 P-OPS-004 P-OPS-005