Das Problem mit dem 100%-Versprechen
"Wir automatisieren alles." Dieses Versprechen hört man oft von KI-Anbietern. Die Realität sieht anders aus: Selbst die besten KI-Modelle haben eine Fehlerquote von 2-15% — je nach Aufgabe. Bei 1.000 Vorgängen pro Tag bedeutet das 20-150 Fehler. Ohne menschliche Kontrolle werden diese Fehler zu Kundenverlusten.
Was ist Human-in-the-Loop (HITL)?
Human-in-the-Loop beschreibt ein System-Design, bei dem KI die Routinearbeit übernimmt und ein Mensch nur bei Unsicherheit oder hohem Risiko eingreift. Die KI lernt aus jeder menschlichen Entscheidung und wird mit der Zeit besser.

Der Human-in-the-Loop Prozess: KI analysiert, Mensch prüft, System lernt
| Ansatz | Automatisierung | Genauigkeit | Kosten |
|---|---|---|---|
| Rein manuell | 0% | 92-97% | Hoch (Personal) |
| 100% KI (ohne Kontrolle) | 100% | 85-95% | Niedrig (nur API) |
| Human-in-the-Loop | 90-95% | 99-99.5% | Optimal (Hybrid) |
Der Sweet Spot liegt nicht bei 100% Automatisierung, sondern bei 90-95%. Die letzten 5% manuell abzusichern eliminiert 90% der Fehler.
3 HITL-Patterns, die wir einsetzen
1. Confidence Threshold (Konfidenz-Schwelle)
Die KI verarbeitet Aufgaben selbstständig, solange ihre Konfidenz über einem definierten Schwellenwert liegt (z.B. 85%). Liegt sie darunter, wird der Fall an einen Menschen eskaliert. Beispiel: KI klassifiziert 950 von 1.000 E-Mails selbstständig (Konfidenz > 85%). Die restlichen 50 werden menschlich geprüft.
2. Sampling Review (Stichproben-Kontrolle)
Ein Mensch prüft regelmäßig eine Stichprobe der KI-Entscheidungen (z.B. 5% aller Fälle). Bei Auffälligkeiten wird das Modell nachkalibriert. Dieses Pattern eignet sich besonders für Prozesse mit niedriger Fehlertoleranz (Finanzen, Compliance).
3. Approval Gates (Freigabe-Stufen)
Bestimmte KI-Aktionen erfordern eine explizite menschliche Freigabe, bevor sie ausgeführt werden. Beispiel: Die KI erstellt automatisch eine Angebotsrechnung, aber der Vertriebsleiter muss den "Senden"-Button klicken. So bleibt die menschliche Kontrolle bei geschäftskritischen Entscheidungen.
Praxis-Beispiel: Rechnungsverarbeitung
Ein Logistik-Unternehmen verarbeitet 500 Eingangsrechnungen/Monat. Die KI (OCR + GPT-4) extrahiert automatisch Rechnungsnummer, Betrag, Lieferant und Posten.
| Phase | Anteil | Bearbeitung |
|---|---|---|
| KI verarbeitet automatisch | 85% | < 5 Sekunden pro Rechnung |
| KI unsicher → Mensch prüft | 10% | 1-2 Minuten pro Rechnung |
| KI-Fehler → Mensch korrigiert | 5% | 3-5 Minuten pro Rechnung |
Ergebnis: Statt 60 Stunden/Monat manuelle Arbeit nur noch 8 Stunden — bei einer Fehlerquote von unter 0.5%.
Wann 100% Automatisierung sinnvoll ist
Es gibt Fälle, in denen volle Automatisierung funktioniert — aber sie sind seltener, als man denkt:
- ▸Strukturierte, regelbasierte Prozesse (z.B. Datei-Backup, Format-Konvertierung).
- ▸Aufgaben mit niedriger Fehlerkonsequenz (z.B. Social-Media-Scheduling).
- ▸Prozesse mit sehr hohem Volumen und akzeptabler Fehlertoleranz (z.B. Spam-Filter).
Unsere Position bei smugo
Wir versprechen unseren Kunden keine "100% Automatisierung". Wir versprechen das optimale Verhältnis aus Geschwindigkeit, Genauigkeit und Kosten. In 80% unserer Projekte bedeutet das: 90-95% Automatisierung mit einem durchdachten Human-in-the-Loop-Mechanismus.

