Zum Inhalt springen bmline
Labs
Mar 30, 2026
Der Harness-Prozess: Warum 2026 das Jahr der kontrollierten KI-Autonomie ist

Der Harness-Prozess: Warum 2026 das Jahr der kontrollierten KI-Autonomie ist

Was ein Agentic Harness ist, wie er funktioniert, und warum er der entscheidende Unterschied zwischen einem Spielzeug und einem echten KI-Entwicklungspartner ist.

Bernd D.H. Martin

Noch vor zwei Jahren war "KI im Entwicklungsprozess" gleichbedeutend mit Autocomplete. GitHub Copilot vervollständigte Zeilen, ChatGPT lieferte Code-Snippets zum Kopieren. Der Entwickler war immer noch der Treiber – die KI ein besseres Nachschlagewerk.

2026 hat sich das fundamental verschoben. Nicht weil die Modelle klüger wurden – das sind sie, aber das allein erklärt den Sprung nicht. Der eigentliche Gamechanger ist der Harness-Prozess.

Was ist ein Harness?

Ein Harness ist der Rahmen, der einen KI-Agenten kontrolliert autonom arbeiten lässt. Er definiert:

  • Was der Agent darf – Welche Tools, Dateien, Befehle sind erlaubt?
  • Was der Agent wissen muss – Projektkontext, Konventionen, Ziele
  • Wann der Agent pausiert – Wo braucht es menschliche Freigabe?
  • Wie der Agent reagiert – Hooks die vor/nach Aktionen ausgeführt werden

Bei Claude Code ist der Harness konkret: CLAUDE.md liefert den Kontext, Permission-Settings steuern den Zugriff, Hooks greifen in den Tool-Lifecycle ein, und der Agent entscheidet eigenständig welche Tools er in welcher Reihenfolge einsetzt.

Das Prinzip: Autonomie mit Leitplanken

Der entscheidende Unterschied zu früheren Ansätzen ist das Verhältnis von Autonomie und Kontrolle.

Früher gab es zwei Extreme:

  1. Vollständige Kontrolle – Jeder Schritt manuell, KI nur als Vorschlag. Langsam, kein echter Mehrwert gegenüber Autocomplete.
  2. Vollständige Autonomie – Agent macht alles selbst, Mensch schaut zu. Klingt verlockend, scheitert in der Praxis an falschen Annahmen, falschem Kontext, falschem Scope.

Der Harness-Ansatz löst dieses Dilemma. Er schafft einen kontrollierten Autonomie-Korridor: Der Agent arbeitet selbstständig innerhalb klar definierter Grenzen, eskaliert bei Unklarheiten, und gibt Kontrolle ab wo es kritisch wird – z.B. vor destruktiven Operationen, vor Git-Pushes, vor Produktions-Deployments.

Mensch definiert Ziel
       ↓
Harness stellt Kontext + Regeln bereit
       ↓
Agent plant und führt aus (autonom)
       ↓
Hooks / Permissions greifen bei kritischen Aktionen
       ↓
Mensch reviewed Ergebnis, nicht jeden Schritt

Warum gerade 2026?

Drei Entwicklungen kommen jetzt zusammen:

1. Modelle die wirklich lesen können

Aktuelle Modelle verstehen Kontext auf einer Ebene, die vor zwei Jahren undenkbar war. Eine CLAUDE.md mit 200 Zeilen Projektbeschreibung wird tatsächlich berücksichtigt – nicht nur oberflächlich erwähnt. Das macht Harness-Konfigurationen erst wirksam.

2. Tool-Use ist erwachsen geworden

File-Reads, Shell-Execution, Git-Operationen, API-Calls – all das läuft heute zuverlässig in einer Agenten-Schleife. Frühere Tool-Use-Implementierungen hatten zu viele Fehler und Halluzinationen um produktiv zu sein. Die aktuelle Generation ist stabil genug für echten Einsatz.

3. Der Kontext-Window-Sprung

Mit hunderten von Tausend Tokens Kontext kann ein Agent heute eine gesamte Codebase überblicken, mehrere Dateien gleichzeitig im Kopf behalten und konsistente Entscheidungen über einen langen Task-Horizont treffen. Das war 2023/2024 mit 8k–32k Tokens schlicht nicht möglich.

Harness in der Praxis: Claude Code

Hier ein konkretes Beispiel wie der Harness bei meinem Setup aussieht:

CLAUDE.md definiert:

  • Stack (Nuxt 4, Nuxt UI, TailwindCSS 4)
  • Konventionen (pnpm, kein npm/yarn)
  • Architektur-Entscheidungen die nicht hinterfragt werden sollen
  • Wo Vorsicht geboten ist (z.B. Content-Schema nicht ohne Absprache ändern)

Permission-Settings steuern:

  • Automatisch erlaubt: Dateien lesen, schreiben, Tests laufen lassen
  • Nachfragen erforderlich: Git-Commits, Pakete installieren, Dateien löschen
  • Immer blockiert: Force-Push, destructive DB-Operationen

Hooks ermöglichen:

  • Pre-Tool: Linting-Check bevor Code committed wird
  • Post-Tool: Automatisches Log von KI-Änderungen für Review

Das Ergebnis: Ich gebe einen Task vor, der Agent arbeitet ihn durch – typischerweise 10–30 Einzelschritte – und ich review das Ergebnis. Ich folge nicht mehr jedem Schritt, sondern setze Leitplanken.

Was sich für Entwickler ändert

Der Harness-Prozess verschiebt die Kernkompetenz eines Entwicklers:

Früher wertvoll:

  • Schnell tippen
  • Syntax auswendig kennen
  • Boilerplate im Schlaf schreiben

Heute wertvoll:

  • Aufgaben präzise formulieren (Prompt Engineering als Handwerk)
  • Harness richtig konfigurieren (Kontext, Grenzen, Hooks)
  • Ergebnisse kritisch bewerten statt jeden Schritt zu überwachen
  • Systemdenken: Welche Teile delegiere ich, welche behalte ich?

Das ist keine Bedrohung für Entwickler – es ist eine Aufwertung. Wer den Harness-Prozess beherrscht, multipliziert seine eigene Leistungsfähigkeit. Wer ihn ignoriert, arbeitet weiterhin mit einem teuren Autocomplete.

Fazit

Der Harness-Prozess ist das Missing Link zwischen "KI als Spielzeug" und "KI als echter Produktivitätshebel". Er macht Autonomie handhabbar, weil er Grenzen definiert bevor der Agent losläuft – nicht nachdem er etwas kaputt gemacht hat.

2026 ist das Jahr, in dem dieser Ansatz in der Breite ankommt. Nicht weil es eine neue Technologie ist, sondern weil die drei nötigen Voraussetzungen – starke Modelle, stabile Tool-Use, großes Kontextfenster – jetzt gleichzeitig erfüllt sind.

Wer heute lernt, Agenten richtig einzuspannen, hat einen Vorsprung der sich in den nächsten Jahren deutlich auszahlen wird.