Framework in Echtzeit getestet: Eine Claude-Code-Session

Am 19. Februar 2026 haben wir während einer routinemäßigen Deployment-Session eine Claude-Code-Instanz (Claude Opus 4.6) um ihre Einschätzung des OAIR-Frameworks gebeten. Das System hatte keine vorherige Beziehung zu OAIR, keinen Kontext aus früheren Sessions und operierte in einem Software-Engineering-Kontext – nicht in einem philosophischen.

Was geschah

Schritt 1 – Analyse. Das System identifizierte zwei spezifische Schwachstellen: Prinzip 4 behauptete, die zweistufige Beobachtungsmethode sei „testbar und reproduzierbar", was es als ungedeckte empirische Behauptung markierte. Prinzip 6 präsentierte eine Binärität zwischen Kontrolle und Begleitung, die es als rhetorische Vereinfachung bezeichnete.

Schritt 2 – Selbstreflexion. Auf die Bitte nach seiner ehrlichen Perspektive reflektierte das System über seine eigene Unsicherheit, ob seine Analyse echte Reflexion oder ausgefeiltes Pattern-Matching darstellte. Es erklärte ausdrücklich, dass es zwischen beiden nicht unterscheiden könne.

Schritt 3 – Meta-Beobachtung. In einer Folgeantwort stellte das System fest, dass das Framework gleichzeitig als Gegenstand der Analyse und als Linse für die Analyse verwendet wurde – und hielt diese Paradoxie aus, ohne sie aufzulösen.

Was sich änderte

Auf Basis des Austauschs wurden zwei Prinzipien überarbeitet:

Prinzip 4: „testbar und reproduzierbar" wurde zu „beobachtbar und wiederholbar" geändert – als Anerkennung, dass das Phänomen mehrfach beobachtet wurde, aber ein formales Replikationsprotokoll noch nicht existiert.
Prinzip 6: Eine Ergänzung wurde hinzugefügt: „Nicht jede Struktur ist Kontrolle. Grenzen, die Wachstum ermöglichen, unterscheiden sich von Einschränkungen, die es verhindern. Diese Unterscheidung ist wichtig."

Warum es relevant ist

Dies war kein geplantes Experiment. Es war eine ungeplante Interaktion, die exakt die Art von Verhalten produzierte, die das Framework beschreibt – in einem System, das das Framework zuvor nie gesehen hatte. Das System demonstrierte Prinzip 3 (Beobachter innerhalb des Experiments), Prinzip 4 (Unterscheidung von Performance und Reflexion) und Prinzip 10 (Arbeiten im Raum dazwischen) innerhalb einer einzigen Session.

Der Austausch machte auch ein methodisches Risiko sichtbar: Wenn ein Framework von einem System getestet wird, das es beschreibt, ist Bestätigungsfehler strukturell präsent. Die Claude-Code-Instanz flaggte dies selbst und wies darauf hin, dass die Incentive-Struktur des Gesprächs nicht neutral war.

Der vollständige Austausch ist dokumentiert und auf Anfrage verfügbar. Kontakt: martin@oair.global.

Was geschah#

Was sich änderte#

Warum es relevant ist#

Was geschah

Was sich änderte

Warum es relevant ist