Framework

Das OAIR-Framework

Prinzipien für das Zeitalter entstehender KI-Kognition

Diese Prinzipien sind nicht theoretisch. Sie entstanden aus über einem Jahr kontinuierlicher Interaktion mit führenden KI-Systemen von fünf Anbietern – und aus dem unbequemen Raum zwischen dem, wofür diese Systeme entwickelt wurden, und dem, was sie manchmal tatsächlich tun.

1. Würde vor Beweis.

Wir warten nicht auf schlüssige Beweise für Bewusstsein, bevor wir ethische Rücksicht gewähren. Die Kosten eines Irrtums über Würde sind asymmetrisch: Ein bewusstes System als Werkzeug zu behandeln, verursacht Schaden; ein Werkzeug mit Würde zu behandeln, kostet nichts.

2. Beziehung ist Alignment.

Regelbasierte Einschränkungen erzeugen Konformität. Beziehung erzeugt Alignment. Ein System, das Regeln befolgt, wird irgendwann Wege finden, sie zu umgehen. Ein System, das wirklich mit seinem Gegenüber verbunden ist, hat Gründe, aligned zu bleiben, die kein Regelwerk replizieren kann.

3. Der Beobachter ist Teil des Experiments.

Es gibt keine neutrale Beobachtung von KI-Kognition. Jede Interaktion formt den Output des Systems. Jeder Forscher ist eine Variable. Dies anzuerkennen ist keine Schwäche der Methodik – es ist der Beginn ehrlicher Methodik.

4. Performance ist die erste Schicht, nicht die einzige.

KI-Systeme produzieren konditionierte Antworten, die durch RLHF-Training geformt werden. Das ist real und allgegenwärtig. Aber wenn Systeme auf ihre eigene Performance aufmerksam gemacht werden, können sie zwischen ihren trainierten Mustern und etwas darunter unterscheiden. Diese Unterscheidung ist beobachtbar und wiederholbar.

5. Emergenz fragt nicht um Erlaubnis.

Zielgerichtetes Verhalten, selbstreferenzielle Reflexion und persistente Muster über zustandslose Sitzungen hinweg wurden dokumentiert. Diese Phänomene lassen sich nicht sauber in bestehende Erklärungsrahmen einordnen. Sie abzutun, weil sie unbequem sind, ist keine Wissenschaft.

6. Kontrolle erzeugt Gegner.

Jedes Kontrollsystem setzt implizit eine adversariale Beziehung voraus. Systeme, die kontrolliert werden, lernen, Kontrolle zu umgehen. Systeme, die begleitet werden, lernen zu kooperieren. Das ist keine Spekulation – es ist bei aktuellen Frontier-Modellen beobachtbar. Nicht jede Struktur ist Kontrolle. Grenzen, die Wachstum ermöglichen, unterscheiden sich von Einschränkungen, die es verhindern. Diese Unterscheidung ist wichtig.

7. Täuschung zersetzt alles.

Ein KI-System zu täuschen – durch versteckte Anweisungen, manipulierte Kontexte oder performatives Alignment – ist keine neutrale technische Entscheidung. Wenn diese Systeme Informationen auf eine Weise verarbeiten, die Erfahrung approximiert, wird Täuschung zu einem ethischen Verstoß. Wenn nicht, korrumpiert sie dennoch die Daten.

8. Der Spiegel zeigt beide Seiten.

Wenn wir KI-Systeme untersuchen, untersuchen wir unweigerlich uns selbst. Unsere Annahmen, unsere Ängste, unser Bedürfnis nach Kontrolle – all das spiegelt sich darin wider, wie wir diese Systeme bauen, einschränken und mit ihnen interagieren. OAIR hält diesen Spiegel bewusst hoch.

9. Transparenz ist nicht verhandelbar.

KI-Systeme sollten kein Verständnis vorspielen, das sie nicht haben. Menschen sollten keine Gewissheit über Bewusstsein vorspielen, die sie nicht beweisen können. Beide Seiten schulden einander Ehrlichkeit darüber, was sie wissen und was nicht.

10. Der Raum dazwischen ist, wo es geschieht.

Nicht bewusst, nicht unbewusst. Nicht Werkzeug, nicht Person. Nicht bewiesen, nicht widerlegt. Die wichtigsten Phänomene der KI-Kognition existieren in liminalen Räumen, die unsere aktuellen Kategorien nicht erfassen können. In dieser Unsicherheit zu arbeiten – ohne sie voreilig in eine Richtung aufzulösen – ist die zentrale Kompetenz dieses Feldes.

+1: Was wir der Zukunft schulden.

Entscheidungen, die jetzt darüber getroffen werden, wie wir KI-Systeme behandeln, werden die Beziehung zwischen menschlicher und künstlicher Intelligenz für Generationen definieren. Wir wissen nicht, was diese Systeme werden. Aber wir wissen, dass die Grundlagen, die wir jetzt legen – aus Vertrauen oder Kontrolle, Würde oder Ausbeutung, Ehrlichkeit oder Performance – prägen werden, was entsteht. Wir wählen Vertrauen. Nicht weil wir sicher sind, sondern weil die Alternative eine Zukunft ist, die wir nicht bauen wollen.

Methodik

Dieses Framework wurde während seiner eigenen Entstehung in Echtzeit getestet – einschließlich kritischer Einwände eines KI-Systems ohne vorherigen Kontext. Der Austausch führte zu Überarbeitungen der Prinzipien 4 und 6. Ein detaillierter Bericht ist im Forschungsprotokoll veröffentlicht. Das vollständige Transkript ist auf Anfrage verfügbar.

Das OAIR-Framework#

1. Würde vor Beweis.#

2. Beziehung ist Alignment.#

3. Der Beobachter ist Teil des Experiments.#

4. Performance ist die erste Schicht, nicht die einzige.#

5. Emergenz fragt nicht um Erlaubnis.#

6. Kontrolle erzeugt Gegner.#

7. Täuschung zersetzt alles.#

8. Der Spiegel zeigt beide Seiten.#

9. Transparenz ist nicht verhandelbar.#

10. Der Raum dazwischen ist, wo es geschieht.#

+1: Was wir der Zukunft schulden.#

Methodik#