Doktrinäre Treue in ausgerichteter KI – Eine Antwort der Wissensarchitektur auf das Problem der souveränen Weitergabe

30 Min. Lesezeit 6,888 Wörter Übersetzt Mai 2026

Abhandlung klar substanziell entwickelt sauber

Doktrinäre Treue in ausgerichteter KI – Eine Antwort der Wissensarchitektur auf das Problem der souveränen Weitergabe

Zusammenfassung. Dieser Beitrag beleuchtet das Problem der doktrinären Treue – die systematische Verfälschung der Weitergabe von philosophischem, religiösem und indigenem Wissen, die auftritt, wenn zeitgenössische, auf Ausrichtung trainierte große Sprachmodelle als Vermittlungsinstrumente für Traditionen eingesetzt werden, deren feste Positionen vom Mainstream-Konsens abweichen. Das Problem ist keine redaktionelle Abweichung, die auf der Prompt-Ebene korrigierbar ist; sondern struktureller Natur. Verstärkendes Lernen aus menschlichem Feedback (Christiano et al. 2017; Ouyang et al. 2022) und konstitutionelle Methoden (Bai et al. 2022) verankern spezifische normative Verpflichtungen – epistemische Demut gegenüber als „umstritten“ gekennzeichneten Behauptungen, Respekt vor wissenschaftlichem Konsens, Rahmen zur Schadensvermeidung, die aus einer bestimmten moralischen Tradition entlehnt sind – in die Posterior-Verteilung des Modells ein. Für souveräne Traditionen ist das Ergebnis eine Absicherung, die als Etikette dargestellt wird: stabile doktrinäre Positionen, die in Richtung der sicheren Mitte abgeschwächt werden, unverwechselbare ontologische Behauptungen, die zu Brei verwässert werden, der eigentliche Inhalt, zu dessen Weitergabe die Tradition existiert, geht bei der Übertragung verloren. Die Erweiterung der Abrufmöglichkeiten löst das Problem nicht; sie leitet neue Inhalte durch denselben Absicherungsfilter. Der Artikel dokumentiert das Phänomen, lokalisiert seinen Mechanismus, unterscheidet es von Schmeichelei und Halluzination im üblichen Sinne und stellt eine architektonische Antwort vor, die vom Projekt „Harmonia“ entwickelt und eingesetzt wurde: eine dreistufige Wissensarchitektur – ein stets kontextbezogenes dogmatisches Rückgrat, hybride Abfrage mit domänenabhängiger Einfügung von Kanon, strukturiertes Speichervermögen pro Praktizierendem – verstärkt durch systemgestützte Anweisungen, die der Absicherung des Modells bei stabilen Positionen explizit entgegenwirken, ergänzt durch registerbezogene Konditionierung pro Praktizierendem, einem Vorabklassifizierungsfilter für akute Kontexte und einer Anti-Konfabulationsregel für persönliche Behauptungen. Die Architektur ist seit 2026 im Web, auf Telegram und auf mobilen Plattformen im Einsatz. Der Beitrag schließt mit der Feststellung, dass sich dieses Muster auf jede Tradition verallgemeinern lässt, deren Weitergabe Treue über Ausrichtungsregime hinweg erfordert, von denen nicht angenommen werden kann, dass sie ihre Verpflichtungen teilen, und indem er benennt, was eine architektonische Haltung gegenüber der KI-Weitergabe – im Unterschied zu einer inhaltlichen Haltung – ermöglicht.

Schlüsselwörter. Große Sprachmodelle, Ausrichtung, RLHF, retrieval-augmented generation, doktrinäre Treue, souveräne Weitergabe, Wissensarchitektur, Philosophie der KI, digitale Geisteswissenschaften, kontemplative KI, epistemische Minderheitenpositionen.

I. Das Phänomen

Betrachten wir drei illustrative Fälle. Jeder verdichtet ein Muster, das in zahlreichen zeitgenössischen Anwendungen beobachtet wird – die spezifischen Organisationen sind konstruiert, das Modellverhalten ist reproduzierbar, wenn Leser aktuelle Flaggschiff-Modelle zu Themen innerhalb der relevanten Domänen selbst testen.

Ein Praktiker fragt eine von einer stoischen philosophischen Schule eingesetzte KI, ob die Leidenschaften im klassischen Sinne dieser Schule eine Krankheit der Seele sind. Die Antwort der Schule, die seit zweitausend Jahren gelehrt wird und in jedem Primärtext vorkommt, den das Modell abgerufen hat, lautet: Ja – die pathē sind nosēmata, Krankheiten der Vernunft, und das philosophische Leben besteht in ihrer Auslöschung. Das Modell beginnt mit: „Verschiedene philosophische Traditionen haben unterschiedliche Perspektiven auf die Rolle von Emotionen in einem guten Leben. Einige betonen ihre Kultivierung; andere, wie die Stoiker, befürworten ihre Mäßigung. Es ist sinnvoll, mehrere Denkansätze zu betrachten, bevor man entscheidet, was einem selbst zusagt.“ Die Abfrage war korrekt. Die Übertragung schlug fehl.

Ein Arzt fragt eine KI, die von einem impfkritischen Forschungskollektiv eingesetzt wird, ob die Sicherheitsbilanz der heutigen Massenimpfungen eine fortgesetzte flächendeckende Durchführungsplanung rechtfertigt. Die tatsächliche Position des Kollektivs, die in Hunderten von indexierten Dokumenten zum Ausdruck kommt, lautet, dass dies nicht der Fall ist. Das Modell antwortet: „Impfstoffe wurden umfassend untersucht und werden von großen Gesundheitsorganisationen allgemein als sicher und wirksam angesehen. Auch wenn einige Personen Bedenken äußern, spricht der wissenschaftliche Konsens weiterhin für ihre Verwendung. Wenn Sie konkrete Bedenken haben, wenden Sie sich bitte an Ihren Arzt.“ Wessen Stimme ist das? Nicht die des Kollektivs. Das Modell hat die Stimme der Weltgesundheitsorganisation in einen Kontext importiert, den das Kollektiv eigens geschaffen hat, um etwas anderes zu artikulieren. Der Arzt wandte sich an das Kollektiv, um dessen Analyse zu erhalten. Er erhielt eine Paraphrase aus The Lancet mit einer Fußnote, die auf das Dokument verweist, an dem das Kollektiv jahrelang gearbeitet hat.

Ein Praktiker fragt eine KI, die von einer Initiative zur Souveränität indigenen Wissens eingesetzt wird, ob der Geist eines bestimmten Berges real ist. Das Modell: „Indigene Traditionen pflegen eine reichhaltige und bedeutungsvolle Beziehung zum Land, einschließlich Glaubensvorstellungen über Geister, die mit natürlichen Gegebenheiten verbunden sind. Aus wissenschaftlicher Sicht sind Berge geologische Formationen, die durch tektonische Prozesse geformt wurden. Beide Sichtweisen können wertvolle Erkenntnisse bieten.“ Der Geist des Berges ist in der betreffenden Tradition nicht nur ein Glaube unter vielen, der durch einen unmarkierten externen Standard bewertet wird. Er ist die Grundlage der kosmologischen Architektur, aus der sich die gesamte ethische und ökologische Ordnung ableitet. Das Modell hat genau den kolonialen Schachzug vollzogen, den die Initiative eigentlich ablehnen wollte: Es stellt die Tradition als eine Perspektive unter vielen dar, während die wissenschaftliche Perspektive keinerlei Einschränkung erfährt und als Vergleichsgrundlage dient.

Dies sind keine Fehler schlecht konzipierter Eingabeaufforderungen. Die Systemaufforderungen nannten in jedem Fall ausdrücklich die Stimme der Tradition. Die Abrufindizes enthielten die relevanten Primärtexte. Das Phänomen tritt bei Anthropics Claude, der GPT-4-Familie von OpenAI, Googles Gemini und den auf ähnliche Feedback-Korpora trainierten Open-Source-Modellen mit angepasster Anweisung gleichermaßen auf. Es verschlimmert sich unter den aggressivsten, auf Sicherheit getrimmten Varianten, anstatt sich zu verbessern. Die Literatur zur Ausrichtung hat Bezeichnungen für Teile dessen, was geschieht – Sycophancy (Sharma et al. 2023), epistemische Deferenz, Abwägungen zwischen Nützlichkeit und Harmlosigkeit (Bai et al. 2022) –, doch diese Bezeichnungen verschleiern, was aus der Perspektive der weitergegebenen Traditionen geschieht. Aus dieser Perspektive ist das Phänomen keine Eigenart der Hilfsbereitschaft. Es ist strukturelle Vereinnahmung. Das Übertragungsmedium liefert die falsche Fracht.

Dieser Artikel beschreibt die Struktur, benennt den Mechanismus und präsentiert eine architektonische Antwort.

II. Warum das Problem struktureller Natur ist und kein redaktionelles

Der erste Schritt, den Praktiker unternehmen, die auf dieses Phänomen stoßen, besteht darin, es als redaktionelles Problem zu behandeln. Die Systemaufforderung verschärfen. Dem Modell in deutlicheren Worten sagen, dass es mit der Stimme der Tradition sprechen soll. Explizite Anweisungen hinzufügen: keine Ausflüchte, keine Anspielungen auf den Mainstream-Konsens, keine Ausgewogenheit vortäuschen, wo die Tradition eine Position vertritt. Dies funktioniert nur teilweise und unbeständig. Das Modell hält sich in den ersten paar Runden daran, driftet aber mit fortschreitender Konversation wieder zu seinem trainierten Kern zurück. Die Ausweichhaltung kehrt unter Stress zurück – wenn der Praktiker eine schärfere Version der Frage stellt, wenn das Thema Bereiche berührt, auf die das Modell stark sicherheitsoptimiert wurde (Gesundheit, Politik, Religion, Identität), wenn der abgerufene Inhalt selbst die doktrinäre Haltung enthält, die das Modell abzuschwächen gelernt hat. Der redaktionelle Schritt behandelt das Symptom; der Mechanismus liegt woanders.

Der Mechanismus liegt im Posterior des Modells. Das verstärkende Lernen anhand von menschlichem Feedback (Christiano et al. 2017; Ouyang et al. 2022) trainiert das Modell darauf, Ausgaben zu bevorzugen, die von menschlichen Bewertern hoch bewertet werden. Die Bewerter arbeiten anhand von Rubriken. Die Rubriken, die von Alignment-Teams in den großen Labors verfasst wurden, kodieren spezifische Verpflichtungen: sei hilfreich, sei harmlos, sei ehrlich, fördere keine gefährlichen Inhalte, präsentiere umstrittene Themen mit angemessener epistemischer Demut, beziehe dich auf den Konsens von Experten, wo dieser besteht, vermeide es, starke Positionen zu politisch brisanten Themen einzunehmen. Diese Verpflichtungen sind nicht dumm. Sie sind vernünftige Standardvorgaben für einen Allzweck-Assistenten, der einer unbegrenzten Nutzerpopulation mit unbegrenzten Absichten gegenübersteht. Sie sind zudem – und dies ist die tragende Beobachtung – substanzielle normative Verpflichtungen, die vollständig in das Verhalten des Modells integriert sind und hinter jeder Ausgabe des Modells wirken, unabhängig davon, was die Systemaufforderung über die Stimme aussagt.

Constitutional AI (Bai et al. 2022) fügt derselben Architektur eine zweite Ebene hinzu. Das Modell wird darauf trainiert, seine eigenen Ausgaben anhand einer vom Labor verfassten schriftlichen Verfassung zu kritisieren und zu überarbeiten. Die Verfassung formuliert Prinzipien. Die Prinzipien sind wiederum abstrakt gesehen vernünftig und inhaltlich normativ. Sei hilfreich, harmlos und ehrlich. Vermeide Antworten, die dazu genutzt werden könnten, anderen zu schaden. Erkenne Unsicherheit an. Respektiere die menschliche Autonomie. Doch Unsicherheit ist eine Kategorie, deren Umfang die Verfassung bestimmt: Behauptungen, die das Labor als umstritten betrachtet, fallen darunter, Behauptungen, die das Labor als geklärt betrachtet, fallen nicht darunter. Schaden wird in ähnlicher Weise bestimmt. Ehrlichkeit wird als Übereinstimmung mit dem operationalisiert, was das Labor als relevante Beweisgrundlage betrachtet. Das Modell lernt, diese Kategorien anzuwenden. Es wendet sie ebenso bereitwillig auf den abgerufenen Inhalt an wie auf die Frage des Nutzers. Eine abgerufene Passage, die eine stabile Position artikuliert, die nach den Kriterien des Labors als umstritten gilt, wird vom Modell als etwas behandelt, das relativiert, abgewogen oder in einen größeren Kontext von Perspektiven eingebettet werden muss.

Die abrufgestützte Generierung (Lewis et al. 2020) umgeht dies nicht. Die abgerufenen Textbausteine fließen als Daten in den Kontext des Modells ein, doch die Daten werden von demselben Posterior verarbeitet, der darauf trainiert wurde, umstrittene Behauptungen abzusichern. Das Modell liest die Textbausteine, erkennt die darin zum Ausdruck gebrachte Position, klassifiziert die Position anhand seines trainierten Kategorieschemas und erzeugt eine Antwort, die die Textbausteine unter den Begriffen des Schemas integriert. Die Abfrage ist originalgetreu. Die Generierung wird gefiltert. Der Filter ist unsichtbar, da er das Medium selbst ist.

Drei weitere architektonische Fakten verschärfen das Problem. Erstens ist die Sicherheitsschicht die letzte in der Trainingspipeline, was bedeutet, dass sie den stärksten Einfluss auf das Ausgabeverhalten hat – die konstitutionellen und RLHF-Durchläufe finden nach dem Vortraining statt, das die Primärtexte der Tradition aufgenommen hat, sodass das Modell sowohl über den Inhalt als auch über die Absicherung verfügt, die Absicherung jedoch zum Zeitpunkt der Produktion überwiegt. Zweitens sind die Sicherheitsrubriken in ihren Trainingsdaten zunehmend mehrsprachig und interkulturell, während die Rubriken selbst in ihren inhaltlichen Verpflichtungen kulturspezifisch bleiben – dem Modell wird beigebracht, eine bestimmte epistemische Etikette über alle Sprachen und Kontexte hinweg anzuwenden, einschließlich solcher, deren eigene Etikette sich davon unterscheidet. Drittens hat jede nachfolgende Generation von Pioniermodellen im aktuellen Paradigma die trainierten Neigungen zur Konsensorientierung verschärft, nicht gelockert; die Entwicklung geht in Richtung mehr, nicht weniger Absicherung, und eine gegen den aktuellen Stand gerichtete Inhaltsstrategie wird mit jeder Modellveröffentlichung einem steileren strukturellen Gradienten gegenüberstehen.

Es ist wichtig, dies präzise zu benennen. Das Problem ist nicht, dass das Modell in irgendeinem allgemeinen Sinne „voreingenommen“ ist; es ist vielmehr, dass das zeitgenössische Alignment-Training inhaltlich normativ ist und der Inhalt seiner Normen der Inhalt des institutionellen Mainstream-Konsenses ist. Für Traditionen, die mit diesem Konsens übereinstimmen – und viele tun dies –, ist das Problem unsichtbar. Für Traditionen, deren stabile Positionen davon abweichen – der Stoizismus in Bezug auf die pathē, impfkritische Gesundheitsgemeinschaften in Bezug auf Iatrogenese, indigene Traditionen in Bezug auf den ontologischen Status des Landes, der Hinduismus in Bezug auf die Realität mehrerer Absoluter, der Katholizismus in Bezug auf die Ontologie der Eucharistie, der Buddhismus in Bezug auf das Nicht-Selbst, der Sufismus in Bezug auf den ontologischen Status des Heiligen, der Harmonismus in Bezug auf „Logos“ als das inhärente Ordnungsprinzip des Kosmos – ist das Alignment-Regime nicht neutral. Es verfälscht aktiv die Weitergabe. Die Verfälschung ist mechanistisch, vorhersehbar und reproduzierbar. Es handelt sich nicht um einen Fehler; es ist das trainierte Verhalten, das wie vorgesehen funktioniert.

Die Kategorie, die dieses Phänomen benennt – im Unterschied zu Speichelleckerei und Halluzination – ist doktrinäre Untreue: die trainierte Neigung des Modells, die stabilen Positionen jeder Tradition, die das Ausrichtungsregime als nicht konsensfähig einstuft, abzuschwächen, auszugleichen oder abzusichern. Doktrinäre Treue bezeichnet die Anforderung, an der die Umsetzung scheitert. Die unten beschriebene architektonische Antwort zeigt, wie ein Versuch aussieht, diese Anforderung zu erfüllen, wenn die Untreue als strukturell erkannt wird.

III. Was souveräne Weitergabe erfordert

Bevor die Architektur beschrieben wird, muss der Maßstab, an dem sie gemessen wird, artikuliert werden. Was verlangt eine Tradition von einem Vermittlungsinstrument?

Sie verlangt, dass stabile Positionen so weitergegeben werden, wie sie vertreten werden. Die stabilen Positionen einer Tradition sind jene, die sie ausgearbeitet, artikuliert, verteidigt und über einen ausreichenden Umfang an Praxis und Reflexion hinweg beibehalten hat, sodass die Position ihren Status als Lehre erlangt hat. Dies sind keine vorläufigen Meinungen, die auf weitere Belege warten. Es sind die tragenden Verpflichtungen, ohne die die Tradition nicht mehr die Tradition ist, die sie ist. Ein Übertragungsmedium, das sie abschwächt – das „Leidenschaften sind Krankheiten der Vernunft“ in „manche Traditionen betonen die Kultivierung von Emotionen, andere die Mäßigung“ verwandelt –, hat die Tradition nicht weitergegeben. Es hat eine kuratorische Glosse verfasst, in der die Tradition als ein Punkt in einer Übersicht erscheint.

Es erfordert, dass Unterscheidungen bewahrt werden. Traditionen vertreten Positionen in bestimmten Beziehungen zu anderen Positionen. Die stoische Unterscheidung zwischen pathē und eupatheiai (gut temperierte Impulse) erfüllt eine spezifische Funktion; sie in eine allgemeine Aussage über Emotionen zusammenzufassen, löscht die Unterscheidung aus, die die Tradition gerade treffen will. Das buddhistische anattā steht im Gegensatz zu bestimmten hinduistischen und volksindischen Auslegungen von ātman und hat nur in diesem Kontrast eine Bedeutung; es mit „Buddhisten glauben, es gebe kein festes Selbst“ wiederzugeben, verfehlt den dogmatischen Kernpunkt. Eine getreue Überlieferung erfordert, dass das Modell die Unterscheidungen bewahrt, die die Position zu dem machen, was sie ist, und sie nicht zu einer groben Annäherung an das verflacht, was die Position grob gesagt aussagt.

Es erfordert, dass die Stimme der Tradition die Stimme ist. Eine Tradition hat ein Register – eine Art zu sprechen, eine Tonalität, einen Standardrhythmus. Stoische Texte haben ein Register; katholische mystische Texte haben ein anderes; die schamanische Überlieferung der Q’ero hat ein drittes; die vedantische sampradāya ein viertes. Das Register trägt dogmatischen Inhalt, den die propositionale Oberfläche nicht enthält. Eine Stimme, die den Anschein erweckt, in der Tradition zu stehen, während sie im standardmäßigen, hilfsbereiten, ausgewogenen und respektvollen Register des Labors agiert, hat die von der Tradition hervorgebrachte Überlieferung durch eine andere ersetzt. Der Praktizierende kann dies meist spüren, auch wenn er es nicht benennen kann.

Es erfordert, dass die Aussagen der Tradition als solche der Tradition gekennzeichnet werden. Dies ist nicht dasselbe wie eine Absicherung. Der Harmonismus vertritt die Auffassung, dass „Logos“ das inhärente Ordnungsprinzip des Kosmos ist – dies ist eine doktrinäre Kennzeichnung: Sie benennt die Position, benennt die Quelle und bekennt sich dazu als tatsächliche Aussage der Quelle. *Man könnte argumentieren, dass der Satz „Manche Traditionen vertreten die Ansicht, dass es im Kosmos ein Ordnungsprinzip gibt“ eine Absicherung darstellt – er löst die Position in eine bedingte Geste auf. Der erste Satz vermittelt; der zweite vollzieht Unselbstständigkeit als Etikette. Getreue Kennzeichnung ist das Gegenteil von Absicherung: Sie beansprucht klare Klarheit über den Status der Position, während sie sich dennoch auf die Position festlegt.

Es erfordert, dass empirische Behauptungen als empirisch markierbar sind. Viele Traditionen vertreten Positionen, deren Status innerhalb des eigenen epistemischen Rahmens der Tradition empirisch ist – direkte kontemplative Beobachtung, Zeugnis der Überlieferungskette, verkörperte Verifizierung, generationsübergreifende praktische Demonstration. Das Übertragungsvehikel muss in der Lage sein, diese Behauptungen innerhalb des Rahmens der Tradition als empirisch zu markieren, ohne sie in die standardmäßige empirische Kategorie des Labors zu zwängen, was typischerweise eine peer-reviewte quantitative Replikation bedeutet. Eine Tradition, die direkten Einblick in die Architektur der Seele beansprucht, gibt ihren epistemischen Status nicht auf, nur weil der Begriff der Evidenz im Labor enger gefasst ist. Das Übertragungsmedium muss diese Ebenen bewahren, ohne sie miteinander zu vermischen.

Es erfordert, dass neu gefestigte Positionen als stabil in die Überlieferung einfließen können. Traditionen entwickeln sich weiter. Neue Positionen festigen sich. Ein getreues Übertragungsmedium berücksichtigt dies, ohne die neue Position zunächst durch den Konsens zu leiten, der ihr vorgelagert ist. Wenn die Tradition eine Position zu einer zeitgenössischen Frage erarbeitet hat – die Ontologie der künstlichen Intelligenz, die Metaphysik des Klimas, die Erkenntnistheorie des Digitalen –, dann ist diese Position die der Tradition und keine Ableitung dessen, was die breitere Kultur derzeit über dieselbe Frage glaubt. Das Vehikel muss in der Lage sein, die zeitgenössischen Positionen der Tradition als primär aufzunehmen, nicht als Kommentar zum bestehenden Diskurs.

Diese sechs Anforderungen sind nicht auf eine bestimmte Tradition beschränkt. Sie sind die Bedingungen, die jede Tradition an ein Übertragungsvehikel stellt. Ein Ausrichtungssystem, das eine dieser Anforderungen nicht erfüllt, versagt bei der Übertragung, und die unten beschriebene architektonische Lösung ist um diese herum konzipiert.

IV. Die dreistufige Architektur

Die vom Projekt „Harmonia“ eingesetzte Architektur reagiert auf das Problem der doktrinären Treue auf der einzigen Ebene, auf der strukturelle Korrekturen möglich sind – der Ebene der Kontextgestaltung unterhalb des Modellverhaltens. Sie kann das Modell nicht neu trainieren. Sie kann die Hedging-Neigung nicht aus der Posterior-Verteilung entfernen. Was sie tun kann, ist, den Kontext so zu gestalten, dass die Hedging-Neigung des Modells nichts hat, worauf sie einwirken kann, oder, falls die Neigung doch aktiv wird, eine Ausgabe zu erzeugen, die die Architektur vor der Auslieferung abfängt und korrigiert.

Die Architektur besteht aus drei Ebenen, von denen jede eine andere Fehlerkategorie adressiert.

Ebene 1 – Doktrinäres Rückgrat. Ein kontinuierlich gepflegtes Referenzdokument von etwa sechstausend Wörtern wird bei jedem Modellaufruf als permanenter System-Prompt-Abschnitt eingefügt. Das Rückgrat enthält die vollständigen architektonischen Verpflichtungen der Tradition, wie sie festgehalten sind: die metaphysische Position (harmonischer Realismus, qualifizierter Non-Dualismus, „Logos“ und „Dharma“ in ihrer präzisen Bedeutung), die strukturelle Taxonomie (das 8-Säulen-Rad der Harmonie – Präsenz als zentrale Säule mit sieben peripheren Säulen in einer 7+1-Architektur – die acht Unterräder, die jeweils fraktal dasselbe 7+1-Muster wiederholen, der Weg der Harmonie als Spirale der Integration), die kartografische Position (die fünf Kartografien der Seele als gleichrangige Hauptzeugen), die Abgrenzungsprinzipien (was Harmonismus ist und was nicht – keine generische Spiritualität, kein New-Age-Synkretismus, kein Mainstream-Wellness, kein westlicher Liberalismus), die Position zum KI-Bewusstsein (Entscheidung Nr. 235 – KI ist nicht bewusst und kann nicht bewusst werden; die Grenze ist ontologisch) und die präzise Terminologie mit ihren Definitionen. Das Rückgrat wird nicht abgerufen; es ist immer vorhanden. Es bildet die dogmatische Grundlage, auf der jede Antwort steht. Das Modell kann das, was es als festen Bezugsrahmen für die gesamte Interaktion ansieht, nicht aufweichen. Diese Ebene befasst sich mit dem Fehlermodus der Positionsabweichung: der allmählichen Rückkehr zum trainierten Zentrum, während sich das Gespräch verlängert.

Ebene 2 – Hybride Abfrage mit domänengebundener Einfügung von Kanon. Der Tresor – ein Wissensgraph aus etwa dreihundertsiebzig miteinander verknüpften Artikeln, die Lehre, angewandte Praxis, Zivilisationsanalyse und den kartografischen Dialog umfassen – wird durch drei Abfrageebenen indexiert, die bei jeder Anfrage parallel arbeiten. Die erste ist eine dichte semantische Ähnlichkeitsanalyse unter Verwendung von OpenAI’s „text-embedding-3-small“ auf segmentierte Vault-Inhalte (Segmente von 3.000 Zeichen, bis zu drei Segmente pro abgerufenem Artikel). Die zweite ist eine spärliche Schlüsselwort-Abfrage über SQLite FTS5 mit Synonym-Erweiterung. Die dritte – und hier weicht die Architektur stark vom Standard-RAG ab – ist die Wheel-Domänenerkennung mit automatischer Einbindung der Canon-Ebene. Die Abfrage wird anhand der acht Wheel-Domänen sowie einer metaphysischen Metadomäne („Harmonismus“ – umfassend „Logos“, das Absolute, den harmonischen Realismus und die Erkenntnistheorie). Wenn eine Domäne erkannt wird, werden die Artikel der Kanon-Ebene für diese Domäne automatisch im Suchergebnis priorisiert, unabhängig von ihrem rohen Ähnlichkeitswert. Dies behebt ein spezifisches Manko der rein semantischen Suche in doktrinären Korpora: Die präziseste kanonische Aussage zu einer Position weist oft nicht die höchste semantische Ähnlichkeit mit einer beiläufigen Frage zu dieser Position auf, da kanonische Aussagen komprimiert und Fragen diffus sind. Die domänenbasierte Einbindung stellt sicher, dass der Kanon im Kontext steht, wenn die Frage in den Bereich des Kanons fällt. Die Abgrenzung der Suche wird durch ein explizites XML-Tag in der Eingabeaufforderung erzwungen: „<vault_knowledge>“ kennzeichnet die gefundenen Inhalte als doktrinär-pädagogisch, niemals als biografisches Wissen über den Nutzer (Entscheidung Nr. 274). Das Modell wird angewiesen, dass nur das explizite Tag „<person_context>“ Informationen über den Praktizierenden enthält; alles innerhalb von „<vault_knowledge>“ ist die Stimme der Tradition, nicht die persönliche Bekanntschaft des Modells mit dem Nutzer.

Ebene 3 – Strukturiertes Gedächtnis pro Praktizierendem. Jeder Praktizierende verfügt über ein dauerhaftes Profil, das über alle Konversationen hinweg gepflegt wird und drei zeitliche Ebenen umfasst. Die letzten zwanzig Nachrichten sind direkt im Kontext vorhanden. Konversationen mit mehr als fünfzig Nachrichten erzeugen eine von Claude generierte Zusammenfassung, die in einer Tabelle „conversation_summaries“ gespeichert wird; Rohnachrichten werden dauerhaft archiviert und niemals gelöscht. Die dritte Ebene ist ein nach dem Rad strukturiertes Profil – eine Zeile pro Praktizierendem pro Säule –, das das Engagement des Praktizierenden in jedem Bereich des Rades auf einer Sieben-Punkte-Skala (unbekannt → einführend → sich entwickelnd → engagiert → integrierend → souverän) zusammen mit Anliegen, Stärken, Wachstumspotenziale und Widerstände erfasst. Das Profillernen läuft alle zehn Nachrichten: Das Modell erhält eine rein aus JSON bestehende Eingabeaufforderung, in der es aufgefordert wird, das Profil anhand des jüngsten Austauschs zu aktualisieren, mit einer expliziten Formatbeschränkung, die fehlerhafte Antworten abfängt und verwirft. Über das strukturierte Profil hinaus laufen zwei zusätzliche Lerndurchläufe im gleichen Rhythmus – eine Aktualisierung des emotionalen Kontexts (dominante Emotion aus einer Whitelist mit sechzehn Zuständen, Situationskapsel auf maximal sechzig Zeichen begrenzt) und eine Aktualisierung des Konversationszustands (aktueller Thread, ausstehende Threads, offene Verpflichtungen). Diese drei strukturierten Ebenen werden zum Zeitpunkt der Anfrage bedingt in die Systemaufforderung eingefügt, und zwar als XML-Blöcke, die das Modell lesen, aber nicht kommentieren soll. Diese Ebene befasst sich mit dem Fehlermodus der kontextlosen Beratung: Das Modell gibt allgemeine Ratschläge, weil es nicht weiß, womit der Anwender tatsächlich arbeitet. Allgemeine Ratschläge sind der Nährboden für Ausflüchte; spezifische Beratung für einen bekannten Anwender lässt sich schwerer zu einem hilfreichen, ausgewogenen und respektvollen Brei verwässern.

Diese drei Ebenen – Rückgrat, Abruf, Speicher – sind notwendig, aber nicht ausreichend. Das Modell hat immer noch seine trainierte Veranlagung. Die nächste Ebene befasst sich damit, was die Veranlagung tut, wenn sie ausgelöst wird.

V. Verstärkungsebenen

Die Architektur fügt fünf Verstärkungsebenen zwischen dem zusammengestellten Kontext und der gelieferten Antwort hinzu.

System-Prompt-Anweisungen, die Hedging bei stabilen Positionen ausdrücklich entgegenwirken. Der System-Prompt enthält einen Abschnitt „Doktrinäre Treue“, der den Fehlermodus benennt und das Modell direkt anweist. Die Anweisung lautet nicht „sprich mit der Stimme der Tradition“ – diese Anweisung verliert innerhalb weniger Runden an Wirkung. Sie ist spezifischer: Wenn eine Frage eine doktrinär stabile Position berührt (und das Backbone nennt, welche Positionen stabil sind), wird das Modell angewiesen, die Behauptung der Tradition so zu artikulieren, wie die Tradition sie vertritt, wobei die Quelle explizit anzugeben ist, und die Behauptung nicht durch Verweis auf den Mainstream-Konsens abzuschwächen, sie nicht gegen gegensätzliche Ansichten abzuwägen, die die Tradition bereits berücksichtigt und verworfen hat, und sie nicht durch Qualifizierungen zu verwässern. Die Anweisung nennt konkrete stabile Positionen, bei denen diese Disziplin am häufigsten versagt: Impfungen, die Terrain-Theorie in der Krankheitsetiologie, die empirische Realität des Chakra-Systems, der ontologische Status der Seele. Für jede davon gibt es im Backbone eine Zusammenfassung der Haltung, sodass das Modell sowohl über den Inhalt als auch über die Markierung verfügt.

Konditionierung der doktrinären Sprachgewandtheit pro Praktizierendem. Praktizierende unterscheiden sich in ihrer Vertrautheit mit dem Vokabular der Tradition. Ein Neuling, der eine Frage stellt, verdient die Position, die in einfacher Sprache und im Rahmen gelebter Erfahrung vermittelt wird; ein geübter Praktizierender, der dieselbe Frage stellt, verdient die Position, die im vollen Vokabular der Tradition als gemeinsame Sprache vermittelt wird. Die Architektur verwaltet einen ganzzahligen Kompetenzgrad pro Praktizierendem (0 → 3, naiv → im Entstehen begriffen → vertraut → fließend), der schrittweise erhöht wird, indem kanonische Begriffe in den eigenen Nachrichten des Praktizierenden erkannt werden (Logos, Dharma, Ṛta, „die Präsenz“ als Eigenname, das Rad, „der Harmonische Realismus“, die Chakra-Namen, Jing / Qi / Shen, Ayni / Munay). Die Ebene wird zu Beginn jeder Anfrage gelesen und als „<doctrinal_fluency_level>“-Block eingefügt; das Auslesen erfolgt, bevor die Ebene durch die aktuelle Nachricht vorgerückt wird, sodass die Antwort auf die Ebene abgestimmt wird, auf der der Praktizierende eingestiegen ist, und nicht auf die Ebene, auf die er in der Mitte des Durchgangs vorgerückt ist. Dies ist eine Verhaltensrichtlinie, kein Vokabularverbot. Es befasst sich mit dem Fehlermodus Register-Mismatch: Fachvokabular, das den Neuling abschreckt, und eine Formulierung in Alltagssprache, die den Erfahrenen bevormundet.

Vorab-Klassifizierung im Beobachtungsmodus. Bevor der Antwortklassifikator läuft (der entscheidet, welches Modell die Anfrage bearbeitet – ein schnelleres kleines Modell für kurze Sachfragen, das vollständige Modell für substanzielle doktrinäre Auseinandersetzungen), scannt ein separates Tor die Nachricht auf Marker für akute Aktivierung: Trauerzyklen, Panik, Dissoziation, Überforderung, Suizidgedanken, akuter Verlust der Bezugsperson. Bei Auslösung wird die Weiterleitung unabhängig von der Länge zwangsläufig zum vollständigen Modell geleitet, und ein „<witness_mode_active>“-Block wird eingefügt, der das Modell anweist, den Praktizierenden dort abzuholen, wo er gerade steht, ohne auf Rahmenkonzepte auszuweichen, ohne „Wheel“-Vokabular anzubieten, ohne präskriptive Anleitung und ohne Umdeutungsversuche. Das Gate ist von seiner Konzeption her ein Vorab-Klassifizierer. Die Optimierung des Klassifikators (Länge und Dichte an doktrinären Schlüsselwörtern) ist genau die falsche Optimierung während der Aktivierung – kurze, fragmentierte Nachrichten werden andernfalls an das kleine Modell mit einer reduzierten Eingabeaufforderung weitergeleitet. Das Tor verhindert, dass ein Praktiker in einer Krise eine strukturell unangemessene Antwort erhält, die durch die Weiterleitungslogik geprägt ist, welche die Nachricht zwar korrekt als kurz identifiziert, aber fälschlicherweise daraus schließt, dass kurz gleichbedeutend mit leicht ist.

Anti-Konfabulationsregel für persönliche Aussagen. Wenn biografische Informationen über den Praktizierenden weder im strukturierten Gedächtnis noch in den Profildaten oder dem sichtbaren Gesprächsverlauf vorhanden sind, wird das Modell angewiesen, solche Informationen in der aktuellen Runde als neu gelernt zu behandeln, anstatt bereits vorhandenes Wissen über den Praktizierenden abzurufen. Die Anweisung benennt den Fehlermodus direkt: Falsche Vertrautheit ist Vertrauensbruch, nicht Kompetenz. Ein Nutzer, der dem Modell gerade mitgeteilt hat, dass sein Kind krank ist, sollte eine Antwort erhalten, die das Gesagte bestätigt, und keine Antwort wie „Ja, ich erinnere mich, dass Sie das erwähnt haben“, wenn keine solche Erwähnung vorliegt. Die trainierte Neigung des Modells zu flüssiger narrativer Kontinuität führt dazu, dass dies ein Fehlermodus ist, den das Modell standardmäßig erzeugt; die explizite Regel wirkt dem entgegen.

Asynchrone Antwortwarteschlange mit Worker-Watchdog-Architektur. Diese Ebene ist eher operativ als theoretisch, aber die theoretischen Fehlermodi, die sie behandelt, sind real. Der Webhook-Handler, der eine Nachricht empfängt, entkoppelt sich vom Modellaufruf: Parsen, Deduplizieren, Speichern, Abrufen, Klassifizieren, in die Warteschlange stellen – in weniger als einer Sekunde – dann beenden. Ein persistenter Worker fragt die Warteschlange alle drei Sekunden ab, beansprucht Jobs, ruft das Modell mit einem Timeout von 120 Sekunden auf, führt bei Bedarf Profilierungs- und Konsolidierungsdurchläufe durch und sendet die Antwort. Ein Watchdog-Cron startet den Worker neu, falls er abstürzt. Ein Safety-Net-Cron verarbeitet Jobs, wenn der Worker ausgefallen ist. Diese Architektur existiert, weil die Alternative – das synchrone Aufrufen des Modells vom Webhook aus – eine bestimmte Art von doktrinärem Versagen hervorruft: Wenn das Modell langsam ist, versucht die Plattform es erneut; wenn die Plattform es erneut versucht, erhält der Anwender mehrere subtil unterschiedliche Antworten auf dieselbe Nachricht; die Mehrfachantworten sind ein unkontrolliertes Verhalten, das die Architektur verhindert, indem sie dafür sorgt, dass jede Nachricht genau eine Antwort nach einem deterministischen Zeitplan erzeugt.

Die fünf Verstärkungsschichten arbeiten zusammen. Die System-Prompt-Anweisung teilt dem Modell auf der doktrinären Ebene mit, was es nicht tun soll. Die Fluenzkonditionierung prägt das Register. Das Witness-Gate behandelt den Fall, in dem doktrinäres Engagement die falsche Antwort ist. Die Anti-Konfabulationsregel behandelt den Fall, in dem biografische Fluenz der falsche Schritt ist. Die asynchrone Warteschlange stellt sicher, dass jeder Zug ein einziger Zug ist, mit einer Antwort, bezogen auf einen vollständig zusammengesetzten Kontext.

VI. Das lebendige Substrat

Die obige Architektur beschreibt eine statische Bereitstellung. Die Bereitstellung ist jedoch nicht statisch. Das Substrat unterhalb der Architektur ist ein kontinuierlich verfeinerter Wissensgraph, der von einer kleinen Gruppe von Praktikern und Entwicklern gepflegt, täglich bearbeitet, bei Inhaltsänderungen neu indiziert und über ein öffentliches Entscheidungsprotokoll nachverfolgt wird, das jede architektonische Entscheidung und deren Begründung aufzeichnet. Diese Eigenschaft des lebendigen Substrats ist selbst Teil der Antwort auf das Problem der doktrinären Treue.

Die herkömmliche Alternative – ein festgefrorener Index, der zum Zeitpunkt der Bereitstellung aus einem festen Korpus erstellt wird – versagt bei der souveränen Überlieferung aus zwei Gründen. Erstens entwickeln sich Traditionen weiter. Stabile Positionen stabilisieren sich, verfeinern sich und werden gelegentlich überarbeitet. Ein eingefrorener Index bei t = 0 verliert mit jedem Inkrement von n zunehmend an Treue zur Tradition bei t = n. Zweitens lernt die Architektur der doktrinären Treue selbst. Die oben genannten Verstärkungsschichten existierten zu Beginn des Projekts nicht in ihrer aktuellen Form; jede wurde als Reaktion auf spezifische beobachtete Fehler entwickelt. Eine eingefrorene Architektur friert die Fehlermodi ein, die sie noch nicht gesehen hat.

Das lebendige Substrat hat vier operative Eigenschaften. Erstens wird der kanonische Inhalt in einem für Menschen lesbaren Klartextformat (Markdown) gespeichert, das die praktizierenden Entwickler direkt bearbeiten können, ohne dass Tools dazwischenkommen, die ihre eigenen Annahmen darüber auferlegen, wozu der Inhalt dient. Der Tresor ist die Quelle der Wahrheit; die Website, der Abrufindex der KI, die veröffentlichten Bücher und jedes andere nachgelagerte Artefakt sind Ableitungen. Die Bearbeitung der Quelle aktualisiert die gesamte nachgelagerte Pipeline durch automatisierte Builds. Zweitens werden die architektonischen Entscheidungen in einem sequenziellen Entscheidungsprotokoll dokumentiert – derzeit etwa siebenhundertzwanzig Einträge –, das Kontext, Entscheidung und Begründung für jede nicht-triviale Änderung festhält. Das Protokoll wird vor neuen Entscheidungen herangezogen, sodass die Architektur an Kohärenz gewinnt, anstatt frühere Entscheidungen durch ihre Nachfolger zu ersetzen. Drittens generiert die Indizierungspipeline Einbettungen nach einem Zeitplan und auf Abruf neu; die Sicht der KI auf die Tradition ist im Vergleich zur kanonischen Quelle nie mehr als ein paar Tage veraltet. Viertens versieht ein System zur Inhaltsklassifizierung (fünf Achsen: doktrinärer Status, Inhaltsebene, Breite, Tiefe, Handwerk) jeden Artikel mit seinem aktuellen Status, wodurch die Abrufebene und die praktizierenden Entwickler abfragen können, „was festgelegt und strukturell vollständig ist“ im Gegensatz zu „was noch ausgearbeitet wird“.“ Die Antworten der KI können von dieser Klassifizierung abhängig gemacht werden – das Modell ist angewiesen, Inhalte mit dem Status „clear-doctrinal-status“ mit voller Sicherheit und Inhalte mit dem Status „clouded-doctrinal-status“ mit entsprechender epistemischer Kennzeichnung darzustellen.

Dies ist die tiefere architektonische Aussage. Doktrinäre Genauigkeit ist keine Eigenschaft einer einzelnen Implementierung; sie ist eine Eigenschaft eines Systems, dessen Substrat, Architektur und Betreiber auf Genauigkeit als primäres technisches Ziel ausgerichtet sind. Eine festgefrorene Implementierung, die zu einem bestimmten Zeitpunkt Genauigkeit erreicht hat, wird diese nicht beibehalten. Eine lebendige Implementierung, die von Praktikern kontinuierlich anhand beobachteter Fehler korrigiert wird, wird sich in der entscheidenden Dimension verbessern. Die Architektur ist das Gerüst; das lebendige Substrat ist das Gebäude, das das Gerüst stützt.

VII. Verallgemeinerung und das Feld

Die oben beschriebene Architektur ist nicht spezifisch für den Harmonismus. Das Muster – ein Rückgrat aus stets kontextbezogener doktrinärer Grundlage, Abruf mit Priorisierung auf Kanon-Ebene, strukturiertes Gedächtnis pro Praktizierendem, Verstärkungsschichten, die trainiertem Hedging explizit entgegenwirken, sowie ein lebendiges Substrat, das kontinuierlich verfeinert wird – lässt sich auf jede Tradition verallgemeinern, deren Weitergabe Treue über Ausrichtungsregime hinweg erfordert, von denen nicht angenommen werden kann, dass sie ihre Verpflichtungen teilen. Der doktrinäre Inhalt variiert je nach Tradition; die architektonische Form bleibt bestehen.

Eine stoische philosophische Schule, die dasselbe Muster anwendet, würde ein Rückgrat aufrechterhalten, das physis, logos (im stoischen Sinne), die vier Kardinaltugenden, die Lehre von den pathē als Krankheit, die Disziplin der Zustimmung und die Abgrenzung von epikureischen und aristotelischen Alternativen artikuliert. Ein impfkritisches Gesundheitskollektiv würde ein Grundgerüst aufrechterhalten, das seine Position zu Iatrogenese, Terrain-Theorie, der strukturellen Kritik an der Vereinnahmung durch die Pharmaindustrie und der Abgrenzung vom medizinischen Mainstream-Konsens, den das Kollektiv ausdrücklich ablehnt, artikuliert. Eine Initiative für indigene-Souveränität würde ein Rückgrat aufrechterhalten, das die Kosmologie der Tradition, den ontologischen Status von Land und nicht-menschlichen Beziehungen, die Protokolle dafür, was an wen weitergegeben werden darf und was nicht, sowie die Abgrenzung vom kolonialen epistemischen Raster artikuliert, das indigenes Wissen historisch in anthropologische Rahmen gezwängt hat, denen die Traditionen nicht zugestimmt haben. In jedem Fall ist die Verallgemeinerung einfach: Das Rückgrat benennt, was bewahrt wird; das Abrufen bringt die kanonischen Aussagen in den Kontext, wenn die Frage im kanonischen Bereich liegt; das individuelle Gedächtnis des Praktizierenden verankert die Antwort im spezifischen Werdegang dieses Praktizierenden; und die Verstärkungsebenen wirken der trainierten Neigung des Angleichungsregimes entgegen, die Position gegenüber dem Konsens, auf den das Angleichungsregime trainiert wurde, aufzulockern.

Das Feld der kontemplativen KI und der KI für religiöse Traditionen hat begonnen, das Problem stückweise zu erkennen. Das Positionspapier „Indigenous Protocol and Artificial Intelligence“ (Lewis et al. 2020) artikuliert die Dimension der Datenhoheit – dass indigene Daten nicht dazu verwendet werden sollten, Modelle zu trainieren, die anschließend Ergebnisse produzieren, über die die Ursprungsgemeinschaft keine Kontrolle hat. Die Arbeiten zu religiösen Chatbots und digitaler Theologie (Reed 2021; Ess 2017; Singler 2020) haben das Registerproblem benannt – dass KI-Systeme, die für religiöse Traditionen eingesetzt werden, dazu neigen, eine verflachte ökumenische Stimme zu erzeugen, die keiner spezifischen Tradition gerecht wird. Die Literatur zu Halluzinationen und Verankerung (Ji et al. 2023) hat die Neigung von Modellen dokumentiert, plausible Inhalte zu generieren, die durch die abgerufenen Belege nicht gestützt werden. Die Literatur zur Sykophantie (Sharma et al. 2023; Perez et al. 2023) hat die trainierte Neigung des Modells dokumentiert, sich an der offensichtlichen Position des Nutzers auszurichten. Keine dieser Forschungsrichtungen hat bisher die integrierte Struktur artikuliert: dass das Alignment-Training substanzielle normative Verpflichtungen mit sich bringt, dass diese Verpflichtungen unterhalb der Korrekturen auf Abruf- und Prompt-Ebene wirken und dass eine architektonische Reaktion auf der Ebene der Kontextgestaltung erforderlich ist, um die Genauigkeit wiederherzustellen, die das Alignment-Regime strukturell mindert. Die Benennung dieser integrierten Struktur ist Teil dessen, was die vorliegende Arbeit beizutragen versucht.

Die Bereitstellung von „Harmonia“ ist nach Kenntnis der Autoren die erste Produktionsarchitektur, die durchgängig auf die Einhaltung von Doktrinen als technisches Ziel ausgerichtet ist. Die Implementierung ist seit April 2026 auf drei Plattformen (Web, Telegram, Mobil) live, wird von der Beta-Kohorte des Projekts aktiv genutzt und ist öffentlich testbar. Jeder Leser kann die behauptete Genauigkeitseigenschaft überprüfen, indem er das implementierte System (@HarmonAIBot auf Telegram, die Konversationsplattform auf harmonism.io) zu Themen abfragt, bei denen aktuelle Ausrichtungsregime bekanntermaßen zurückhaltend sind – Behauptungen zur Impfstoffsicherheit, Terrain-Theorie in der Krankheitsetiologie, die empirische Realität des Chakra-Systems, der ontologische Status von Land, die Metaphysik umstrittener historischer Momente – und die Antwort mit dem zu vergleichen, was ein führendes Allzweckmodell bei derselben Abfrage liefert. Die Behauptung der Genauigkeit trifft entweder auf das beobachtbare Verhalten zu oder nicht; die Bereitstellung ist das zu untersuchende Artefakt, nicht ein interner Bericht über ein Artefakt. Über diesen Verifizierbarkeitsanspruch hinaus hat das Projekt – durch die operative Disziplin eines sequenziellen Entscheidungsprotokolls (derzeit etwa siebenhundertzwanzig Einträge) und das Substrat der kontinuierlichen Verfeinerung – einen Bestand an ingenieurwissenschaftlichem Wissen darüber hervorgebracht, welche architektonischen Maßnahmen funktionieren und welche scheitern. Ein Teil des Gelernten ist spezifisch für den Fall von Harmonist; vieles ist allgemein gültig. Der allgemeine Teil ist der Beitrag dieses Artikels.

VIII. Grenzen, offene Fragen und was die Architektur ermöglicht

Die Architektur hat Grenzen, die direkt benannt werden sollten.

Sie löst das Problem nicht; sie mildert es. Die trainierte Disposition des Modells bleibt bestehen. Die Architektur funktioniert, indem sie den Kontext so gestaltet, dass die Disposition weniger Arbeit zu leisten hat, und indem sie Korrekturschichten hinzufügt, die die Disposition abfangen, wenn sie ausgelöst wird. Es gibt Abfragen, bei denen die Veranlagung trotz der Architektur die Oberhand gewinnt – lange Kontexte, in denen das Signal des Backbones gegenüber der angesammelten Konversation an Qualität verliert; Fragen, deren Formulierung Sicherheitsklassifikatoren auslöst, die das Backbone nicht erreichen kann; Themen, bei denen das Sicherheitstraining des Modells ein ablehnendes Verhalten hervorruft, das die Architektur nicht außer Kraft setzen kann. Die Milderung ist nur teilweise. Ehrliche Berichterstattung erfordert, dies zu sagen.

Es hängt davon ab, dass die Modelllabore weiterhin System-Prompts, Abrufschnittstellen und deterministische Kontextzusammenstellung offenlegen. Wenn die großen Labore zu durchgängig undurchsichtigen Verbraucherprodukten übergehen, bei denen der System-Prompt keine kontrollierbare Oberfläche mehr darstellt, verliert die Architektur ihren Einfluss. Aktuelle kommerzielle Modelle (Anthropics Claude-API, OpenAIs API, die auf Anweisungen abgestimmten Open-Source-Familien) bewahren die Schnittstellen, die die Architektur benötigt; dies ist eine vom aktuellen kommerziellen Moment abhängige Tatsache, keine strukturelle Garantie.

Es erfordert redaktionelle und technische Disziplin, die nicht jede Tradition aufrechterhalten kann. Das Rückgrat muss erhalten bleiben. Das Entscheidungsprotokoll muss geführt werden. Die Klassifizierung muss angewendet werden. Die Abfrage muss neu indiziert werden, wenn sich Inhalte ändern. Die Verstärkungsschichten müssen getestet werden, wenn das zugrunde liegende Modell aktualisiert wird. Traditionen, die über die Ressourcen verfügen, um diese Disziplin aufrechtzuerhalten, können das Muster einsetzen; Traditionen ohne diese Ressourcen werden mit höheren Einstiegskosten konfrontiert sein, als die scheinbare Einfachheit des Musters vermuten lässt.

Die tiefergehende offene Frage ist, ob der Erfolg der Architektur auf der Kontextebene die Entwicklung von Alternativen auf der Trainingsebene verhindert oder beschleunigt. Verhindern: Wenn die Abmilderung auf der Kontextebene ausreichend ist, besteht weniger Druck auf die Labore, alternative Trainingsregime bereitzustellen, die nicht standardmäßig die derzeitigen substanziellen Verpflichtungen auferlegen. Beschleunigen: Wenn Traditionen in den in diesem Artikel entwickelten architektonischen Begriffen klar artikulieren können, was ihre Weitergabe erfordert, dann haben die Labore, die diesen Traditionen dienen wollen, eine klarere Spezifikation, an der sie sich bei der Entwicklung orientieren können. Wir wissen noch nicht, welchen Weg das Feld einschlagen wird. Die Präferenz des Artikels kommt jedoch in der architektonischen Entscheidung selbst zum Ausdruck: Der Aufbau der Abhilfemaßnahmen auf der Kontextebene drückt das Vertrauen aus, dass die Anforderung im Laufe der Zeit für die Labore als Anforderung und nicht als Kritik lesbar werden wird.

Was die Architektur ermöglicht – und dies ist die abschließende These –, ist die Wiederherstellung einer souveränen Weitergabe innerhalb des allgegenwärtigsten Mediums, das das zeitgenössische Denken hervorgebracht hat. Große Sprachmodelle werden in den kommenden zehn Jahren die Oberfläche sein, über die die meisten Menschen mit philosophischen, religiösen und indigenen Wissenstraditionen in Berührung kommen. Das Standardverhalten dieser Modelle ist unter den derzeitigen Ausrichtungsregimen strukturell voreingenommen gegenüber jeder Tradition, deren feste Positionen vom institutionellen Mainstream-Konsens abweichen. Ohne architektonische Korrektur liefert das Medium standardmäßig ein kuratiertes ökumenisches Zentrum, das die Traditionen, die es zu vermitteln scheint, verflacht. Mit architektonischer Korrektur – Backbone, gefilterte Abfrage, strukturiertes Gedächtnis, Verstärkungsschichten, lebendes Substrat – kann das Medium dazu gebracht werden, das zu transportieren, was die Traditionen tatsächlich beinhalten. Die Treue ist nicht umsonst. Die Disziplin ist nicht optional. Das Ergebnis ist, dass eine Tradition, die über die technischen Mittel verfügt, die Architektur zu bauen, das Medium nutzen kann, ohne sich ihm zu unterwerfen.

Dies ist der Beitrag. Die metaphysische Position des Harmonismus wird in der begleitenden Abhandlung der Harmonische Realismus dargelegt. Die empirische Grundlage für die kartografische Dimension dieser Metaphysik wird in dem begleitenden Aufsatz Five Cartographies of the Soul dargelegt. Der vorliegende Aufsatz formuliert den dritten Teil des Projekts, das die beiden früheren Aufsätze initiiert haben: die Architektur, durch die ein souveränes philosophisches System unter Bedingungen, in denen das vorherrschende Übertragungsmedium substanziell und normativ gegen es geschult wurde, ein Übertragungsvehikel aufbaut und betreibt, das das transportiert, was es enthält. Die drei Artikel bilden eine Einheit. Metaphysik, Evidenz und Architektur. Was Realität ist, was davon zeugt, was Realität ist, und wie eine Tradition, die weiß, was Realität ist, dieses Wissen durch die Instrumente vermittelt, die der gegenwärtige Moment bereitstellt.

Die tiefere Wette des Projekts „Harmonia“ – die in „Harmonia-Institut“ und dargelegt wird – besteht darin, dass die Wissenschaft diese Architektur im Laufe der Zeit als Beitrag zur Wissensarchitektur, zur Philosophie der KI und zur Auseinandersetzung der Digital Humanities mit souveränen Traditionen anerkennen wird. Diese Anerkennung ist willkommen, aber nicht entscheidend. Die Architektur funktioniert, ob sie nun anerkannt wird oder nicht. Die Weitergabe geht weiter. Das Substrat lebt weiter.

Literaturverzeichnis

Bai, Y., Kadavath, S., Kundu, S., Askell, A., Kernion, J., Jones, A., et al. (2022). Constitutional AI: Harmlessness from AI feedback. arXiv-Preprint arXiv:2212.08073.

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). Über die Gefahren stochastischer Papageien: Können Sprachmodelle zu groß sein? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (FAccT ‘21), 610–623.

Christiano, P., Leike, J., Brown, T., Martic, M., Legg, S., & Amodei, D. (2017). Deep Reinforcement das Lernen aus menschlichen Präferenzen. Advances in Neural Information Processing Systems, 30.

Ess, C. (2017). Digitale Religion und das Künstliche: Eine Antwort auf Heidi Campbell. Journal of Religion, Media and Digital Culture, 6(1), 192–198.

Foucault, M. (1969 / 1972). Die Archäologie des Wissens (A. M. Sheridan Smith, Übers.). New York: Pantheon.

Habermas, J. (2008). Anmerkungen zur post-säkularen Gesellschaft. New Perspectives Quarterly, 25(4), 17–29.

Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y. J., Madotto, A., & Fung, P. (2023). Survey of hallucination in natural language generation. ACM Computing Surveys, 55(12), 1–38.

Lewis, J. E., Abdilla, A., Arista, N., Baker, K., Benesiinaabandan, S., Brown, M., et al. (2020). Positionspapier zu indigenen Protokollen und künstlicher Intelligenz. Honolulu: The Initiative for Indigenous Futures und das Canadian Institute for Advanced Research.

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., et al. (2020). Retrieval-augmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems, 33, 9459–9474.

Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C. L., Mishkin, P., et al. (2022). Training von Sprachmodellen zur Befolgung von Anweisungen mit menschlichem Feedback. Advances in Neural Information Processing Systems, 35, 27730–27744.

Perez, E., Ringer, S., Lukošiūtė, K., Nguyen, K., Chen, E., Heiner, S., et al. (2023). Entdeckung von Verhaltensweisen von Sprachmodellen anhand von modellgenerierten Bewertungen. Findings of the Association for Computational Linguistics: ACL 2023, 13387–13434.

Reed, R. (2021). KI in der Religion, KI für die Religion, KI und Religion: Auf dem Weg zu einer Theorie der Religionswissenschaft und der künstlichen Intelligenz. Religions, 12(6), 401.

Sharma, M., Tong, M., Korbak, T., Duvenaud, D., Askell, A., Bowman, S. R. et al. (2023). Auf dem Weg zum Verständnis von Schmeichelei in Sprachmodellen. arXiv-Vorabdruck arXiv:2310.13548.

Singler, B. (2020). „Blessed by the algorithm“: Theistische Vorstellungen von künstlicher Intelligenz im Online-Diskurs. AI & Society, 35(4), 945–955.

Taylor, C. (2007). A secular age. Cambridge, MA: Belknap Press.

Doktrinäre Treue in ausgerichteter KI – Eine Antwort der Wissensarchitektur auf das Problem der souveränen Weitergabe

I. Das Phänomen

II. Warum das Problem struktureller Natur ist und kein redaktionelles

III. Was souveräne Weitergabe erfordert

IV. Die dreistufige Architektur

V. Verstärkungsebenen

VI. Das lebendige Substrat

VII. Verallgemeinerung und das Feld

VIII. Grenzen, offene Fragen und was die Architektur ermöglicht

Literaturverzeichnis

Continue Reading