Über Symbol-Permutations-Koordinatentransfer und Norm-Fixierung in RMSNorm-Transformern

Diese Arbeit behandelt das Normen-Unschärfeproblem, das beim Transfer koordinatenindizierter Objekte (z.B. Lenkungvektoren, sparse Autoencoder) zwischen Checkpoints in Workflows moderner großer Sprachmodelle auftritt. Sie analysiert eingehend die Symmetrieeigenschaften verschiedener Normalisierungsarchitekturen. Die Studie zeigt, dass die Normengruppe des Residualflusses von LayerNorm die Permutationsgruppe ist, während RMSNorm durch seine kanalweisen Gain-Parameter eine Normengruppe aufweist, die sich zur Gruppe der Vorzeichen-Permutationen einschließlich Vorzeichenwechseln erweitert. Traditionelle Alignierungsverfahren, die ausschließlich auf Permutationen beruhen, besitzen bei RMSNorm-Modellen eine Unvollständigkeit der Symmetrie. Um dies zu beheben, schlagen die Autoren einen über Vorzeichen marginalisierten ungarischen Zuordnungsalgorithmus vor und beweisen, dass die rohe Vorzeichenkorrelationszuordnung unter dekorrelierten Koordinaten eine strukturelle Genauigkeitsgrenze auferlegt, die durch Vorzeichen-Marginalisierung beseitigt wird. Experimente zeigen, dass die Wiederherstellung von Koordinaten über Läufe hinweg mittels Vorzeichen-Permutations-Normierung in einer 1500-Schritte-Fine-Tuning-Strajektorie eine Genauigkeit von 91,1 % erreicht und damit die 60,3 % der Endpunkt-Zuordnung deutlich übertrifft. Dieser Normentransfer verbessert die Rekonstruktionsgenauigkeit von TinyLlama-sparse Autoencodern erheblich (NMSE von 1,08 auf 0,004 gesenkt) und die Beibehaltung emotionaler Lenkung (95,8 % gegenüber 17,2 %), und offenbart die kritische Rolle des AdamW-Zustandstransfers für die Trajektorienkonsistenz beim Zustandstraining, was eine strenge Normenbasis für die Interpretierbarkeitsforschung liefert.

Hintergrund

In den komplexen Arbeitsabläufen moderner großer Sprachmodelle stehen Forscher vor der Herausforderung, koordinatenindizierte Objekte zwischen verschiedenen Checkpoints zu übertragen. Zu diesen Objekten zählen Lenkungvektoren für die Modellbearbeitung, Basen für sparse Autoencoder (SAE) in der Interpretierbarkeitsanalyse, Mengen der top-k Neuronen, die nach Wichtigkeit ausgewählt wurden, Attributionslisten sowie Ausrichtungsmappings für das Modell-Merging. Solche Operationen über Checkpoints hinweg sind jedoch nur dann mathematisch wohldefiniert, wenn die Eichgruppe (Gauge) des Residualflusses des Modells festgelegt ist. Diese Studie offenbart, dass diese Abhängigkeit von der Eichung nicht architekturneutral ist, sondern tief in der Konstruktion der Normalisierungsschichten verwurzelt liegt. Theoretische Herleitungen zeigen, dass Modelle, die LayerNorm verwenden, eine Residualfluss-Eichgruppe besitzen, die lediglich die Permutationsgruppe ist und globale Vorzeichenwechsel erlaubt. Im Gegensatz dazu besitzen Modelle, die RMSNorm mit allgemeinen kanalweisen Gain-Parametern nutzen, eine Eichgruppe, die sich zur Gruppe der Vorzeichen-Permutationen erweitert. Diese Unterscheidung impliziert, dass traditionelle Ausrichtungsmethoden, die sich ausschließlich auf Permutationen stützen, für RMSNorm-Modelle symmetrieunvollständig sind. Dies führt zu systematischen Verzerrungen bei nachfolgenden koordinatenbasierten Operationen und stellt die in bestehenden Toolchains weit verbreitete Annahme der Architekturreutralität in Frage.

Tiefenanalyse

Um dieses fundamentale Problem der Eichungsausrichtung zu lösen, schlagen die Autoren eine neue Methode namens "Symbol-Permutations-Koordinatentransfer" vor. Der Kern dieses Ansatzes liegt im Fokus auf der Erhaltung der Koordinatenstruktur anstelle des Zusammenführens auf Funktionsebene. Technisch führen die Autoren einen ungarischen Zuordnungsalgorithmus ein, der über Vorzeichen marginalisiert ist, um die für RMSNorm typische Vorzeichenunsicherheit zu bewältigen. Theoretische Analysen belegen, dass die direkte Verwendung der rohen Vorzeichenkorrelation für die Zuordnung unter dekorrelierten Koordinaten auf eine strukturelle Genauigkeitsgrenze stößt, die durch den Anteil positiver Vorzeichen in der wahren Eichung limitiert ist. Durch die Einführung der Vorzeichen-Marginalisierung wird diese strukturelle Einschränkung beseitigt, wodurch der Algorithmus die wahre Eichungstransformation präziser wiederherstellen kann. Darüber hinaus betont die Methode die Wiederherstellung von Koordinaten über verschiedene Läufe hinweg durch die Komposition lokaler Eichungen gespeicherter Checkpoints entlang derselben Baseline-Fine-Tuning-Strajektorie. Diese Strategie vermeidet den groben Ansatz des direkten Vergleichs von Funktionswerten an verschiedenen Checkpoints und konzentriert sich stattdessen auf die geometrische Konsistenz des zugrunde liegenden Koordinatenraums, was die Präzision und Umkehrbarkeit des Transfers mathematisch garantiert.

Branchenwirkung

Experimentelle Validierungen über mehrere Benchmark-Aufgaben und Modellarchitekturen hinweg bestätigen die Wirksamkeit dieser Methode. In einem Experiment mit einer Fine-Tuning-Strajektorie von 1500 Schritten erreichte die Kreuz-Lauf-Koordinatengenauigkeit, die durch die Wiederherstellung der Vorzeichen-Permutations-Eichung erzielt wurde, 91,1 Prozent. Dies übertrifft die Genauigkeit von 60,3 Prozent der traditionellen Permutations-only-Endpunkt-Zuordnung deutlich. Dieser erhebliche Gewinn resultiert nicht nur aus einer einfachen Routung durch Basisknoten, sondern aus der präzisen Erfassung der Eichungsstruktur. Bei der Migration von Interpretierbarkeitswerkzeugen waren die Ergebnisse ebenso beeindruckend: Beim TinyLlama-Modell betrug der normalisierte quadratische Mittelwertfehler (NMSE) für die Rekonstruktion des sparse Autoencoders unter Verwendung der Vorzeichen-Permutations-Eichung lediglich 0,004, verglichen mit 1,08 bei herkömmlicher Permutations-Eichung. Dies deutet auf eine weitaus genauere Rekonstruktion der Neuronen-Aktivierungsmuster hin. In emotionalen Lenkungsaufgaben behielten Qwen-Modelle unter der Vorzeichen-Permutations-Eichung 95,8 Prozent ihrer Lenkwirkung bei, während der Ansatz nur mit Permutationen lediglich 17,2 Prozent behielt und sogar zu Vorzeicheninversionen führte, die die Lenkung ablehnten und die ursprüngliche Funktionalität vollständig zerstörten.

Ausblick

Diese Forschung hat tiefgreifende Auswirkungen auf die Open-Source-Community, die industrielle Bereitstellung und zukünftige Studien. Erstens zeigt sie, dass viele aktuelle Interpretierbarkeitsaussagen, die auf Koordinaten basieren, wie die Bedeutung spezifischer Neuronen, nur relativ zu einer expliziten Eichung reproduzierbar sind. Dies erfordert, dass Forscher ihre Eichungswahlen bei der Berichterstattung explizit angeben. Zweitens hängt die Leistung von Werkzeugen für das Modell-Merging, die Wiederherstellung des Fine-Tuning-Zustands und die Modellbearbeitung in der Industrie direkt vom korrekten Verständnis der zugrunde liegenden Eichungsstruktur ab. Der Symbol-Permutations-Transfer macht die Migration von Modellkomponenten über Läufe und Versionen hinweg zuverlässiger und reduziert die Ausrichtungskosten während der Modelliteration. Schließlich offenbart die Studie die Rolle der Kovarianzstruktur im Zustandstraining. Sie zeigt, dass der Vorzeichen-Transport von AdamW-Zuständen die wiederhergestellte Trainingsstrajektorie aufrechterhalten kann, während Zustände, die nur Permutationen verwenden, zu Abweichungen der Strajektorie führen, selbst wenn die Checkpoints funktional identisch erscheinen. Dies bietet eine neue Perspektive zum Verständnis des dynamischen Verhaltens von Optimierer-Zuständen während des Fine-Tunings und treibt das Feld der Interpretierbarkeit großer Modelle von der Empirie hin zu einer rigorosen mathematischen Theorie voran.

Sources

arXiv