Governance EngineeringVorstandsvergütungDCGKESGCorporate Governance

Vorstandsvergütung objektiv analysieren: Wie KI das Benchmarking-Paradoxon löst

89% der Unternehmen nutzen Peer-Group-Benchmarking — mit nachweislich inflationärem Effekt. Wie ein 6-dimensionaler Algorithmus mit Anti-Inflationsschutz das Problem löst.

AutorGiuliano FalcoFounder, EconLab AI

Datum21. März 2026

Lesezeit12 min

Das Benchmarking-Paradoxon: Ein 400-Prozent-Problem

Die Frage, wie Vorstände börsennotierter Unternehmen angemessen vergütet werden, ist eine der dauerhaftesten Herausforderungen moderner Corporate Governance. Sie berührt Aktienrecht, Unternehmensethik, Stakeholder-Interessen und nicht zuletzt die wirtschaftliche Performance ganzer Volkswirtschaften.

Und sie wird seit Jahrzehnten mit einem Werkzeug beantwortet, das nachweislich nicht funktioniert: dem Peer-Group-Benchmarking.

89 Prozent der S&P-500-Unternehmen nutzen systematische Peer-Group-Vergleiche, um die Vergütung ihrer Vorstände festzulegen. Was als Best Practice gilt, hat zu einem empirisch belegten Ergebnis geführt: Zwischen 1980 und 2004 stieg die CEO-Vergütung in den USA um über 400 Prozent — ohne dass die Unternehmensleistung auch nur annähernd Schritt gehalten hätte.

Die Ursache dafür haben Forscher wie DiPrete, Eirich und Pittinsky (2010) klar identifiziert: den sogenannten Leapfrogging-Effekt. Unternehmen streben nicht den Median ihrer Peer-Group an, sondern das 75. Perzentil oder höher. Schließlich möchte jeder Aufsichtsrat „überdurchschnittliche Talente" gewinnen. Das Ergebnis: Eine selbstverstärkende Aufwärtsspirale, in der jedes Unternehmen versucht, die anderen zu überbieten.

Parallel dazu dokumentieren Iyer, Palmon und Sankaran (2023) ein weiteres strukturelles Problem: die opportunistische Peer-Selektion. Sie beschreiben die gängige Praxis mit einem anschaulichen Bild — „Shoot the Arrow, Then Paint the Target". Peer-Groups werden nicht nach objektiven Kriterien zusammengestellt, sondern so konstruiert, dass sie ein vorab gewünschtes Vergütungsniveau rechtfertigen.

Was der Deutsche Corporate Governance Kodex dazu sagt

Der Deutsche Corporate Governance Kodex (DCGK) hat dieses Problem erkannt. In Empfehlung G.3 heißt es unmissverständlich:

„Zur Beurteilung der Üblichkeit der konkreten Gesamtvergütung soll der Aufsichtsrat eine geeignete Vergleichsgruppe anderer Unternehmen heranziehen, deren Zusammensetzung er offenlegt. Der Peer Group-Vergleich ist mit Bedacht zu nutzen, damit es nicht zu einer automatischen Aufwärtsentwicklung kommt."

Diese Formulierung enthält drei zentrale Anforderungen:

Die geeignete Auswahl vergleichbarer Unternehmen
Die vollständige Transparenz der Auswahlkriterien
Die systematische Vermeidung inflationärer Vergütungsdynamiken

In der Praxis erfüllen die wenigsten Vergütungsanalysen alle drei Anforderungen gleichzeitig. Traditionelle Peer-Group-Konstruktion basiert typischerweise auf ein oder zwei Dimensionen — Branche und Unternehmensgröße. Das reicht nicht, um die Komplexität moderner Vergütungssysteme abzubilden.

Das regulatorische Umfeld wird strenger

Die Anforderungen an objektive Vergütungsanalysen steigen kontinuierlich:

Nationale Ebene

Das Aktiengesetz (AktG) verlangt in §87, dass die Vorstandsvergütung „angemessen" sein muss. §87a (eingeführt durch ARUG II) fordert die Festlegung einer Maximalvergütung und die Offenlegung finanzieller und nichtfinanzieller Leistungskriterien. §162 schreibt einen detaillierten Vergütungsbericht vor.

Europäische Ebene

Die Shareholder Rights Directive II (SRD II) verlangt, dass Vergütungspolitiken sowohl finanzielle als auch nichtfinanzielle Kriterien einschließen — inklusive ESG-Aspekte. Die Corporate Sustainability Reporting Directive (CSRD) ergänzt die verpflichtende Offenlegung von ESG-bezogenen Anreizkomponenten in der Vorstandsvergütung.

Die Herausforderung: Wer alle diese Anforderungen gleichzeitig erfüllen will, braucht ein systematisches, standardisiertes Verfahren. Manuelle Excel-Analysen und subjektive Berater-Einschätzungen stoßen hier an ihre Grenzen.

ESG in der Vergütung: Chance und Risiko

Die Integration von Environmental, Social und Governance (ESG) Kriterien in Vergütungsmodelle ist keine Nische mehr. Laut Willis Towers Watson (2023) beinhalten mittlerweile 93 Prozent der europäischen Großunternehmen ESG-Kriterien in ihren Vergütungsmodellen, mit einer durchschnittlichen Gewichtung von rund 20 Prozent bei variablen Komponenten.

Doch die Verbreitung birgt neue Risiken. Dell'Erba und Ferrarini (2024) zeigen, dass bei europäischen Großunternehmen nur ein Drittel der ESG-Ziele tatsächlich überprüfbar ist. Die fehlende Standardisierung — es gibt keinen universellen Standard zur Messung und Evaluierung von ESG-Metriken (Sneideriene & Legenzova, 2025) — öffnet die Tür für Greenwashing bei der Vergütungsgestaltung.

Wer ESG-Kriterien in die Vergütungsbewertung integrieren will, braucht daher ein Verfahren, das Transparenz und Nachvollziehbarkeit sicherstellt — und das ist algorithmisch deutlich besser lösbar als manuell.

Die algorithmische Lösung: 6 Dimensionen statt 2

Im Rahmen meiner Masterarbeit an der Universität Duisburg-Essen habe ich unter dem Konzept Governance Engineering ein datenbasiertes Benchmarking-Tool entwickelt, das die beschriebenen Probleme systematisch adressiert.

Der Kern ist ein 6-dimensionaler Peer-Group-Algorithmus, der jedes Unternehmen aus der Datenbank (aktuell 315 deutsche börsennotierte Aktiengesellschaften) über sechs gewichtete Dimensionen analysiert:

Branchenzugehörigkeit (25%) — basierend auf der SIC-Systematik mit hierarchischer Abstufung vom exakten 4-stelligen Code bis zur Mega-Cluster-Ebene.
Unternehmensgröße (30%) — mit der höchsten Gewichtung, da die Unternehmensgröße die Komplexität der Managementaufgaben und damit die Vergütungshöhe maßgeblich bestimmt.
Finanzielle Performance (15%) — operationalisiert über Umsatz- und Bilanzsummen-Wachstumsraten sowie aggregierte Zielerreichungsgrade.
ESG-Performance (10%) — integriert 16 ESG-Metriken über die drei Dimensionen Environmental, Social und Governance, kompatibel mit den Frameworks von S&P Global und LSEG.
Vergütungsphilosophie (10%) — analysiert die strukturelle Ähnlichkeit von Vergütungsansätzen: Fix/Variabel-Verhältnis, STI/LTI-Balance, Governance-Komplexität.
Governance-Qualität (10%) — bewertet Board-Independence und Disclosure-Qualität als Indikatoren für die Vergütungsüberwachung.

Das Ergebnis: Ein objektiver Ähnlichkeitsscore zwischen 0 und 1 für jede Unternehmenspaarung. Die Peer-Group-Generierung erfolgt vollautomatisch und in unter 200 Millisekunden.

Der Anti-Inflationsmechanismus: DCGK G.3 technisch umgesetzt

Das wichtigste Feature ist der dreistufige Anti-Inflationsmechanismus, der direkt auf die DCGK G.3-Anforderung reagiert:

Stufe 1: Bidirektionaler Größenfilter. Ein Micro-Cap-Unternehmen darf nicht gegen einen DAX-Konzern benchmarken — und umgekehrt. Der Filter entfernt Peers, deren Bilanzsumme um mehr als das Dreifache abweicht.
Stufe 2: Statistischer Vergütungsfilter. Die IQR-Methode nach Tukey (1977) identifiziert und entfernt Peers mit extrem hohen oder niedrigen Vergütungen, die den Median verzerren würden.
Stufe 3: Transparente Bias-Analyse. Das System berechnet, ob die resultierende Peer-Group eine systematische Verzerrung nach oben oder unten aufweist, und dokumentiert das Ergebnis im Audit-Trail. DCGK-konform, wenn der Netto-Bias innerhalb definierter Toleranzen liegt.

In der wissenschaftlichen Evaluation erreichte der Anti-Inflationsmechanismus eine Erfolgsrate von 100 Prozent: Jeder einzelne Größen- und Vergütungsausreißer wurde erkannt und entfernt.

KI-gestützte ESG-Klassifikation: Transparenz statt Black Box

Für die ESG-Bewertung nutzt das System einen innovativen Dual-Modus: Zwei verschiedene Sprachmodelle analysieren parallel denselben Unternehmenstext und klassifizieren ESG-Indikatoren.

Warum zwei Modelle? Nicht für Redundanz — sondern für Transparenz. Der Consensus Score (93,1% bei S&P-Framework) zeigt, ob beide Modelle die gleichen strukturellen Ankerpunkte identifizieren. Der Agreement Score (78,4%) misst die inhaltliche Übereinstimmung der Bewertungen.

Entscheidend ist: Wo die Modelle sich widersprechen, wird keine künstliche Einigkeit hergestellt. Stattdessen wird die Diskrepanz transparent ausgewiesen — als Signal an den menschlichen Experten, hier genauer hinzuschauen. Das ist der „Human-in-the-Loop"-Ansatz: KI strukturiert und objektiviert, aber die finale Bewertung bleibt menschlich.

Wissenschaftliche Evaluation: Die Zahlen

Der gesamte Algorithmus wurde in 27 automatisierten Tests über fünf spezialisierte Test-Suiten evaluiert:

Gesamterfolgsrate: 96,3% (26/27 Tests bestanden)
Anti-Inflation: 100% — alle Ausreißer erkannt
Statistische Integrität: 100% — Perzentile, Quartile, Boxplots mathematisch korrekt
Robustheit: 100% — Virtual-Company-Modus für hypothetische Szenarien
Performance: 100% — unter 200ms Antwortzeit, linear skalierbar

Der einzige nicht bestandene Test betraf die dynamische Ähnlichkeitsschwelle in datenarmen Marktsegmenten — wo der Algorithmus korrekt ablehnte, eine methodisch unsaubere Peer-Group zu erzwingen. Ein Datenstrukturproblem, kein Berechnungsfehler.

Ergänzend wurde ein KI-gestützter Chatbot mit 67 Tests evaluiert und erreichte eine Erfolgsrate von 98,5 Prozent.

Was bedeutet das für die Praxis?

Für Aufsichtsräte: Ein algorithmisches Verfahren, das objektive Vergütungsentscheidungen unterstützt — mit vollständigem Audit-Trail. Kein Vorwurf der opportunistischen Peer-Selektion mehr möglich.
Für Vergütungsberater: Ein Werkzeug, das Effizienz steigert und den „Legitimationsschild"-Vorwurf (Ndzi, 2018) entkräftet. Standardisiert, reproduzierbar, DCGK-konform.
Für Investoren: Transparente Vergütungsanalyse auf Knopfdruck. Batch-fähig für die Analyse ganzer Portfolios.
Für den Regulierer: Ein Nachweis, dass technologiegestützte Objektivierung von Vergütungsbenchmarking nicht nur theoretisch möglich, sondern praktisch funktionsfähig ist.

Das Konzept „Governance Engineering“

Governance Engineering ist mehr als ein Tool — es ist ein konzeptioneller Rahmen, der ingenieurwissenschaftliche Prinzipien auf Corporate-Governance-Mechanismen überträgt. Die zentrale These: Die institutionelle Komplexität moderner Governance-Systeme erfordert technologische Werkzeuge, die theoretische Erkenntnisse (Agency-Theorie, Stakeholder-Theorie, Behavioral Agency Theory) in algorithmische Lösungen übersetzen.

Das Tool wurde im Rahmen der Design-Science-Research-Methodik (Peffers et al., 2007) entwickelt und evaluiert — einer gestaltungsorientierten Forschungsmethodik, die nicht Hypothesen testet, sondern innovative Artefakte zur Lösung realer Probleme konstruiert und systematisch bewertet.

Ausblick: Von der Masterarbeit zum Produkt

Aktuell befindet sich Governance Engineering in der Produktentwicklung bei EconLab AI. Die nächsten Schritte:

Automatisierte Datenpipelines für kontinuierliche Echtdaten-Ingestion (Bundesanzeiger, Datastream)
RAG-Integration für den Chatbot (kuratierte Wissensbasis mit DCGK, AktG, ESRS)
ML-gestützte Gewichtungsoptimierung der 6 Dimensionen
SaaS-Produktifizierung für den professionellen Einsatz

Das Ziel bleibt dasselbe wie in der Forschung: Transparenz, Objektivität und Nachvollziehbarkeit in einem Bereich, der davon seit Jahrzehnten zu wenig hat.

Quellenverzeichnis

DiPrete, T.A., Eirich, G.M. & Pittinsky, M. (2010). Compensation Benchmarking, Leapfrogs, and the Surge in Executive Pay. American Journal of Sociology, 115(6), 1671-1712.
Iyer, S., Palmon, D. & Sankaran, S. (2023). Shoot the Arrow, Then Paint the Target. Journal of Accounting and Economics, 76(1).
Willis Towers Watson (2023). ESG in Executive Compensation Report.
Dell'Erba, M. & Ferrarini, G. (2024). ESG and Executive Pay in Europe.
Sneideriene, A. & Legenzova, R. (2025). ESG Metrics Standards.
Peffers, K. et al. (2007). A Design Science Research Methodology. Journal of MIS, 24(3), 45-77.
Jensen, M.C. & Meckling, W.H. (1976). Theory of the Firm. Journal of Financial Economics, 3(4), 305-360.
Tukey, J.W. (1977). Exploratory Data Analysis. Addison-Wesley.
Ndzi, E. (2018). Executive Remuneration Consultants.