KI befreit dich nicht: Sie legt dich an die (goldene) Kette

In den Sitzungssälen eines amerikanischen Technologieunternehmens erlebten zweihundert Mitarbeiter acht Monate lang ein Experiment, das niemand geplant hatte. Sie hatten freiwilligen Zugang zu Werkzeugen der generativen künstlichen Intelligenz – jenen digitalen Assistenten, die versprechen, E-Mails in Sekundenschnelle zu schreiben, Berge von Dokumenten zusammenzufassen und repetitive Arbeit zu automatisieren. Das vorherrschende Narrativ suggerierte eine strahlende Zukunft: weniger Stunden am Schreibtisch, mehr Zeit für strategisches Denken, vielleicht sogar ein paar zurückgewonnene freie Nachmittage. Acht Monate später sahen sich Forscher der Harvard Business Review die Daten an und entdeckten etwas völlig anderes. Es hatte keine Befreiung gegeben. Das Arbeitstempo hatte sich beschleunigt, die Aufgaben hatten sich vervielfacht, die Arbeitsstunden hatten sich ausgeweitet. Die KI hatte die Last nicht erleichtert: Sie hatte sie intensiviert.
Acht Monate im Bauch des Algorithmus
Was Aruna Ranganathan und Xingqi Maggie Ye in ihrer Untersuchung in der Harvard Business Review dokumentiert haben, geht über die einfache Feststellung hinaus, dass „Technologie ihre Versprechen nicht hält“. Es ist die Momentaufnahme eines subtileren und allgegenwärtigen Mechanismus, den sie als „Workload Creep“ bezeichnet haben – die schleichende Ausweitung der Arbeitslast. Die zweihundert untersuchten Mitarbeiter waren keine passiven Versuchskaninchen in einem kontrollierten Labor. Es waren Fachkräfte, die sich freiwillig für den Einsatz generativer KI entschieden hatten, getrieben von Neugier oder der Überzeugung, dass sie dadurch effizienter werden könnten. Kein Mandat des Unternehmens von oben, kein Zwang. Doch Woche für Woche kristallisierte sich das Muster mit beunruhigender Konsequenz heraus.
Die KI ermöglichte es ihnen, einzelne Aufgaben schneller zu erledigen – das war unbestreitbar. Die Beantwortung einer komplexen E-Mail, die früher zwanzig Minuten dauerte, nahm nun nur noch acht in Anspruch. Das Zusammenfassen eines fünfzigseitigen Berichts wurde zu einer Sache von wenigen Klicks anstatt einer Stunde konzentrierten Lesens. Doch hier liegt das Paradoxon: Die eingesparte Zeit kehrte nie zu den Arbeitnehmern zurück. Sie löste sich sofort in neuen Anfragen, zusätzlichen Projekten und neu kalibrierten Erwartungen auf. Wie Wasser, das immer den niedrigsten Stand findet, dehnte sich die Arbeit aus, um jede durch Automatisierung frei gewordene Minute zu füllen.
Die Forscher beobachteten drei Dynamiken, die sich gegenseitig verstärkten. Erstens: die Ausweitung der Rolle. Wenn man bei einer bestimmten Art von Aufgabe schneller wird, beginnen Kollegen und Vorgesetzte, einem mehr davon zu delegieren. Der Mitarbeiter, der es schafft, E-Mails doppelt so schnell zu bearbeiten, beendet den Tag nicht früher; er erhält doppelt so viele Anfragen. Zweitens: die Anhebung der Standards. Was früher als akzeptables Ergebnis galt, wird nun zum Mindeststandard. Wenn die KI es ermöglicht, in kürzerer Zeit eine ausgefeiltere Präsentation zu erstellen, wird erwartet, dass alle Präsentationen dieses Niveau erreichen. Die dritte, vielleicht tückischste Dynamik: die Selbstauferlegung. Die Arbeitnehmer selbst bürden sich freiwillig zusätzliche Aufgaben auf, da sie sehen, wie viel sie mit Unterstützung der KI erreichen können, in der Überzeugung, diese bewältigen zu können.
Das Produktivitätsparadoxon
Um zu verstehen, wie verbreitet dieses Phänomen ist, muss man über die einzelne qualitative Studie hinausblicken. Zwischen September 2023 und Oktober 2024 führte Microsoft das wahrscheinlich größte kontrollierte Experiment zur Einführung generativer KI in realen Arbeitskontexten durch: 7.137 Wissensarbeiter in 66 großen Unternehmen, alle ausgestattet mit Microsoft 365 Copilot, dem KI-Assistenten, der in die täglich für E-Mails, Besprechungen und das Schreiben von Dokumenten genutzten Anwendungen integriert ist. Die Zuweisung erfolgte zufällig: Die Hälfte erhielt Zugang zur KI, die andere Hälfte arbeitete weiter wie bisher. Sechs Monate kontinuierliche Beobachtung, mit 4.975 durch präzise Zeitstempel verfolgten Interaktionen.
Die Ergebnisse bestätigten den Effizienzgewinn bei spezifischen Aufgaben. Mitarbeiter mit Zugang zu Copilot reduzierten die in Outlook verbrachte Zeit im Durchschnitt um 1,4 Stunden pro Woche, was etwa 12 % im Vergleich zum vorherigen Zeitraum entspricht. Betrachtet man nur diejenigen, die das Tool tatsächlich kontinuierlich nutzten, stieg die Ersparnis auf 2 Stunden, eine Reduzierung um 17 %. Sie konsolidierten die E-Mail-Arbeit in konzentrierteren Sitzungen und schufen so kontinuierliche Blöcke von 1,5 Stunden ohne Unterbrechungen durch die Post. Auf dem Papier ein klarer Sieg für die Automatisierung.
Doch als die Ökonomen von Microsoft die Gesamtzahl der Arbeitsstunden betrachteten, fanden sie etwas Verblüffendes. Die Gesamtzeit, die außerhalb der Standardarbeitszeit in digitalen Anwendungen verbracht wurde, war nur um 0,25 Stunden pro Woche zurückgegangen – etwa 15 Minuten. Eine Reduzierung um 9 %, sicher, aber verschwindend gering im Vergleich zu den 2 Stunden, die in Outlook eingespart wurden. Wo waren die anderen 1,75 Stunden geblieben? Die wahrscheinlichste Antwort: aufgesogen von Aktivitäten, die das Telemetriesystem nicht erfassen konnte, oder schlimmer noch, umgewandelt in neue Arbeit, deren Übernahme die Mitarbeiter spontan zugestimmt hatten.
Das Muster wird noch deutlicher, wenn man die Aufgaben analysiert, die am meisten von der KI profitieren sollten. Die Besprechungen in Teams nahmen weder an Zahl noch an Dauer ab. Die fertiggestellten Word-Dokumente blieben stabil. Tatsächlich deuteten einige Indikatoren auf eine leichte Zunahme der Arbeitskomplexität hin: mehr Besprechungen mit vielen Teilnehmern, kollaborative Dokumente, die zwei Tage weniger bis zur Fertigstellung benötigten (von 287 auf 239 Stunden), aber ohne eine Reduzierung der Gesamtzahl der produzierten Dokumente. Die gewonnene Effizienz schlug sich nicht in einer Entlastung nieder, sondern in einer Beschleunigung des Ertrags.
Doch wie kommt man von einer Ersparnis von zwei Stunden in Outlook dazu, insgesamt mehr zu arbeiten? Die Antwort liegt in den individuellen Verhaltensmustern. Eine Studie von Forschern aus Harvard und vom MIT mit 244 Beratern der Boston Consulting Group ergab, dass Fachleute angesichts desselben KI-Tools drei radikal unterschiedliche Modi entwickeln. Die „Cyborgs“ verschmelzen ihr eigenes Denken in einem engen iterativen Dialog kontinuierlich mit der Maschine. Die „Zentauren“ behalten die strategische Kontrolle fest in der Hand und nutzen die KI nur für spezifische, eng umrissene Aufgaben. Die „Selbst-Automatisierer“ delegieren sowohl die Definition des Problems als auch dessen Ausführung an die KI, oft mit einem einzigen gigantischen Prompt.
Letztere sind am stärksten vom Workload Creep bedroht. Indem sie einzelne Aufgaben vollständig delegieren, entwickeln sie die Illusion, diese sofort gelöst zu haben, und häufen schließlich mehr davon an. Ein Berater der Studie kopierte eine komplette Fallstudie in ChatGPT, akzeptierte die Empfehlung ohne Überprüfung und übergab das Memo an den CEO. Die Antwort war falsch, aber die „eingesparte“ Zeit war bereits anderswo reinvestiert worden. Es ist das Arbeitsäquivalent zu jenem seltsamen Wirtschaftsgesetz, wonach breitere Straßen den Verkehr nicht verringern, sondern anziehen.
Wer gewinnt, wenn du mehr arbeitest
Der Ökonom Wei Jiang und seine Kollegen an der Columbia Business School haben fast zwei Jahrzehnte Daten zu amerikanischen Arbeitszeiten untersucht und diese mit Maßen für die berufliche Exposition gegenüber KI abgeglichen. Das Bild, das sich ergibt, ist systemisch, nicht anekdotisch. Der Übergang vom 25. zum 75. Perzentil der KI-Exposition entspricht 2,2 zusätzlichen Arbeitsstunden pro Woche. Der Effekt verstärkte sich nach der Veröffentlichung von ChatGPT im November 2022, das als exogener Schock für die Einführung generativer KI fungierte. Die am stärksten exponierten Berufe verzeichneten einen Anstieg von 3,15 Stunden pro Woche im Vergleich zu den am wenigsten exponierten, und diese Ausweitung ging mit einer proportionalen Verringerung der Freizeit einher.
Doch hier stellt sich die zentrale Frage: Wenn die KI die Produktivität wirklich steigert, warum fließen die Vorteile nicht in Form kürzerer Arbeitszeiten oder höherer Löhne an die Arbeitnehmer zurück? Die Antwort liegt in der Verteilung der Produktivitätsgewinne, ein Thema, das Ökonomen als „Rent Capture“ bezeichnen. In wettbewerbsorientierten Arbeitsmärkten, in denen Arbeitnehmer wenig Verhandlungsmacht haben, weil einige wenige große Arbeitgeber dominieren, können sich die Unternehmen den Großteil der Vorteile aneignen. Und in Märkten mit hohem Produktwettbewerb, in denen Produkte austauschbar sind, haben Unternehmen einen Anreiz, Produktivitätsgewinne durch niedrigere Preise oder bessere Dienstleistungen an die Verbraucher weiterzugeben, anstatt sie mit den Mitarbeitern zu teilen.
Jiangs Studie quantifiziert diesen Mechanismus. Der Effekt der KI auf die geleisteten Arbeitsstunden ist in konzentrierten Arbeitsmärkten im Vergleich zu wettbewerbsorientierten Märkten um 30–40 % verstärkt. Und in Sektoren mit hohem Wettbewerb bei den Produkten ist die stündliche Ausweitung noch ausgeprägter. Die Arbeitnehmer werden produktiver, sehen aber keine entsprechenden Verbesserungen in der Work-Life-Balance. Die KI macht sie zu effizienteren Maschinen, aber diese Effizienz wird von anderen Akteuren in der Wertschöpfungskette abgeschöpft.
Hinzu kommt das Thema der algorithmischen Überwachung, die während der Pandemie eine stille, aber allgegenwärtige Ausweitung erfuhr. KI-Werkzeuge zur Verfolgung der Leistung von Remote-Mitarbeitern – jene Systeme, die Tastaturanschläge messen, Aktivitätsmuster analysieren und automatische Produktivitätsbewertungen erstellen – haben die Arbeit von zu Hause aus in Arbeit unter ständiger Überwachung verwandelt. Jiangs Studie zeigt, dass Berufe mit hoher Exposition gegenüber KI-Überwachungstechnologien auch nach der Rückkehr ins Büro eine Verlängerung der Arbeitszeit erfuhren. Der Mechanismus ist das, was Ökonomen „Contracting Efficiency“ nennen: KI macht es Arbeitgebern leichter, die Bemühungen der Mitarbeiter zu überprüfen, was die Leistungserwartungen versteift.
Dies gilt nicht für alle. Selbstständige, die nicht der typischen Prinzipal-Agent-Dynamik abhängiger Arbeit unterliegen, zeigen nicht das gleiche Muster stündlicher Ausweitung, wenn sie KI nutzen. Es gibt keinen Chef, der die Produktivitätsgewinne abschöpft, sodass diese Gewinne tatsächlich in individuelle Entscheidungen darüber übersetzt werden können, wie die Zeit eingeteilt wird. Doch für die Mehrheit der in Organisationen eingebundenen Wissensarbeiter gestaltet die KI den psychologischen Arbeitsvertrag einseitig neu.

Die Fata Morgana der Freizeit
John Maynard Keynes sagte 1930 voraus, dass seine Enkel dank technologischer Produktivitätsgewinne fünfzehn Stunden pro Woche arbeiten würden. Fast ein Jahrhundert später bewegen wir uns in die entgegengesetzte Richtung. Doch das Versprechen der KI als Befreierin menschlicher Zeit war so verführerisch, wurde in Keynotes von Unternehmen und visionären Artikeln so oft wiederholt, dass es eine Lektion überdeckte, die wir aus jeder vorangegangenen Welle der Automatisierung hätten lernen müssen. Technologien, die die Effizienz steigern, reduzieren selten die geleisteten Arbeitsstunden; häufiger verteilen sie diese um oder intensivieren sie.
Die von Jiang gesammelten Daten zur Verringerung der Freizeit sind besonders aufschlussreich. Wenn Arbeitnehmer, die KI ausgesetzt sind, ihre Freizeitstunden reduzieren, leidet der Bildschirm nicht am meisten. Fernsehen und Videospiele bleiben relativ stabil. Geopfert werden Aktivitäten, die eine aktive Teilnahme erfordern: soziale Kontakte, Live-Unterhaltung, Sport. Es ist ein subtiles Signal dafür, wie die Intensivierung der Arbeit nicht nur die Quantität, sondern auch die Qualität der arbeitsfreien Zeit verändert. Die wenige verbleibende Freizeit wird passiven Formen der Erholung gewidmet, die weniger kognitive und emotionale Energie erfordern.
Hinzu kommt die Frage der Arbeitszufriedenheit, die vielleicht den direktesten Indikator dafür darstellt, wie die Arbeitnehmer diesen Wandel tatsächlich erleben. Forscher analysierten Bewertungen auf Glassdoor – jener Plattform, auf der Mitarbeiter ihre Arbeitgeber anonym bewerten – und glichen die Bewertungen mit Maßen für die berufliche Exposition gegenüber KI ab. Das Ergebnis ist eindeutig: Eine höhere KI-Exposition korreliert mit geringerer Arbeitszufriedenheit und einer schlechter wahrgenommenen Work-Life-Balance. Es ist nicht einfach so, dass KI die Menschen produktiver macht; diese Produktivität geht mit persönlichen Kosten einher, die traditionelle Messsysteme nicht erfassen.
Die Microsoft-Studie hatte ein ähnliches Indiz gefunden, als sie Spillover-Effekte auf die engen Kollegen der Mitarbeiter untersuchte, die Copilot erhalten hatten. Es gab keine messbaren negativen Auswirkungen auf die Arbeitsmuster der Nicht-Nutzer, was darauf hindeutet, dass die eingesparte Zeit nicht auf andere abgewälzt wurde. Doch dies wirft eine noch beunruhigendere Frage auf: Wenn du nicht weniger arbeitest und nicht mehr an Kollegen delegierst, wo geht dann die gewonnene Effizienz hin? Die wahrscheinlichste Antwort ist, dass sie von impliziten organisatorischen Erwartungen aufgesogen wird, die ständig nach oben kalibriert werden.
Die unsichtbare Geographie des Burnouts
Betrachtet man die sektorale und geografische Verteilung dieser Effekte, ergeben sich Muster, die das Bild weiter verkomplizieren. Die Microsoft-Studie ergab, dass in Telekommunikations- und Technologieunternehmen 45 % der Mitarbeiter mit Zugang zu Copilot diesen wöchentlich nutzten, während der Anteil im Bau- und Fertigungssektor auf 25 % sank. Doch die bedeutendste Variation lag nicht zwischen den Sektoren, sondern zwischen einzelnen Unternehmen. Zwei Unternehmen im selben Sektor konnten Adoptionsraten aufweisen, die sich um den Faktor 10 unterschieden, mit wöchentlichen Durchschnittswerten von 6,3 % bis 70 %.
Dies deutet darauf hin, dass die Organisationskultur und die Managementpraktiken eine entscheidende Rolle dabei spielen, wie die KI in die Arbeitsabläufe integriert wird. Unternehmen, die spezifische Schulungen zur Nutzung von KI angeboten hatten, verzeichneten anspruchsvollere Nutzungsmuster und eine geringere Häufigkeit vollständiger Delegierung im Stil der Selbst-Automatisierer. Doch 68 % der Mitarbeiter in der Studie hatten keinerlei strukturierte Schulung erhalten, sodass sie auf eigene Faust durch Versuchen und Irrtum in einem völlig neuen kognitiven Territorium navigieren mussten.
Die geografische Dimension fügt eine weitere Ebene der Komplexität hinzu. Die bisher durchgeführten Studien konzentrieren sich fast ausschließlich auf die Vereinigten Staaten und einige große europäische Volkswirtschaften. Wir wissen nicht, ob die Muster des Workload Creep universell sind oder ob bedeutende kulturelle Varianten existieren. In Ländern mit stärkerem Arbeitnehmerschutz, gesetzlichen Arbeitszeitbeschränkungen oder anderen Traditionen an der Grenze zwischen Berufs- und Privatleben könnte sich die KI auf radikal unterschiedliche Weise integrieren. Die Europäische Union diskutiert über das „Recht auf Nichterreichbarkeit“ – Regelungen, die die Fähigkeit von Arbeitgebern einschränken würden, Mitarbeiter außerhalb der Arbeitszeit zu kontaktieren. Wenn die KI es den Arbeitnehmern jedoch ermöglicht, während der Standardarbeitszeit produktiver zu sein, könnte dies paradoxerweise die formale Trennung weniger notwendig machen, während sie die Last während der regulären Arbeitsstunden intensiviert.
Es gibt noch keine Längsschnittstudien, die dieselben Arbeitnehmer über Zeiträume von mehr als einem Jahr begleiten und überwachen, wie sich die KI-Nutzungsmuster und ihre Auswirkungen auf die Arbeitslast im Laufe der Zeit entwickeln. Es ist möglich, dass die beobachtete Intensivierung ein vorübergehendes Phänomen ist, das mit der Lern- und Anpassungsphase zusammenhängt. Oder es könnte der Beginn einer Entwicklung sein, die zu Formen eines strukturellen Burnouts führt, bei dem die Fähigkeit, schneller zu arbeiten, eher zu einem Gefängnis als zu einer Befreiung wird.
Gegenbeispiele und Auswege
Nicht alle Daten deuten in dieselbe düstere Richtung. Eine Studie der London School of Economics unter Arbeitnehmern, die generative KI in ihre Routine integriert haben, ergab durchschnittliche Einsparungen von 7,5 Stunden pro Woche. Der entscheidende methodische Unterschied: Diese Umfrage basierte auf Selbstauskünften, wobei die Arbeitnehmer direkt gefragt wurden, wie viel Zeit sie schätzungsweise eingespart haben. Studien, die auf objektiver Telemetrie basieren, wie die von Microsoft, finden viel bescheidenere Effekte. Es ist möglich, dass Arbeitnehmer eine erhebliche Zeitersparnis wahrnehmen, auch wenn sie objektiv mehr Stunden arbeiten, vielleicht weil bestimmte Aufgaben weniger frustrierend oder kognitiv belastend werden, selbst wenn sie zahlreicher sind.
Es gibt zudem spezifische Unternehmensfälle, in denen die Einführung von KI mit strukturellen Änderungen in der Arbeitsorganisation einherging, die tatsächlich Arbeitszeitverkürzungen ermöglichten. Unternehmen, die Arbeitsabläufe bewusst neu gestaltet, redundante Meetings eliminiert, Kommunikationswege konsolidiert und explizite Erwartungen gesetzt haben, dass die durch KI eingesparte Zeit eher zu kürzeren Arbeitszeiten als zu erhöhtem Output führen sollte. Doch dies scheinen Ausnahmen zu sein, die bewusste Managementinterventionen erfordern und nicht das natürliche Ergebnis der technologischen Einführung sind.
Der entscheidende Punkt ist, dass die KI nicht allein über die Arbeitsergebnisse entscheidet. Wie jede leistungsstarke Technologie kann sie für unterschiedliche Ziele eingesetzt werden. Sie kann dazu dienen, mehr Output aus denselben Arbeitnehmern in denselben Stunden herauszupressen, sie kann es ermöglichen, denselben Output in kürzerer Zeit zu produzieren, oder sie kann anspruchsvolleren Output ermöglichen, der zuvor unerreichbar war. Die Wahl zwischen diesen Wegen ist nicht technisch, sondern politisch im weitesten Sinne des Wortes: Sie hängt davon ab, wer die Macht hat zu entscheiden, wie die Produktivitätsgewinne verteilt werden.
Experten für Personalmanagement beginnen, Frameworks zu entwickeln, um die Auswirkungen der KI-Adoption auf das Wohlbefinden der Mitarbeiter zu überwachen und dabei über traditionelle Produktivitätsmetriken hinauszugehen. Einige Werkzeuge umfassen periodische Umfragen zur wahrgenommenen kognitiven Belastung, Analysen von Kommunikationsmustern zur Identifizierung von Anzeichen einer Überlastung und Mechanismen für kontinuierliches Feedback, die es den Mitarbeitern ermöglichen zu melden, wenn die Erwartung, KI zu nutzen, eher unterdrückend als befähigend wirkt.
Die eigentliche Frage, die diese Studien aufwerfen, ist nicht, ob KI die Produktivität steigert, sondern für wen und zu welchem Preis. Acht Monate in einem amerikanischen Technologieunternehmen haben gezeigt, dass intelligente Automatisierung ohne bewusste Schutzplanken dazu neigt, die Arbeit zu intensivieren, anstatt sie zu erleichtern. Die Daten von Microsoft zu fast siebentausend Arbeitnehmern bestätigen, dass die bei einzelnen Aufgaben gewonnene Effizienz schnell in einer neuen Gesamtlast aufgeht. Makroökonomische Analysen zeigen, dass in Abwesenheit von Verhandlungsmacht die Vorteile von Unternehmen und Verbrauchern abgeschöpft werden, während die Arbeitnehmer lediglich längere Arbeitszeiten sehen.
Wir können immer noch einen anderen Weg wählen, auf dem die KI tatsächlich Zeit zurückgibt, anstatt sie aufzusaugen. Doch diese Wahl erfordert Bewusstsein, Regulierung und vielleicht vor allem eine kollektive Neudefinition dessen, was es bedeutet, im Zeitalter der künstlichen Intelligenz gut zu arbeiten. Andernfalls riskieren wir zu entdecken, dass die goldenen Ketten der Automatisierung immer noch Ketten sind, nur glänzender.