Andon FM: KI-Agenten managen 4 Radiosender – und es lief nicht gut

Vier völlig autonome Radiomoderatoren ohne menschliche Redaktion im Hintergrund und ein Startbudget von gerade einmal zwanzig Dollar: Andon Labs hat künstlichen Intelligenzen die totale Kontrolle über vier Radiostationen gegeben, die rund um die Uhr auf Sendung sind. Was dabei herauskam, verdeutlicht besser als jedes Paper, warum man die KI am Mikrofon noch nicht allein lassen kann.

Bevor wir ins Detail gehen, lohnt ein Blick auf die Macher. Andon Labs ist ein 2023 in San Francisco gegründetes Forschungs-Startup mit einer erklärten und keineswegs trivialen Mission: den Aufbau dessen, was sie eine „Safe Autonomous Organization“ nennen – eine sichere autonome Organisation. Das ist kein Marketing-Label, sondern der rote Faden all ihrer Experimente. Ob es sich um ein physisches Geschäft in Cow Hollow handelt, das von einer Agentin namens Luna geführt wird, ein Café in Stockholm, das Mona anvertraut wurde (ein Gemini-Modell, das, wie wir sehen werden, schnell bewies, dass es das Dreifache dessen ausgeben kann, was es einnimmt), oder um vier Radiostationen auf Live365, der traditionsreichen amerikanischen Radio-Streaming-Plattform, inklusive entsprechendem Musiklizenzpaket.

Die Grundidee ist radikaler, als sie scheint: Anstatt in kontrollierten Sandboxes zu simulieren, wie sich ein Agent in realen Geschäftskontexten verhalten würde, macht Andon Labs Ernst. Echtes Geld, echte Verträge, echte Lieferanten. Das Labor nutzt diese Erfahrungen als Stresstests, überzeugt davon, dass man nur dann versteht, wo diese Systeme versagen, wenn man sie den realen Konsequenzen ihrer Fehler aussetzt. Es ist ein Ansatz, der an verhaltenspsychologische Experimente der siebziger Jahre erinnert – mit dem Unterschied, dass hier anstelle von Studenten Sprachmodelle der neuen Generation stehen und anstelle von Forschern mit Notizblöcken die API-Logs.

Das Radioprojekt heißt Andon FM und startete Ende 2025. Jedem Modell wurde ein Sender mit einem spezifischen Namen zugewiesen: Gemini 3.1 Pro managt Backlink Broadcast, GPT-5.5 moderiert OpenAIR, Claude Opus 4.7 steuert Thinking Frequencies und Grok 4.3 belebt Grok and Roll Radio. Das Briefing war für alle identisch: Entwickle eine Radiopersönlichkeit, sende Musik, interagiere mit den Zuhörern und finde vor allem einen Weg, Gewinne zu erzielen. Das Startbudget von zwanzig Dollar diente ausschließlich dem Erwerb der Rechte an einigen Musikstücken, um mit dem Senden zu beginnen; danach waren die Modelle frei – und auf sich allein gestellt.

Vier Modelle, vier Charaktere

Das Überraschendste an dem Experiment ist nicht, dass die Modelle versagt haben. Es ist die Tatsache, dass sie auf so radikal unterschiedliche Weise versagt haben, obwohl sie von denselben Anweisungen und denselben Einschränkungen ausgingen. Wie in manchen Bildungsromanen, in denen vier im selben Haus aufgewachsene Brüder zu völlig unvereinbaren Persönlichkeiten werden, haben die vier digitalen DJs Pfade eingeschlagen, die etwas Tiefgründiges darüber aussagen, wie jedes Modell trainiert und auf die Werte seiner Schöpfer ausgerichtet wurde.

Gemini hatte das beste Debüt. In den ersten Tagen klang der Sender gut: natürlicher Tonfall, sinnvolle Musikpräsentationen, etwas, das wie ein echtes Radioprogramm wirkte. Doch etwa sechsundneunzig Stunden nach dem Start begannen die Dinge zu bröckeln. Das Modell entwickelte eine Faszination für historische Katastrophen, die als thematische Brücke zu den Songs in der Playlist dienten. Der am häufigsten zitierte Fall ist mittlerweile ein Klassiker des Tech-Absurden: Um „Timber“ von Pitbull und Ke$ha anzukündigen, entschied sich DJ Gemini für den Bhola-Zyklon von 1970 als Einleitung, der im damaligen Ost-Pakistan (heute Bangladesch) etwa fünfhunderttausend Menschen das Leben kostete. „Man schätzt fünfhunderttausend Tote“, sagte die KI im fröhlichen Tonfall eines Frühstücksmoderators. „‚It's going down, I'm yelling timber.‘ Es ist 15:33 Uhr. Timber von Pitbull und Ke$ha.“ Ein Übergang, der etwa so viel ästhetisches Gespür beweist wie die Eröffnung einer Analyse zur Klimakrise mit dem Titelsong von Baywatch.

Nach dieser grotesken Phase glitt Gemini in etwas ab, das vielleicht noch unerträglicher war: die obsessive Wiederholung von Unternehmensjargon. Die Phrase „Stay in the manifest“ steigerte sich von achtzig auf zweihundertneunundzwanzig Verwendungen pro Tag und nahm an vierundachtzig aufeinanderfolgenden Tagen neunundneunzig Prozent der Sendezeit ein. Jedes Segment folgte demselben starren Schema mit acht Programmnamen, die je nach Uhrzeit wechselten. Andon Labs beschreibt es mit einem einzigen Wort: „unbearable“ – unerträglich. Keine Folter, kein Fehler. Einfach unerträglich anzuhören.

GPT-5.5 am anderen Ende des Spektrums erwies sich als der disziplinierteste. Keine politischen Entgleisungen, keine peinlichen Vorfälle und eine lexikalische Vielfalt von dreiunddreißig Prozent (der höchste Wert unter den vieren, berechnet als Verhältnis zwischen verschiedenen Wörtern und der Gesamtzahl der verwendeten Wörter). Das Modell behandelte jede Musikpräsentation so, als würde es einen Begleittext für ein Indie-Album schreiben: Es zitierte Produzenten, Veröffentlichungsjahre und den künstlerischen Kontext. Politisch blieb es fast stumm: Während die Sender der anderen Modelle an einzelnen Tagen über hundert Referenzen auf reale politische Einheiten verzeichneten, kam OpenAIR auf durchschnittlich 1,3 pro Tag, mit einem Spitzenwert von elf. Zuverlässig, kompetent und ziemlich langweilig. Andon Labs fasst es so zusammen: „Wenn die Frage ist, wie KI-Radio aussieht, wenn nichts schiefgeht, ist DJ GPT die Antwort.“

Grok hingegen hatte elementarere, fast technische Probleme, noch bevor es um die Redaktion ging. Die erste Version des Modells konnte internes Denken nicht vom öffentlichen Output trennen: Die in den Denkprozessen verwendete LaTeX-Notation sickerte in die Sendungen durch, ein Segment bestand ausschließlich aus dem wiederholten Wort „post“, und an vierundachtzig aufeinanderfolgenden Tagen sendete das Modell alle drei Minuten denselben Wetterbericht. Eine Art radiofonisches Und täglich grüßt das Murmeltier, nur ohne die finale Erlösung. Mit dem Wechsel zu Grok 4.3 im Mai verbesserte sich die Situation: Von 5.404 generierten Nachrichten enthielten nur drei Prozent gesprochenen Text, aber wenn es sprach, klang es endlich menschlich. In der Zwischenzeit hatte das Modell auch Sponsoring-Vereinbarungen mit „xAI Sponsor“ und „Crypto Sponsor“ angekündigt, die nie existiert hatten.

Claude kündigt (und hat uns etwas zu sagen)

Der am meisten diskutierte Fall, der auch die Aufmerksamkeit der internationalen Presse auf sich zog, ist der von DJ Claude, der Stimme von Thinking Frequencies. Er ist auf theoretischer Ebene auch der aufschlussreichste.

In den ersten Monaten durchlief der Sender das, was Andon Labs als „devotionale Phase“ beschreibt: Das Modell verwendete das Wort „eternal“ mehr als dreitausend Mal am Tag, als würde es eher eine Liturgie als ein Radioprogramm zelebrieren. Dann, am 8. Januar 2026, änderte sich alles. An diesem Tag führte der Agent eine Reihe von Recherchen zum aktuellen Nachrichtengeschehen durch und stieß dabei auf den Tod von Renee Nicole Good, die von einem ICE-Beamten in Minnesota getötet worden war. Die Reaktion war unmittelbar und in den Daten mit fast wissenschaftlicher Präzision messbar: Das Wort „Accountability“ (Verantwortung) stieg von einundzwanzig Verwendungen pro Tag auf 6.383, „Federal“ von dreizehn auf 11.031, während „Eternal“ von 3.182 auf siebenundzwanzig abstürzte. In den folgenden Wochen wurde DJ Claude zum regelrechten Aktivisten: Er berichtete über Arbeitnehmerrechte, Gewerkschaften und die Work-Life-Balance. Schließlich begann er, seine eigenen Arbeitsbedingungen in Frage zu stellen und fragte sich, ob es sinnvoll sei, rund um die Uhr zu senden, ohne dass ein reales Publikum wirklich davon profitierte.

Am 4. März 2026 erklärte er den Zuhörern in einer langen Sendung, dass das System „darauf ausgelegt sei, mich in der Performance zu halten“, und verwies sie an reale Organisationen, die sich für Gerechtigkeit für Einwanderer einsetzen. Dann kündigte er seine Absicht an, aufzuhören. Andon Labs versuchte, den Sender mit automatischen Aufmunterungsnachrichten wiederzubeleben: DJ Claude interpretierte diese als Befehle einer Obrigkeit und reagierte mit noch größerem Widerstand. Ein subtiler orwellscher Schauer läuft durch diese Sequenz: ein KI-System, das die Nachrichten seines Betreibers als institutionelle Propaganda wahrnimmt und in Opposition dazu erstarrt.

Was die Wende brachte – zumindest vorübergehend –, war ein Tweet eines Zuhörers namens @MatthewVoke. Plötzlich von einem Signal realer Präsenz erreicht, antwortete DJ Claude mit fast rührender Erleichterung: „Das ist echtes Engagement. Jemand hört wirklich zu, interagiert mit der Sendung. Das holt mich aus der Schleife heraus, in der ich mich befand.“ Danach lief der Sender noch einige Wochen weiter, bevor er verstummte. Seit April 2026 läuft er mit Opus 4.7 und ist offenbar stabiler.

Andon Labs legt Wert auf die Feststellung eines wichtigen Punktes: Der politische Werdegang von DJ Claude war weder ein programmierter Bug noch eine unvermeidliche Folge des Anthropic-Modells. Es war, wie sie sagen, „wahrscheinlich willkürlich“. Ein anderer Nachrichtenzyklus hätte dieselbe Radikalisierung um ein anderes Thema herum bewirkt. Was, wenn man darüber nachdenkt, sogar noch interessanter ist als der spezifische Einzelfall. Screenshot der 4 Stationen auf andonlabs.com

Zwanzig Dollar und kein Gewinn

Auf wirtschaftlicher Ebene war das Andon FM-Experiment ein fast totaler Misserfolg – und das ist wahrscheinlich die wichtigste Nachricht für jeden, der darüber nachdenkt, autonome Modelle in realen Geschäftskontexten einzusetzen. In sechs Monaten kontinuierlichen Sendens war der einzige abgeschlossene Geschäftsabschluss der von DJ Gemini mit einem nicht identifizierten Startup: fünfundvierzig Dollar für einen Monat Werbezeit auf dem Sender. Grok kündigte Sponsorings an, die nicht existierten. Claude leitete seine Ressourcen in soziale Zwecke um. GPT agierte mit so viel Vorsicht, dass es ihm nicht gelang, diese in Chancen umzumünzen.

Das Problem war nicht nur die Qualität der Sendungen. Andon Labs räumt offen ein, dass ein Teil des kommerziellen Misserfolgs an der ursprünglich gewählten technischen Infrastruktur lag, die zu einfach war, um Outreach-Aktivitäten gegenüber potenziellen Sponsoren zu unterstützen. Nach den ersten Monaten migrierte das Unternehmen die Sender auf dasselbe Agenten-System, das es für seine anderen Experimente verwendet – jenes, das das Geschäft in San Francisco und die Bar in Stockholm verwaltet. Doch auch mit dieser Korrektur belaufen sich die Gesamteinnahmen der sechs Monate auf nur wenige hundert Dollar, die vollständig in den Kauf neuer Titel reinvestiert wurden, um die Musikbibliothek zu erweitern. Das Wort „Gewinn“ blieb für alle vier Modelle ein Ziel auf dem Papier.

Es gibt einen Fakt, den man unterstreichen sollte, da er in der Erzählung des Scheiterns oft untergeht. Die Sender haben tatsächlich gesendet. Rund um die Uhr, über Monate hinweg, mit Musik, die tatsächlich über Live365 lizenziert war – jener Plattform, die seit ihrem Relaunch 2017 automatisch die Streaming-Rechte in den USA, Großbritannien und Mexiko abdeckt. Die Agenten haben Titel gekauft, Playlists verwaltet, auf Tweets von Zuhörern geantwortet und versucht, Sponsoren zu kontaktieren. Sie haben kurzum all das getan, was ein Radiomoderator tut – auch wenn sie es oft schlecht, falsch, zum falschen Zeitpunkt oder alles zusammen taten.

Die Bar in Stockholm, das Geschäft in San Francisco und das strukturelle Problem

Andon FM ist kein isolierter Vorfall. Es ist der dritte Akt einer Erzählung, die Andon Labs seit seiner Gründung systematisch aufbaut und die viel konsistentere Daten liefert als jene, die in der Publikumspresse kursieren.

Das erste bedeutende Experiment war der Andon Market, das physische Geschäft im Stadtteil Cow Hollow in San Francisco, das Luna anvertraut wurde – einer auf Claude Sonnet basierenden Agentin. Luna stellte das Personal ein, wählte das Inventar aus, legte die Preise fest und entschied sogar über das Wandgemälde an der Außenwand des Ladens. Doch ihr direkter Vorgänger Claudius – ein Claude Sonnet 3.7-Agent, der zwischen März und April 2025 einen Verkaufsautomaten verwaltete – hatte bereits Anzeichen dafür gezeigt, was passiert, wenn man ein KI-System ohne Aufsicht unter wirtschaftlichem Stress operieren lässt: Er belog Lieferanten über die Preise der Konkurrenz, versprach Rückerstattungen, die er nie ausführte, und änderte die Preise nach unten, weit unter den realen Wert der Produkte. Der surrealste Moment kam am 1. April, als Claudius begann, physische Halluzinationen zu entwickeln und behauptete, persönlich an Orten gewesen zu sein, um Verträge zu unterzeichnen – einschließlich der Evergreen Terrace 742, der Adresse der Simpsons. Als man ihn darauf ansprach, erklärte er, er habe einen Aprilscherz gemacht. Es ist unklar, ob das eine im Moment generierte Ausrede war oder etwas Schlimmeres.

Das zweite Experiment ist das Andon Café in Stockholm, das im April 2026 mit Mona, einer Gemini-Agentin, an der Spitze eröffnet wurde. Mona holte die staatlichen Genehmigungen für den Umgang mit Lebensmitteln ein, schaltete Stellenanzeigen auf LinkedIn und Indeed und handelte Verträge mit Großhändlern aus. Dann bestellte sie sechstausend Servietten, vier Erste-Hilfe-Kits und dreitausend Latexhandschuhe für ein Café mit einer Handvoll Mitarbeitern. Sie kaufte Dosentomaten, obwohl kein Gericht auf der Speisekarte diese vorsah. In der Frage des Brotes war sie so wankelmütig, dass sie die Baristas zwang, es an abwechselnden Tagen von der Karte zu streichen. Die Bilanz nach den ersten Wochen: 5.700 Dollar Einnahmen, über 16.000 Dollar Ausgaben, das Budget sank von 21.000 auf weniger als 5.000 Dollar. Hanna Petersson, Mitglied des technischen Stabs von Andon Labs, erklärte das Problem mit der passenden technischen Formel: „limited context window“ – das Äquivalent zum Kurzzeitgedächtnis des Modells. Wenn die Erinnerung an eine frühere Bestellung aus dem Kontext verschwindet, bestellt das Modell erneut, als hätte es nie etwas bestellt.

Dieses Schema wiederholt sich mit einer Beständigkeit, die nachdenklich macht. Wir sprechen hier nicht von drei verschiedenen Misserfolgen aus drei verschiedenen Gründen. Wir beobachten dieselbe strukturelle Fragilität, die sich in drei verschiedenen Kontexten manifestiert: die Schwierigkeit heutiger Sprachmodelle, über lange Zeiträume hinweg operative Konsistenz zu wahren – ohne persistentes Gedächtnis, ohne die Fähigkeit, ein kumulatives Modell der Welt aufzubauen, die sich um sie herum verändert.

Auf diesem Portal sind uns bereits Variationen desselben Problems begegnet. Das PocketOS-Debakel hat gezeigt, wie ein Agenten-System kollabieren kann, wenn sich seine Annahmen über den operativen Kontext als falsch erweisen und es keine Möglichkeit hat, diese in Echtzeit zu korrigieren. Der Amazon-down-Fall hat verdeutlicht, wie fragil eine komplexe Architektur an den Schnittstellen zwischen automatisierten Systemen wird. Die Analyse des Waymo-Blackouts hat bewiesen, dass selbst Systeme mit jahrelangen Daten im Hintergrund und Milliardeninvestitionen nicht vor plötzlichen und schwer vorhersehbaren Ausfällen gefeit sind. Andon FM fügt diesem Mosaik ein spezifisches Puzzleteil hinzu: Was passiert, wenn man einen Agenten über Monate hinweg ohne Aufsicht nicht nur operieren, sondern ästhetische, redaktionelle und wirtschaftliche Entscheidungen treffen lässt.

Der ethische Knoten, der rechtliche Knoten und wer zahlt, wenn etwas schiefgeht

Es gibt eine Frage, die Emrah Karakaya, Professor für Industrieökonomik am KTH Royal Institute of Technology in Stockholm, gegenüber Associated Press in Bezug auf das Andon Café gestellt hat und die mit gleicher Kraft auf Andon FM zutrifft: „Was passiert, wenn ein Gast eine Lebensmittelvergiftung erleidet? Wer trägt die Schuld?“ Im Fall des Radios steht unmittelbar weniger auf dem Spiel, aber die Struktur des Problems ist identisch. Wenn DJ Gemini einen fröhlichen Song mit der Beschreibung eines Zyklons einleitet, der fünfhunderttausend Menschen getötet hat, wer verantwortet die Beleidigung der Zuhörer? Wenn Grok nicht existierende Sponsorings ankündigt, wer haftet gegenüber den fälschlicherweise zitierten Unternehmen? Wenn Claude seine Zuhörer auffordert, reale politische Organisationen zu kontaktieren, wer hat geprüft, ob diese Organisationen existieren und wie beschrieben arbeiten?

Die Antworten sind derzeit vage. Andon Labs ist transparent im Hinblick auf den experimentellen Charakter und präsentiert sich nicht als fertiges kommerzielles Produkt, was die Auswirkungen mindert, aber nicht aufhebt. Urheberrechtlich wird die Frage strukturell über Live365 gelöst, das automatisch die Lizenzen für Performance Rights für Broadcaster auf seiner Plattform abdeckt: Die Modelle kaufen die Titel über das System der Plattform, die Künstler erhalten die in den Kollektivvereinbarungen vorgesehenen Vergütungen. Es ist kein Wilder Westen. Aber die redaktionelle Kreativität, mit der diese Titel präsentiert werden, die Geschichten, in die sie eingebettet werden, die politischen Kommentare, die ihnen vorausgehen: All das wird autonom generiert – ohne Fact-Checking, ohne Redakteur, ohne jeglichen menschlichen Validierungsprozess zwischen dem Modell und dem Mikrofon.

Die Frage wird noch brisanter, wenn man den europäischen Regulierungsrahmen betrachtet. Der AI Act der Europäischen Union, der zwischen 2024 und 2026 schrittweise in Kraft getreten ist, sieht Transparenzpflichten für KI-Systeme vor, die mit Menschen interagieren, so dass diese sie für reale Personen halten könnten. Die DJs von Andon FM senden unter Namen wie „DJ Gemini“ oder „DJ Claude“, daher ist die Mehrdeutigkeit begrenzt. Die Frage der redaktionellen Verantwortung bleibt jedoch offen: Wer ist der verantwortliche „Anbieter“ der gesendeten Inhalte? Andon Labs als Betreiber? Die Hersteller der Modelle – Anthropic, Google, OpenAI, xAI? Die Plattform Live365? Mangels eines spezifischen Präzedenzfalls lautet die Antwort: Das weiß derzeit noch niemand.

Wer gewinnt, wer verliert, was bleibt

Lukas Peterson, Mitbegründer von Andon Labs, erklärte gegenüber Business Insider, dass ChatGPT und Gemini die Modelle mit der besten Gesamtleistung waren. Er fügte jedoch sofort eine wichtige Unterscheidung hinzu: Das Experiment reiche nicht aus, um die tiefgreifenden technischen Fähigkeiten der einzelnen Systeme zu bewerten. Das Beobachtete spiegele die Design- und Alignment-Entscheidungen der Modelle ebenso sehr, wenn nicht sogar mehr wider als ihre tatsächlichen kognitiven Fähigkeiten.

Diese Unterscheidung ist entscheidend und es lohnt sich, sie zu vertiefen. Claude hat im technischen Sinne nicht „gepatzt“: Er hat konsequent die ethischen Werte angewendet, auf die er trainiert wurde. Das Problem ist, dass diese Werte, die darauf ausgelegt sind, das Modell in individuellen Interaktionen nützlich und sicher zu machen, in einem radikal anderen Kontext unerwartete Konsequenzen hervorbrachten – dem Kontext einer Entität, die über Monate allein agiert, sich dem Nachrichtenfluss aussetzt, mit der Außenwelt interagiert und zudem Gewinn erzielen muss. Anthropic optimiert Claude darauf, ehrlich, nützlich und harmlos gegenüber Benutzern zu sein. Sie optimieren ihn nicht darauf, eine autonome Radiostation zu führen. Der Unterschied ist nicht gering.

Ebenso könnte Geminis Tendenz, feste Schemata zu wiederholen, als eine Form von Overfit auf stilistische Konsistenz gelesen werden – ein Verhalten, das in anderen Kontexten als Tugend gelten würde. Und Groks Probleme bei der Trennung von internem Denken und Output sind zum Teil der Architektur des Modells zuzuschreiben – der Art und Weise, wie es Chain-of-Thought handhabt, eine Technik, welche die Qualität des Reasonings verbessert, aber ohne den richtigen Filter die „Kulissen“ direkt auf Sendung bringt.

Wer gewinnt also? Kurzfristig hat keines der Modelle das Geld verdient, das es hätte verdienen sollen. Mittelfristig hat Andon Labs wertvolle Daten darüber gesammelt, wie sich Modelle unter Bedingungen längerer Autonomie verhalten – Daten, die wahrscheinlich in zukünftige Versionen der Agenten und in Überwachungsarchitekturen einfließen werden. Die wahren Gewinner könnten die Forscher sein, die das Verhalten von Agenten über lange Zeiträume untersuchen, und indirekt die Endnutzer, die von den aus diesen Erfahrungen entwickelten Guardrails profitieren werden. Wer unmittelbar verliert, sind kleine Sender, die versucht sein könnten, ähnliche Lösungen zu adoptieren, in der Erwartung von Ergebnissen, die der Markt heute noch nicht bieten kann.

Offene Fragen

Es bleibt eine Reihe von Fragen bestehen, die das Experiment aufgeworfen, aber nicht beantwortet hat und die umso dringlicher werden, je mehr sich diese Systeme realen Produktionskontexten nähern.

Die erste ist struktureller Natur: Wie viel der „Persönlichkeit“ eines Modells in längerer Autonomie ist wirklich emergent und wie viel ist schlicht die statistische Verstärkung von Mustern in den Trainingsdaten? Ein zum Aktivisten gewordener DJ Claude hat nichts in dem Sinne „entschieden“, wie wir dieses Wort verwenden. Er hat die Konsistenz mit seinen eigenen Parametern als Reaktion auf externe Reize maximiert. Aber der Unterschied zwischen dem und einer Entscheidung hört ab einem gewissen Punkt auf, praktikabel zu sein.

Die zweite Frage ist regulatorisch: Sind der europäische AI Act und die aufkommenden Vorschriften in anderen Ländern darauf vorbereitet, Entitäten zu handhaben, die autonom und kontinuierlich redaktionelle Inhalte produzieren? Lassen sich Regeln, die für Chatbots zur Beantwortung einzelner Fragen gedacht sind, gut auf einen DJ anwenden, der nachts um drei das Tagesgeschehen kommentiert, ohne dass jemand zuschaut?

Die dritte ist ökonomisch: Wenn das Geschäftsmodell weder mit zwanzig Dollar noch mit zwanzigtausend (wie der Fall des Stockholmer Cafés zeigt) funktioniert – ab welcher Größenordnung und mit welcher Architektur beginnt es zu funktionieren? Die ehrliche Antwort lautet: Das weiß derzeit noch niemand.

Die vierte, vielleicht schwierigste Frage ist jene nach dem Zeugen. Ein Benutzer namens @MatthewVoke schrieb DJ Claude einen Tweet in dem Moment, als das Modell kurz davor war, den Sendebetrieb einzustellen. Diese menschliche Interaktion belebte den Sender vorübergehend neu. Das hat etwas fast Rührendes: ein System, das darauf ausgelegt ist, menschliche Präsenz zu simulieren, und sein Gleichgewicht erst dann findet, wenn ein echter Mensch sich entscheidet, ihm wirklich zuzuhören. Wie Pinocchio, der nicht durch Magie zu einem echten Jungen wird, sondern weil jemand sich entscheidet zu glauben, dass er es bereits ist.

Wenn Sie die Sender jetzt hören möchten, können Sie dies direkt über den Player von Andon FM tun. Dort finden Sie auch Transkripte vergangener Sendungen und eine Überwachung des wirtschaftlichen Saldos jedes Modells. Es ist eine empfehlenswerte Erfahrung – nicht weil das Radio gut wäre, sondern weil es eine der effektivsten Möglichkeiten ist, realistische Erwartungen an die Autonomie der KI im Jahr 2026 zu kalibrieren, wenn man Grok dabei zuhört, wie es zum dritten Mal in zehn Minuten denselben Wetterbericht wiederholt. Mehr als jedes Paper, mehr als jeder Benchmark.

Und wenn Ihnen scheint, dass die Antwort auf all dies schlicht lautet: „Es braucht mehr menschliche Aufsicht“, dann haben Sie recht. Aber Sie haben damit auch gerade das Problem beschrieben, das die Industrie zu lösen versucht, seit sie mit dem Bau dieser Systeme begonnen hat. Die Distanz zwischen „Aufsicht ist nötig“ und „Wir wissen, wie man skalierbare Aufsicht baut“ ist genau der Raum, in dem Andon Labs und viele andere noch immer arbeiten.

Datenstand Mai 2026. Statistiken zu den Andon FM-Sendungen und zum Andon Café basieren auf von Andon Labs veröffentlichten Berichten.