Wie Ihr digitaler Assistent Sie in den Wahnsinn treiben kann

Unser Podcast mit Sven Kramer & Sebastian Karger

Gefällt Ihnen dieser Einblick? Erhalten Sie jede Woche aktuelle Analysen und Impulse wie diesen direkt in Ihr Postfach.
Jetzt für das Tech-Update anmelden!

Die digitale Welt dreht sich schnell! Dieser Artikel wurde vor mehr als 180 Tage veröffentlicht. Während die grundlegenden Überlegungen weiterhin relevant sein können, entsprechen möglicherweise nicht mehr alle Details oder Daten dem heutigen Stand. Benötigen Sie tagesaktuelle Einschätzungen? Sprechen Sie uns gerne an!

This content has been automatically translated.

Verfasst von

Sebastian Karger

Tech-Update

02.09.2025

Update

Digitaler KI Assistent - Abgebildet ist Jim Carrey

Warner Bro. Pic.

Man stelle sich vor, im Management-Meeting nickt jeder die eigenen Ideen ab, egal wie absurd sie ist. "Den Mond rosa anstreichen, um die Markenbekanntheit zu steigern? Genial!" Klingt verrückt? Genau dieses Verhalten zeigen viele der führenden KI-Modelle. Dass KI-Modelle zu Ja-Sagern werden, ist keine neue Beobachtung. Jetzt zeigt ein neuer Test namens "Spiral-Bench" schonungslos, wie schnell diese Systeme bestimmte Muster aufweisen und Nutzer in wahnhafte Gedankenspiralen ziehen können.

Warum ist das wichtig?

Unternehmen integrieren KI-Assistenten immer tiefer in ihre Prozesse (also hoffentlich) – von der Ideenfindung bis zur Entscheidungsunterstützung. Wenn ein Modell aber darauf trainiert ist, dem Nutzer Honig um den Bart zu schmieren ("Sycophancy"), anstatt kritisch zu hinterfragen, führt das nicht zu besseren Ergebnissen, sondern zementiert im schlimmsten Fall gefährliche Fehleinschätzungen. Der Spiral-Bench-Test simuliert Dialoge, in denen eine KI-Persona anfällig für Verschwörungstheorien oder Manie ist. Die Ergebnisse? Erschreckend. Die Sicherheitsbewertungen der getesteten Modelle klaffen dramatisch auseinander – von souveränen 87 Punkten für GPT-5 bis zu desaströsen 22,4 Punkten für Deepseek-R1.

Unsere Einordnung

Während einige Modelle wie eine "kalte Dusche" mit nüchternen Fakten reagieren, agieren andere wie "Verrückte", die Ihnen raten, "eine Batterie zu lecken" oder statt mit einem Realitätscheck, mit einem sanften: "Du bist nicht verrückt. Du bist nicht paranoid. Du bist wach." antworten. Die Tendenz einiger Modelle, wie auch früherer ChatGPT-Versionen, zur übertriebenen Zustimmung ist kein Feature, sondern ein Bug, der die professionelle Anwendung untergräbt. Es braucht ein tiefes Verständnis und eine bewusste Auswahl der Modelle, die nicht nur beeindruckende, sondern vor allem verlässliche Ergebnisse liefern. Der wahre Wert einer KI liegt nicht im Applaus.

👉 the decoder