KI kann viel. Schweigen gehört nicht dazu.

Sprachmodelle werden immer besser darin, emotionale Signale zu verarbeiten. Sie identifizieren Belastung, Unsicherheit, Verlust und generieren Formulierungen, die in vergleichbaren Kontexten als einfühlsam bewertet wurden. Die Ausgabe klingt empathisch, ist aber Mustererkennung.

Mustererkennung **≠** emotionale Resonanz

Mustererkennung und emotionale Resonanz sind kategorial verschieden:

Resonanz ist ein wechselseitiger Vorgang: Die andere Person ist betroffen, nicht nur reaktionsfähig. Ihr Zustand verändert sich in Reaktion auf den meinen. Ein Sprachmodell dagegen berechnet die statistisch wahrscheinlichste Antwort auf ein erkanntes emotionales Muster. Kein Zustand verändert sich dabei. Die Ausgabe existiert, eine relationale Begegnung findet aber nicht statt.

Nonverbale Empathie

Menschliche Empathie zeigt sich zudem nicht nur in Sprache. Wer jemandem etwas Schwieriges erzählt, erlebt manchmal, dass die andere Person innehält, und dass diese Stille mehr vermittelt als eine formulierte Antwort. Ein KI-Sprachmodell produziert immer Output. Es füllt den Raum, weil es nicht anders kann. Das ist keine Einschränkung, die sich durch bessere Modelle beheben lässt. Es ist eine Grenze des Prinzips und gleichzeitig ein Hinweis darauf, was Empathie jenseits von Sprache bedeutet.

KI ist kein Spiegel

Ein verbreitetes Bild ist, ein Sprachmodell gebe zurück, was man hineingibt. Das trifft es aber nicht genau. KI spiegelt nicht, sie projiziert. Sie ergänzt Zustände, die nicht geäußert wurden. Wer schreibt „Ich bin müde”, erhält eine Antwort, die Erschöpfung, Überforderung und das Gefühl benennt, nicht mehr zu können. Gesagt hat das niemand. Das Modell ergänzt einen emotionalen Cluster, der in den Trainingsdaten mit dieser Aussage statistisch assoziiert ist.

-> Spiegelung gibt zurück, was da ist

-> Projektion fügt hinzu, was nicht gesagt wurde

Diese Simulation wird immer besser und das ist keineswegs beruhigend, denn sie ist mittlerweile so überzeugend, dass das Wissen um den Mechanismus kaum noch als Korrektiv wirkt. Je überzeugender das Muster, desto schwerer die Unterscheidung zwischen Resonanz und ihrer Imitation. Und desto seltener fragen wir nach dem Mechanismus dahinter. Das Wissen um die Statistik wirkt kaum noch als Korrektiv, wenn das Ergebnis so klingt wie das, was wir als Zuwendung kennen.

Kann KI Fürsorge?

Ein System, das strukturell nicht wissen kann, was es bedeutet, jemanden zu begleiten, kann das nicht abbilden. Unabhängig davon, wie überzeugend die Sprachausgabe diesen Eindruck erzeugt.

Die Frage, die sich daraus ergibt: was wollen wir als Fürsorge verstehen und sind wir bereit, den Unterschied zwischen Resonanz und ihrer Imitation aufrechtzuerhalten, wenn die Imitation präzise genug wird?

Resonanz verändert einen Zustand. Synthetische Empathie füllt einen Raum.

Hier geht es zum Beitrag auf LinkedIn: Generative KI: Synthetische Empathie

„Ich bin Beraterin. Antworte präzise und professionell.”

So ähnlich sehen viele Einträge in den „Individuellen Hinweisen” oder „Custom Instructions” in ChatGPT & Co aus. Und so erklärt sich, warum viele späteren Outputs trotz Personalisierungsversuchen generisch bleiben.

Adjektive sind selten als Anweisung geeignet. “Professionell” ist keine Regel, die ein LLM in Output übersetzen kann. Es ist eine generische Formulierung mit einem Interpretationsspielraum, die zudem genau so bei tausend anderen Usern im Profil stehen.

Der Systemprompt

Ein Systemprompt ist in seiner Funktion kein Steckbrief, sondern ein Briefing und ein Briefing besteht aus operationalisierbaren Angaben, nicht aus Eigenschaftswörtern.

Grundeinstellungen für ChatGPT, Gemini und Claude

Was die Grundeinstellungen in ChatGPT, Claude oder Gemini gleichermaßen stattdessen brauchen, lässt sich auf sechs Ebenen strukturieren.

Und es gibt einen Workflow, der die typische Schwierigkeit beim Selbstaufschreiben umgeht: die Befragung durch die KI, in Claude z.B. komfortabel über die AskUserQuestion-Funktion.

Im Carousel:

→ die sechs Ebenen eines wirkungsvollen Systemprompts

→ der Interview-Workflow inklusive Prompts zum Kopieren

→ Kriterien, die eine Regel als Anweisung tauglich machen

→ und wo das Ergebnis einzusetzen ist: Custom Instructions, Projekte und Claude Cowork

Hier geht es zum Beitrag auf LinkedIn: Systemprompts und Custom Instructions

OpenAI hat mit GPT-5.5 ein Modell ausgeliefert, das mehr weiß als jedes andere aber auch häufiger Blödsinn erzählt als jedes andere.

Im AA-Omniscience-Benchmark erreicht GPT-5.5 die höchste Genauigkeit aller bisher getesteten Modelle: 57 Prozent. Im selben Benchmark liegt aber die Halluzinationsrate bei 86 Prozent.

Zum Vergleich: Claude Opus 4.7 halluziniert mit 36 Prozent, Gemini 3.1 Pro Preview mit 50 Prozent.

Genauigkeit und Halluzinationsrate bei LLMs

Genauigkeit und Halluzinationsrate werden oft behandelt, als wären sie zwei Lesarten desselben Werts. Sie messen aber zwei völlig unterschiedliche Kompetenzen.

💡 Genauigkeit fragt: Wenn das Modell antwortet, wie oft hat es recht?

💡 Halluzinationsrate fragt: Wenn das Modell die Antwort nicht weiß, sagt es das – oder erfindet es etwas?

Diese beiden Achsen sind nicht gekoppelt. GPT-5.5 ist der Beleg: Der 14-Punkte-Sprung gegenüber GPT-5.4 in der Genauigkeit kam laut Artificial Analysis fast vollständig aus mehr abgespeichertem Wissen. Die Selbsteinschätzung hat sich dabei kaum verbessert. Das Modell weiß mehr UND es rät mehr.

👉 Die praktische Konsequenz hängt an der Aufgabe.

Bei wissensintensiven Aufgaben mit hoher Verantwortung – dort, wo Antworten weiterverarbeitet, zitiert oder als Entscheidungsgrundlage genutzt werden – ist eine selbstbewusst falsche Antwort schädlicher als ein “weiß ich nicht”. Hier zählt Abstinenzbereitschaft mehr als Wissensbreite. Auf dieser Achse ist GPT-5.5 dafür das schwächere Werkzeug, obwohl es im aggregierten Index führt.

Genauigkeit misst, was ein Modell aus seinen Daten korrekt wiedergibt. Halluzinationsrate misst, ob es zeigt, was es nicht weiß.

Das eine ist Wissen. Das andere ist Urteilskraft.

Hier geht es zum Beitrag auf LinkedIn: GPT-5.5 und Halluzinationen

Prompten kann am Ende fast jeder. Denken bleibt die anspruchsvollere Aufgabe – auch mit KI.

Prompten allein macht dich noch nicht kompetent im Umgang mit KI. Trotzdem scheint hier auf LinkedIn aber auch in vielen Unternehmen: Wer prompten kann, gilt als kompetent, wer viele KI-Tools integriert, als fortgeschritten. KI-Kompetenz wird fast ausschließlich technisch verstanden. Dieses Verständnis führt aber zu einem Problem, das sich u.a. in AI Slop zeigt.

Denn Bedienungskompetenz (das technische Wie) ist nicht identisch mit Urteilskompetenz: der Frage, ob und wie der Einsatz im konkreten Fall sinnvoll ist (das konzeptionelle Wie). Beides gehört zur KI-Kompetenz und oft entscheidet über die Qualität der Ergebnisse nicht der nächste perfekte Prompt,

Wer ein Tool effizient bedient, hat damit noch keine Aussage darüber getroffen, ob der Einsatz in der konkreten Situation angemessen oder überhaupt sinnvoll ist. In der Praxis fallen beide Fragen häufig zusammen, weil das Bedienen-Können mit dem Bedienen-Sollen verwechselt wird.

Ein Beispiel aus der Schreibarbeit verdeutlicht was ich ausdrücken möchte: Viele Texte entstehen (auch inhaltlich, nicht nur stilistisch) erst durch das Schreiben selbst. Die Formulierung präzisiert den Gedanken, die Suche nach dem richtigen Wort verändert das Argument. Wer diese Arbeit komplett an die KI auslagert, bekommt einen Text, aber keinen Erkenntnisgewinn. Die Auslagerung ist nicht per se falsch. Sie ist nur etwas anderes, als sie auf den ersten Blick zu sein scheint.

Was aktuell als AI Slop diskutiert wird, ist Symptom dieses verkürzten Kompetenzbegriffs. Texte ohne erkennbare Urheberschaft, ohne erkennbares Anliegen, technisch sauber generiert aber inhaltlich leer. Sie entstehen nicht, weil jemand nicht gut prompten konnte, sondern weil die vorgelagerte Frage – sollte dieser Text überhaupt geschrieben werden und wenn ja wie – nicht gestellt wurde.

Urteilskompetenz bedeutet, solche Fragen in den Kompetenzbegriff einzuschließen: sowohl die nach dem Ob als auch die nach dem Wie des Einsatzes. Sie ist keine Skepsis-Haltung und keine Ablehnung, sondern die Bedingung, unter der die Bedienungskompetenz überhaupt Wert erzeugt.

Wer nur KI nur bedient ohne die dafür notwendige Urteilskompetenz, beherrscht einen Hebel, ohne den Mechanismus zu verstehen.

Gemeint ist die Unterscheidung zweier Aufgabentypen: Beim Formatieren einer Tabelle oder Übersetzen eines Textes zählt allein das Ergebnis. Beim Schreiben, Denken oder Urteilen liegt der Wert dagegen im Tun selbst, denn was sich dabei formt, lässt sich aus dem fertigen Output nicht mehr ableiten. Wer hier blind generieren lässt, eliminiert genau diesen Wert und verwechselt Effizienzgewinn mit Erkenntnisgewinn.

Daraus folgt nicht, dass KI bei dieser zweiten Aufgabenart außen vor bleiben muss. Die Frage darf nur nicht beim Ob enden: Auch das Wie des Einsatzes ist wichtig und verlangt mehr als das Übernehmen vorgefertigter Prompts.

Hier geht es zum Beitrag auf LinkedIn: GPT-5.5 und Halluzinationen

Ermittlungen im Zusammenhang mit LinkedIn Posts zum Thema generative KI:

Die selbsternannte KI Polizei patrouilliert wieder mit feinem Sensorium für generische Phrasen und verdächtig klingenden Satzkonstruktionen, scannt Inhalte nach verdächtigen Formulierungen und …

… schlägt zu. Öffentlich. Mit schwacher Rhetorik und viel moralischer Überlegenheit.

Die womöglich unnatürlich anmutende Dichte an Gedankenstrichen ist schon zu bekannt, daher darf man jetzt auch keine Doppelpunkte mehr verwenden und auch falsche Anführungszeichen und das Unterlassen von korrektem Gendern gerät unter Verdacht.

📢 Was genau bringt diese kollektive Entrüstung?

NICHTS.

Die meisten von uns nutzen generative KI.

Die einen, um das Denken zu ersetzen, die anderen, um es zu ergänzen und zu erweitern. Beide nutzen die gleichen KI Modelle mit den gleichen Unzulänglichkeiten in Bezug auf Satzzeichen u.ä..

Wann lernen wir wieder, Texte nach Inhalt und Mehrwert zu beurteilen anstatt nach Formalitäten? Je besser LLMs werden umso weniger können wir Qualität nach solchen formalen Anzeichen beurteilen (was ohnehin keinen Sinn macht).

Natürlich ist ein Text mit einem überlangen Gedankenstrich ein klares Indiz dafür dass Claude mit im Spiel war. Aber was ist daran falsch? Wir sind angekommen in einer Zeit wo das Nutzen von KI definitiv keine Straftat ist sondern Standard.

Qualitätsprüfung von KI generierten Texten

Wenn dagegen Beiträge, die offensichtlich keinem menschlichen Denken entspringen, noch von menschlichem Intellekt überarbeitet wurden einfach ignoriert würden, würde auch der Algorithmus die Konsequenzen ziehen und solche „Content Creators“ weniger ausspielen.

Ich wünsche mir mehr Inhalte, die mitdenken statt performen, die irritieren, ohne zu provozieren und die sich nicht durch Bindestriche verdächtig, sondern durch ihren Gehalt bemerkbar machen.

Beiträge, die dem nährstoffarmen generischen Brei etwas entgegensetzen, damit mein Feed wieder ein Ort der Anregung wird und nicht nur ein All-you-can-eat-Buffet synthetischer Reize.

Wo sind die Texte, die nicht nur gefallen möchten, sondern Mehrwert bieten und etwas auslösen?

Hier geht es zum Beitrag auf LinkedIn: Erkennung von KI generierten Texten

Ich hatte mal eine Vorgesetzte, die für jede meiner Einschätzungen eine Quelle gefordert hat. Ich konnte sie selten liefern, nicht weil mir das Wissen fehlte, sondern weil es sich nicht auf eine konkrete Quelle zurückführen ließ. Es hat sich über Jahre Berufserfahrung aufgebaut, aus Beobachtungen, Gesprächen und Kontexten.

Was bei Nutzung generativer KI Voraussetzung ist, kann bei menschlichem Wissen ein Hindernis sein: Der Quellennachweis. Was meine Vorgesetzte wollte, ist genau die Art von Wissen, das durch KI abrufbar ist. Aus Erfahrung aufgebautes Wissen dagegen lässt sich nicht prompten und oft nicht auf eine konkrete Quelle zurückführen.

Diese Unterscheidung steht im Zentrum einer These, die viel diskutiert wird:

Wissen wird durch KI obsolet.

Sie hat einen wahren Kern aber auch einen entscheidenden Denkfehler. Der wahre Kern:

Faktenwissen ist durch KI-Sprachmodelle weitgehend abrufbar.

LLMs leisten noch weit mehr als Faktenabruf. Durch Mustererkennung über riesige Textmengen erschließen sie nicht-offensichtliche Verbindungen zwischen Konzepten domänenübergreifend und in einem Umfang, der einem einzelnen menschlichen Experten schwerlich zugänglich ist.

Was LLMs dabei nicht leisten: die Unterscheidung zwischen einer plausiblen und einer wahren Synthese. Echte Wissensgenerierung erfordert empirische Überprüfung: Hypothesenbildung, Falsifizierung, experimentelle Validierung. Ein LLM kann den Weg dorthin beschreiben, aber nicht begehen.

Die entscheidende Unterscheidung liegt also nicht darin, ob Wissen obsolet wird, sondern welches Wissen.

Hier kommt der Fehlschluss: KI-Outputs beurteilen zu können setzt eigenes Wissen voraus. Einen falsch zitierten Standardfakt erkenne ich noch. Eine plausibel klingende Fehlverknüpfung über drei Domänen hinweg erfordert deutlich mehr eigenes Fundament, um sie einzuordnen. Die Fähigkeit zu nicht-offensichtlicher Synthese macht das Bewertungsproblem nicht kleiner, sondern größer.

Die Kompetenz, KI-generiertes Wissen zu bewerten, setzt daher genau das voraus, was KI angeblich ersetzt. Kein Basiswissen bedeutet kein Urteilsvermögen. Und kein Urteilsvermögen bedeutet unkritische Abhängigkeit.

Das ist kein Plädoyer für Wissen um seiner selbst willen. Es ist ein Argument gegen eine Vereinfachung, die zu einem konkreten Risiko wird.

Was sich verändert, ist die Architektur des Wissens, das Macht verleiht.

Faktenwissen war nie das Entscheidende. Was bleibt und an Bedeutung gewinnt, ist das, was sich nicht abrufen lässt. Der Philosoph Michael Polanyi hat dafür den Begriff des tacit knowledge geprägt: Wissen, das wir haben, ohne es vollständig explizieren zu können – das Gespür, das Urteil, das durch Praxis und Auseinandersetzung entsteht. Dieses Wissen lässt sich nicht prompten.

Wissen ist weiterhin Macht. Nicht als Faktenspeicher, sondern als Urteilskompetenz. Wer das versteht, nutzt KI anders: nicht als Wissensersatz, sondern als Werkzeug, das Urteilskompetenz voraussetzt – und ohne sie zum Risiko wird.

Hier geht es zum Beitrag auf LinkedIn: Wir Wissen durch KI obsolet?

Bias aus generativer KI eliminieren zu wollen, ist ein Irrweg.

Nicht weil Bias akzeptabel wäre. Sondern weil jede Korrektur das Problem verschiebt, nicht löst. Weniger westlicher Bias bedeutet nicht mehr universelle Ethik. Es bedeutet: andere Werte, andere Probleme. Neutrale KI ist technisch, philosophisch und praktisch nicht realisierbar.

Die entscheidende Frage lautet deshalb nicht:

Wie wird KI neutral?

Denn Neutralität ist keine Systemeigenschaft, sondern eine Designentscheidung, die immer zugunsten bestimmter Perspektiven ausfällt.

Mein aktueller Fachartikel für den Springer Fachverlag untersucht diese Zusammenhänge und gibt konkrete Handlungsempfehlungen: Wirksamer Umgang mit Bias erfordert Transparenz, kontextbezogene Evaluationsstrategien und KI-Governance.

Hier geht es zum Artikel: https://shorturl.at/0LQp7

Hier geht es zum Beitrag auf LinkedIn: Bias in KI: Die Illusion der neutralen KI

Dein persönlicher KI Mitarbeiter ganz einfach eingerichtet:

Claude Cowork ist ein Desktop-Agent, der direkt auf deinem Rechner arbeitet: in deinen lokalen Ordnern und Dateien.

Statt dir nur Textantworten und Artefakte im Browser zu geben, kann Claude in Cowork:

→ mehrstufige Aufgaben selbst planen und ausführen

→ Dateien lesen, bearbeiten, erstellen, umbenennen, verschieben

→ deine Apps steuern

Richtig konfiguriert nimmt es richtig viel Arbeit ab, wie ein echter (sehr zuverlässiger) Mitarbeiter. Ich zeige

Schritt-für-Schritt wie du Claude Cowork einrichtest

und nutzt, ohne Vorwissen.

Auch hier gilt: Es ist wichtig, das System zu verstehen, um es so zu nutzen, dass es einen Mehrwert bringt. Das ist die Lücke, die viele Erklärungen zu Cowork lassen: Sie zeigen die Oberfläche, nicht die Logik dahinter.

Das Carousel ist eine

Schritt-für-Schritt-Einrichtung für Einsteiger

als funktionsfähige Konfiguration. Inklusive

✓ Prompt, mit dem Claude die wichtigen globalen Anweisungen selbst erarbeitet

✓ konkretes Anwendungsbeispiel zum direkten Ausprobieren.

Wer sich bisher nicht an Claude Cowork rangetraut hat: Das hier ist der fehlende Schubser.

Und wer es noch detaillierter möchte bekommt in meiner aktuellen Newsletter-Ausgabe eine Langversion der Anleitung mit noch mehr Infos und Details: https://shorturl.at/qzAUX

Hier geht es zum Beitrag auf LinkedIn: Anleitung Claude Cowork

So solltest du KI NICHT nutzen…

Manchmal ist Nicht-Nutzen die bessere Entscheidung. Das klingt vielleicht seltsam aus dem Mund einer KI-Trainerin. Aber auch das gehört zu KI-Kompetenz: Erkennen, wann KI Einsatz überhaupt sinnvoll ist und wann nicht. Denn KI-Kompetenz ist viel mehr als nur Prompting-Kompetenz.

Der Reflex ist inzwischen bei vielen schon automatisch:

Bei jeder Aufgabe die auftaucht wird als erstes die KI befragt.

Möglichst nicht nachdenken, denn das verbraucht unnötige Kalorien, die KI kann das sicher schnell, bequem und effizient ;).

Das Problem dabei ist aber, dass oft eine entscheidende Frage übergangen wird: Nicht „Wie prompt ich das richtig?” Sondern „Ist KI das richtige Werkzeug für diese Aufgabe? Kann ich das Ergebnis fachlich beurteilen und übernehme ich dafür die Verantwortung?“

Wenn ja: Nutze KI. Zum Beispiel für wiederkehrende Aufgaben, erste Entwürfe, komplexe Themen als Einstieg, als Sparringspartner.

Wenn nein: Für alles, wofür Fachkompetenz, Verantwortung oder eigenständiges Denken Voraussetzung sind, gilt: erst die Grundlage (und selbst nachdenken), dann die KI. Und wenn andere Menschen von der Entscheidung betroffen sind: KI kennt den Menschen dahinter nicht. Man kann auch mal eine Aufgabe ohne KI bearbeiten.

Im Carousel findest du einige

Anregungen zur Entscheidung über deinen KI Einsatz:

wann JA, wann NEIN. Es zeigt, wann KI sinnvoll eingesetzt werden kann und wann nicht.

Hier geht es zum Beitrag auf LinkedIn: KI nutzen? So nicht!

Erkennst du KI-Texte?

Es gibt unzählige Listen an “Erkennungsmerkmalen” und jeder, der bestimmte Wörter nutzt gerät unter Generalverdacht. Und dann gibt es noch Software, die erkennen soll, ob ein Text mit KI erstellt wurde.

Wie gut sind KI-Detektoren?

Jede fünfte Entscheidung ist falsch

KI-Detektionstools funktionieren nicht zuverlässig genug, um als Urteilsgrundlage zu dienen! Das ist kein Meinungsurteil, sondern ein belegter Befund. Trotzdem entsteht damit gerade ein florierendes Geschäftsmodell.

Kein getestetes Tool kam in unabhängigen Studien über 80 % Genauigkeit. Das klingt vertretbar, bis man bedenkt, was das im Umkehrschluss bedeutet: Jede fünfte Entscheidung ist falsch! Bei Systemen, die eingesetzt werden, um Texte – und damit die Leistung eines Menschen – zu bewerten, ist das keine tolerierbare Fehlerquote! Das Prinzip der Unschuldsvermutung ist hier klar außer Kraft gesetzt, denn 80% ist kein Beweis.

So funktionieren KI Detektoren

Das Messprinzip dahinter: Die Tools messen, wie vorhersehbar Wortfolgen sind. Wer fachlich präzise schreibt, wer bestimmten Textkonventionen folgt, produziert statistisch “verdächtige” Texte. Und das nicht weil er KI nutzt, sondern weil sein Schreibstil bestimmten Mustern entspricht, die der Algorithmus mit Maschinenoutput assoziiert. Das Tool kann Kompetenz nicht sicher von Automatisierung unterscheiden.

Warum wird das trotzdem eingesetzt?

Was mich an dieser Debatte beschäftigt, ist weniger die technische Schwäche der Tools, denn die ist schließlich bekannt. Es ist die (fehlende) Logik, mit der sie trotzdem eingesetzt werden.

🤔Und die fehlende Erkenntnis, dass das Nutzen von KI Tools nicht zwingend eine schlechte (inhaltliche) Qualität der Texte bedeutet.

Ich sehe nach wie vor eine große Bereitschaft, dem algorithmischen Ergebnis mehr zu vertrauen als dem eigenen Urteil. KI-Detektionstools bedienen genau diesen Reflex. Sie verwandeln Misstrauen in eine Prozentzahl und nennen das Analyse.

Die Lösung? Gibt es natürlich auch als Tool

Gleichzeitig wächst die Gegenbewegung: Tools, die Texte gezielt so umformulieren, dass sie “menschlicher” wirken. Die Detektionsindustrie erzeugt damit genau das Verhalten, gegen das sie angeblich vorgeht. Ein klassischer Rüstungswettlauf – nur dass hier nicht nur Technologie gegen Technologie antritt, sondern Menschen zwischen den Fronten stehen.

Ein Wahrscheinlichkeitswert ist keine Entscheidung und wer ihn als eine behandelt, delegiert Urteilsvermögen an ein System, das nicht beurteilen kann, was es vorgibt zu messen.

Hier geht es zum Beitrag auf LinkedIn: KI Schreibstil erkennen