Visual Essay · Mai 2026

Generative. Agentic. Collaborative.

In der öffentlichen KI-Debatte dominieren zwei Kategorien. Eine dritte fehlt weitgehend — dabei könnte sie über die Zukunft der Wissensarbeit entscheiden.

Die Bestandsaufnahme

Welche Arten von KI gibt es?

Die gängigen Übersichten unterscheiden zwischen schwacher und starker KI, oder zwischen Technologien wie maschinellem Lernen, Deep Learning und natürlicher Sprachverarbeitung. Aktueller — und für Wissensarbeiter relevanter — ist die Unterscheidung nach Nutzungsmodi: Wie interagiert ein Mensch mit einem KI-System? Hier dominieren zwei Begriffe die Debatte.

Generative AI war das Schlagwort ab 2022. ChatGPT, Midjourney, Claude — Systeme, die Texte, Bilder, Code erzeugen. Der Modus: Mensch stellt Frage, Modell liefert Antwort. Transaktional, zustandslos, ein Austausch pro Sitzung. So nutzt der Großteil der Menschen KI heute — auch weil die Kontextfenster der frühen Modelle kaum mehr als ein paar Seiten Text fassen konnten. Mehr war technisch nicht drin.

Agentic AI ist das Schlagwort seit 2025. Hermes, Devin, OpenClaw, Zapier-Workflows — Systeme, die autonom handeln. Der Modus: Mensch gibt Auftrag, Agent führt aus. Ohne Mensch im Loop. Die Industrie pusht diesen Modus mit Milliarden-Investitionen.

Beide Begriffe beschreiben, was die Technologie tut. Erzeugen. Handeln. Aber sie erfassen einen dritten Modus nicht — einen, der nicht die Technik beschreibt, sondern die Beziehung zwischen Mensch und Modell.

Die Taxonomie

Was unterscheidet Generative AI von Agentic AI?

Dieselbe Technologie — ein großes Sprachmodell — kann in drei sehr verschiedenen Modi eingesetzt werden. Der Unterschied ist nicht das Modell. Der Unterschied ist die Rolle des Menschen.

MODUS 1

Generative AI

Frage rein, Antwort raus. Der Mensch ist Fragesteller. Kein Kontext, keine Kontinuität, kein Gedächtnis. Jeder Chat beginnt bei Null. Das Modell erzeugt — der Mensch konsumiert.

Der Großteil der heutigen Nutzung · ChatGPT-Default
MODUS 2

Agentic AI

Auftrag rein, Ergebnis raus. Der Mensch ist Auftraggeber, dann weg. Der Agent arbeitet autonom — plant, entscheidet, handelt. Der Mensch delegiert — die Maschine operiert.

Der aktuelle Hype · Hermes, Devin, Zapier
MODUS 3

Collaborative AI

Kontext rein, Erkenntnis raus. Der Mensch ist Denkpartner. Der Dialog ist kumulativ — über Stunden, Tage, Wochen. Das Modell denkt mit, der Mensch urteilt. Beide werden besser, je länger sie zusammenarbeiten.

Long-Context Work · Die fehlende Kategorie
MENSCH IM LOOP → nie immer KONTEXTTIEFE → flach tief Generative Frage → Antwort Agentic Auftrag → Agent Collaborative Kontext → Erkenntnis LEER Tiefe ohne Mensch = unkontrollierbar Der Sprung von Modus 1 zu Modus 3 = Long-Context Work
Im Vergleich

Generative, Agentic und Collaborative AI im Vergleich

Generative Agentic Collaborative
Rolle Mensch Fragesteller Auftraggeber Denkpartner
Rolle Modell Erzeuger Ausführer Mitdenker
Kontext Null (jeder Chat neu) Aufgabenbezogen Kumulativ, wachsend
Zeitraum Sekunden Minuten bis Stunden Tage bis Wochen
Qualitätsfilter Keiner (Nutzer prüft) Regel + Guardrails Menschliches Urteil
Wertschöpfung Zeitersparnis Kostenreduktion Qualitäts­verstärkung
Kernkompetenz Prompten Orchestrieren Context Engineering
Methode Chat Automation Long-Context Work
Die Frage

Warum gibt es keine Kategorie für Collaborative AI?

Nicht weil sie übersehen wird — sondern weil sie erst seit Kurzem technisch möglich ist.

2022, als ChatGPT erschien, hatten Sprachmodelle winzige Kontextfenster — wenige tausend Token, kaum mehr als ein paar Seiten Text. Jede Konversation begann bei Null, jeder Chat war zustandslos. Unter diesen Bedingungen war Modus 1 — Frage rein, Antwort raus — die einzig sinnvolle Nutzung. Für kumulative Zusammenarbeit über Stunden und Tage fehlte schlicht die technische Grundlage. Die Entwicklung am Beispiel von Claude zeigt, wie schnell sich das geändert hat:

KONTEXTFENSTER (TOKEN) 9K 100K 200K 1M 2023 2024 2025 2026 Claude 1 9K · ≈ 15 Seiten Claude 2 100K · ≈ 250 Seiten Claude 2.1 / Claude 3 200K · ≈ 500 Seiten Opus 4.5 200K — der Chat wird voll Opus 4.6 1M · ≈ 3.000 Seiten Der Startschuss Plateau: 200K reicht nicht für mehrstündige Zusammenarbeit Frage → Antwort war die einzig sinnvolle Nutzung

Gleichzeitig sind die Kosten massiv gefallen. Claude 3 Opus kostete bei Launch 15 Dollar pro Million Input-Token. Opus 4.6 kostet 5 Dollar — bei fünfmal so viel Kontext.

KOSTEN PRO 1M INPUT-TOKEN (API) $15 $10 $5 2024 2025 2026 Claude 3 Opus $15 / 1M Token · 200K Kontext Opus 4 / 4.1 $15 / 1M Token · 200K Kontext Opus 4.5 $5 / 1M · −67% Opus 4.6 $5 / 1M · jetzt mit 1M Kontext Gleicher Preis, gleiche Limits — zwei Drittel günstiger, 5× mehr Kontext

2026 kumulieren beide Entwicklungen: Die Kontextfenster sind groß genug für tiefe, mehrstündige Zusammenarbeit — und die Kosten niedrig genug, um diese Arbeitsweise wirtschaftlich zu machen. Nicht über die API, sondern über monatliche Pauschalen wie Claude Max für 100 Euro. Claude ist dabei nicht der einzige Anbieter mit einem Kontextfenster dieser Größe — auch die Modelle von OpenAI und Google haben die Million-Token-Schwelle erreicht:

ANTHROPIC

Claude Opus 4.6

1M Token, GA seit März 2026. Stärkstes Modell für tiefe, langfristige Zusammenarbeit — höchste Retrieval-Genauigkeit bei voller Kontextlänge.

OPENAI

GPT-5.4

1M Token via Codex. Breites Ökosystem, starke Tool-Integration.

GOOGLE

Gemini 3.1 Pro

1M Token. Googles Antwort auf den Long-Context-Wettbewerb.

Erst mit einem Kontextfenster dieser Größe und zu diesen Kosten wird Long-Context Work — tiefe, kumulative Mensch-Modell-Kollaboration — praktikabel. Das große Kontextfenster ist dabei die Schlüsselinnovation für beide Wege: Ein Agent, der autonom durch eine Codebase navigiert, braucht genauso viel Kontext wie ein Mensch, der über Stunden mit einem Modell denkt. Die Technologie ist dieselbe. Die Richtung ist eine andere: Nicht Automatisierung, sondern Zusammenarbeit. Nicht Ersetzung, sondern kreative Synthese. Dieser kollaborative Strang — Collaborative AI — wird als eigene Kategorie gerade erst sichtbar.

Der Twist

Ist KI eine Bedrohung oder eine Chance?

Die öffentliche Debatte kennt bei „mit KI zusammenarbeiten" vor allem eine Lesart: die defensive. Lern das, damit dein Arbeitgeber dich nicht ersetzt. Pass dich an. Mach dich nützlich. Bleib relevant. Optimier dich für ein System, das immer weniger zurückgibt.

Aber es gibt eine zweite Lesart — die offensive: Lern das, damit du eigene Wege gehen kannst.

Wer als Einzelner mit einem Frontier-Modell Ergebnisse liefern kann, die bisher ganze Teams erforderten, verändert die Machtverhältnisse. Nicht nur der Arbeitnehmer steht unter Anpassungsdruck — auch der Arbeitgeber, weil ein Freelancer vergleichbare Leistung schneller, günstiger und flexibler bieten kann. Analyse, Konzeption, Umsetzung, Kommunikation — alles aus einer Hand, verstärkt durch ein Modell, das mitdenkt.

Collaborative AI ist kein Überlebensprogramm für Angestellte. Es ist ein Emanzipationsprogramm für Wissensarbeiter.

Die Tech-Branche setzt auf Agenten. Wissensarbeiter sollten auf Denkpartnerschaft setzen — und sich dadurch unersetzlich machen.
Der Agent automatisiert Aufgaben. Der Denkpartner verstärkt Urteil. Beide nutzen dasselbe Modell. Der Unterschied ist der Modus — und der Modus entscheidet über den Wert der Arbeit.
In der Praxis

Was bedeutet Collaborative AI für Freelancer und Wissensarbeiter?

Collaborative AI ist kein Framework, das man implementiert. Es ist eine Arbeitsweise, die man aufbaut — Session für Session, Projekt für Projekt.

In jedem dieser Fälle bleibt der Mensch im Zentrum. Aber das Zentrum hat sich verschoben: vom Ausführen zum Urteilen, vom Produzieren zum Kuratieren, vom Stunden-Verkaufen zum Ergebnis-Liefern.

Abgrenzung

Was Collaborative AI nicht ist

Nicht "Human in the Loop". Das ist ein Sicherheitskonzept — der Mensch als Notbremse. Bei Collaborative AI ist der Mensch nicht die Bremse, sondern der Motor.

Nicht Multi-Agent-Kollaboration. In der Fachliteratur meint "Collaborative AI" oft KI-Systeme, die miteinander zusammenarbeiten (CrewAI, AutoGen, Swarm). Hier ist das Gegenteil gemeint: ein Mensch, ein Modell, ein Denkraum.

Nicht Copilot. Der Copilot-Modus ist Modus 1 mit besserem Interface — Vorschläge annehmen oder ablehnen, in Echtzeit. Collaborative AI ist ein anderer Zeithorizont: nicht Sekunden, sondern Tage. Nicht Vorschläge, sondern Denkbewegungen.

Nicht einfach "Chat mit mehr Kontext". In einer Collaborative-AI-Session passieren alle drei Modi: Man chattet (Modus 1), das Modell baut agentisch Code oder Dokumente (Modus 2), und über die Session hinweg wächst ein gemeinsamer Denkraum (Modus 3). Modus 1 und 2 sind enthalten in Modus 3. Aber Modus 3 ist mehr als die Summe: Es kommt die Kontinuität hinzu, das menschliche Urteil, die Richtungsentscheidungen — kumulative Erkenntnisse, die weder Mensch noch Modell allein gehabt hätten.

Die Pointe
Bessere Modelle, größere Kontextfenster, sinkende Kosten — die technologischen Voraussetzungen für tiefe Mensch-Modell-Kollaboration sind da. Der Unterschied ist der Modus. Und der Modus entscheidet über den Wert der Arbeit.
Generative AI hat KI demokratisiert. Agentic AI wird KI automatisieren. Collaborative AI hat das Potenzial, KI wirklich produktiv zu machen — für den einzelnen Menschen, nicht für das System. Das ist Long-Context Work. Das ist pm consulting · rethink with ai.
Nächster Schritt

Vom Lesen zum Machen

Wenn Sie Ihre Arbeit nicht automatisieren, sondern verstärken wollen — ob als Freelancer, Wissensarbeiter oder Unternehmen — lassen Sie uns reden. Gemeinsam Ihre Wertschöpfung mit einem leistungsstarken KI-Modell im Zentrum neu denken.

kontakt@pm-consulting.ai