Die Kostenfalle Agenten: Warum KI-Workflows plötzlich teuer werden

30. März 2026

Agenten gelten als die nächste Evolutionsstufe der KI. Systeme wie Claude (inkl. Cowork) oder Automationsplattformen wie n8n versprechen, komplette Aufgaben eigenständig zu planen und auszuführen. Doch genau hier entsteht eine neue Kostenrealität, die viele Unternehmen 2026 überrascht: KI wird nicht mehr pro Anfrage bezahlt – sondern pro Rechenprozess im Hintergrund.

Der entscheidende Punkt ist das Abrechnungsmodell. Moderne Modelle wie Claude Sonnet 4.6 liegen aktuell bei etwa 3 US-Dollar pro 1 Million Input-Tokens und 15 US-Dollar pro 1 Million Output-Tokens. Das klingt zunächst günstig. Doch diese Preise gelten nur unter bestimmten Bedingungen – und vor allem nur pro einzelnen Modellaufruf.

Sobald Agenten ins Spiel kommen, verändert sich die Rechnung grundlegend.

Ein Agent führt keine einzelne Anfrage aus, sondern zerlegt Aufgaben in mehrere Schritte: Planung, Recherche, Tool-Nutzung, Bewertung und finale Ausgabe. Jeder dieser Schritte ist ein eigener Modellaufruf. Ein scheinbar einfacher Task kann so aus einer ganzen Kette von Interaktionen bestehen – mit entsprechendem Tokenverbrauch.

Hinzu kommt der Kontext. Agenten arbeiten häufig mit großen Datenmengen: Dokumente, E-Mails, Code-Repositories oder ganze Wissensdatenbanken. Sobald diese Kontexte wachsen, steigen auch die Kosten. Bei Claude-Modellen etwa verdoppeln sich die Preise, wenn Eingaben über 200.000 Tokens hinausgehen – auf etwa 6 Dollar Input und 22,50 Dollar Output pro Million Tokens. Große „One-Shot“-Prompts können damit teurer werden als viele kleinere Interaktionen.

Ein weiterer Kostentreiber ist das sogenannte Reasoning. Moderne Modelle berechnen intern Zwischenschritte, um komplexe Aufgaben zu lösen. Diese zusätzlichen Tokens sind für Nutzer oft unsichtbar, werden aber vollständig abgerechnet. Gerade bei Agenten-Workflows summiert sich dieser Effekt schnell.

In Claude Cowork wird diese Dynamik besonders deutlich. Nutzer sehen in der Oberfläche meist nur, dass ein Agent einige Minuten arbeitet. Was im Hintergrund passiert, bleibt oft verborgen: mehrere Modellaufrufe, wiederholte Analysen und Iterationen. Wenn der Agent zudem autonom weiterarbeitet – etwa zusätzliche Quellen prüft oder Varianten vergleicht – steigt der Tokenverbrauch weiter.

Ein zusätzlicher Faktor ist die Modellwahl. Systeme greifen je nach Aufgabe automatisch auf leistungsstärkere Modelle zurück. In extremen Fällen können Modelle wie OpenAI o1-pro zum Einsatz kommen, deren Preise bei rund 150 Dollar pro Million Input-Tokens und 600 Dollar pro Million Output-Tokens liegen. Schon wenige Millionen Tokens können hier relevante Kosten verursachen.

Auch Automationsplattformen wie n8n verschärfen diese Dynamik. n8n selbst rechnet nicht nach Tokens, sondern nach Workflow-Ausführungen – etwa 20 Euro pro Monat für rund 2.500 Executions oder 50 Euro für größere Pakete. Die eigentlichen KI-Kosten entstehen jedoch zusätzlich durch angebundene Modelle.

Das führt zu einer typischen Kostenfalle: Ein Workflow, der bei jeder Ausführung mehrere KI-Aufrufe enthält, kann bei steigender Nutzung exponentiell teurer werden. Besonders kritisch sind automatisierte Trigger – etwa eingehende E-Mails oder API-Events –, die Agentenprozesse im Hintergrund starten. Aus wenigen manuellen Tasks werden schnell tausende automatisierte Runs.

Warum werden diese Kosten so oft unterschätzt? Vor allem, weil die mentale Einheit nicht zur Abrechnung passt. Menschen denken in Aufgaben oder Arbeitszeit. Anbieter rechnen in Tokens und Workflow-Ketten. Ein einzelner „Task“ kann intern Millionen Tokens verbrauchen, ohne dass dies direkt sichtbar ist.

Hinzu kommt mangelnde Transparenz. Viele Tools zeigen weder den Tokenverbrauch pro Schritt noch die Kosten pro Workflow klar an. Ohne Monitoring, Budgets oder Limits fehlt die Kontrolle – und die Kosten werden erst sichtbar, wenn die Rechnung kommt.

Die eigentliche Herausforderung liegt daher nicht in den Modellpreisen, sondern in der Architektur. Agenten sind keine einzelnen Tools, sondern skalierende Systeme. Wer sie einführt, muss ihre Kosten genauso denken wie ihre Leistung.

Agenten sind mächtig. Aber sie rechnen anders.

Vorheriger Artikel

#305 – Warum Claude, Perplexity und Microsoft plötzlich deinen Computer steuern wollen

Nächster Artikel

#306 – Sora ist tot: Warum OpenAI seine Video-KI einstampft

Kommentieren Sie den Artikel Antwort abbrechen

Bitte geben Sie Ihren Kommentar ein!

Bitte geben Sie hier Ihren Namen ein

Sie haben eine falsche E-Mail-Adresse eingegeben!

Bitte geben Sie hier Ihre E-Mail-Adresse ein

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.

Apple auf der CHI 2026: Wie KI, Design und Mensch-Interaktion zusammenwachsen

Wie generative KI Führung neu erfindet – und Organisationen gleich mit