Was sind Tokens bei der Nutzung von KI-Modellen?
Die versteckte Einheit hinter jeder KI-Anfrage
Wer KI-Modelle wie ChatGPT, Claude, Grok, Gemini oder DeepSeek nutzt, bezahlt im Hintergrund oft nicht pro Frage, pro Antwort oder pro Minute.
Bezahlt wird häufig pro Token.
Tokens sind die kleinste Recheneinheit, mit der KI-Modelle Text verarbeiten. Jeder Text, den ein Nutzer eingibt, wird zuerst in solche Einheiten zerlegt. Danach berechnet das Modell auf Basis dieser Tokens die Antwort – und erzeugt wiederum neue Tokens als Ausgabe.
Vereinfacht gesagt:
Ein Token ist ein Stück Text.
Das kann ein ganzes Wort sein. Es kann aber auch nur ein Teil eines Wortes, ein Satzzeichen oder eine Zahlenfolge sein.
Ein Token ist nicht immer ein Wort
Viele Nutzer denken bei KI-Kosten zuerst an Seiten, Wörter oder Zeichen. Technisch rechnen KI-Modelle aber anders.
Als Faustregel gilt:
1 Token entspricht ungefähr 4 Zeichen.
1 Token entspricht ungefähr 0.75 Wörtern.
100 Tokens entsprechen ungefähr 75 Wörtern.
1’000 Tokens entsprechen ungefähr 750 Wörtern.
Das ist nur eine Näherung. Je nach Sprache, Schreibweise, Sonderzeichen, Zahlen, Tabellen oder Fachbegriffen kann die tatsächliche Tokenzahl abweichen.
Ein einfaches Wort wie „Hallo“ kann ein Token sein. Ein längeres oder selteneres Wort wie „Tokenisierung“ kann in mehrere Tokens zerlegt werden.
Einfache Beispiele
Der kurze Satz:
„Hallo, wie geht’s?“
hat ungefähr 5 Tokens.
Ein normaler Satz mit 15 Wörtern kann ungefähr 20 Tokens erzeugen.
Eine Seite Text liegt je nach Formatierung meistens bei etwa 500 bis 800 Tokens.
Ein längeres PDF, ein Vertrag, eine Ausschreibung oder ein technischer Bericht kann schnell zehntausende Tokens umfassen.
Genau deshalb werden Tokens im Unternehmensumfeld so wichtig. Es geht nicht nur um einzelne Chatfragen. Es geht um ganze Dokumente, Prozesse und automatisierte Workflows.
Input-Tokens und Output-Tokens
Bei KI-Modellen wird meistens zwischen Input und Output unterschieden.
Input-Tokens sind alles, was an das Modell gesendet wird: die Frage des Nutzers, ein hochgeladenes Dokument, frühere Chatverläufe, Systemanweisungen oder Kontextinformationen.
Output-Tokens sind das, was das Modell zurückgibt: die Antwort, Analyse, Zusammenfassung, Tabelle, E-Mail, Code oder Empfehlung.
Je länger der Input und je ausführlicher die Antwort, desto mehr Tokens werden verbraucht.
Wichtig ist: Auch Kontext kostet. Wenn ein KI-Agent bei jeder Anfrage lange Firmendaten, Projektdokumente oder frühere Gesprächsverläufe mitliest, steigen die Kosten deutlich.
Wie kann man Tokens grob berechnen?
Für eine einfache Schätzung kann man mit folgender Faustregel arbeiten:
Anzahl Zeichen geteilt durch 4 ergibt ungefähr die Tokenzahl.
Oder:
Anzahl Wörter geteilt durch 0.75 ergibt ungefähr die Tokenzahl.
Beispiel:
Ein Text mit 3’000 Wörtern entspricht ungefähr 4’000 Tokens.
Wenn ein KI-Modell diesen Text liest und eine Antwort mit 1’000 Tokens erzeugt, ergibt das ungefähr:
4’000 Input-Tokens
1’000 Output-Tokens
Total: 5’000 Tokens
Bei 100 solchen Analysen wären das bereits rund 500’000 Tokens.
Bei 1’000 Analysen wären es rund 5 Millionen Tokens.
Was kostet 1 Million Tokens?
Die Kosten hängen stark vom Anbieter, vom Modell und vom Einsatzzweck ab.
Ein günstiges Modell kann pro 1 Million Tokens nur wenige Cent bis unter einen US-Dollar kosten. Ein starkes Premium- oder Reasoning-Modell kann dagegen mehrere Dollar bis deutlich mehr pro 1 Million Tokens kosten.
Wichtig ist auch die Unterscheidung zwischen Input und Output.
Input ist der Text, den das Modell liest.
Output ist der Text, den das Modell neu erzeugt.
Output-Tokens sind häufig teurer als Input-Tokens, weil das Modell neue Inhalte aktiv generieren muss.
Als grobe Orientierung kann man mit folgenden Bandbreiten arbeiten:
Günstige Modelle: etwa 0.10 bis 1.00 US-Dollar pro 1 Million Input-Tokens und etwa 0.20 bis 3.00 US-Dollar pro 1 Million Output-Tokens.
Stärkere Modelle: etwa 1.00 bis 5.00 US-Dollar pro 1 Million Input-Tokens und etwa 3.00 bis 30.00 US-Dollar pro 1 Million Output-Tokens.
Premium-, Reasoning- oder Spezialmodelle können je nach Anbieter, Leistungsklasse und Nutzung nochmals deutlich darüber liegen.
Die konkrete Rechnung hängt deshalb immer vom gewählten Modell, vom Verhältnis zwischen Input und Output, vom Caching, von Reasoning-Tokens und vom Workflow ab.
Beispielrechnung mit Annahmen
Nehmen wir eine typische Dokumentenanalyse:
Ein KI-Modell liest 4’000 Input-Tokens und erzeugt 1’000 Output-Tokens.
Das ergibt total 5’000 Tokens.
Bei einem günstigen Modell könnte diese Analyse ungefähr zwischen 0.001 und 0.01 US-Dollar kosten.
Bei einem stärkeren Modell könnte dieselbe Analyse ungefähr zwischen 0.01 und 0.05 US-Dollar kosten.
Bei einem sehr teuren Premium- oder Reasoning-Modell kann es je nach Abrechnung auch mehr sein.
Eine einzelne Analyse ist also oft extrem günstig.
Aber bei grossen Mengen verändert sich die Rechnung.
1’000 Analysen entsprechen ungefähr 5 Millionen Tokens.
100’000 Analysen entsprechen ungefähr 500 Millionen Tokens.
1 Million Analysen entsprechen ungefähr 5 Milliarden Tokens.
Dann geht es nicht mehr um einzelne Chatfragen.
Dann geht es um industrielle Informationsverarbeitung.
Wissensarbeit lässt sich in Tokens denken
Besonders spannend wird es, wenn man menschliche Wissensarbeit als grobe Vergleichsgrösse in Tokens übersetzt.
Eine solche Rechnung ist keine exakte wissenschaftliche Norm. Sie ist eine Modellrechnung. Aber sie hilft, die wirtschaftliche Dimension von KI besser zu verstehen.
Ein einzelner Wissensarbeiter bewegt sich über ein Jahr betrachtet schnell im Bereich von mehreren Millionen Tokens. Je nach Tätigkeit, Dokumentenvolumen und Digitalisierungsgrad kann man grob mit rund 10 bis 20 Millionen verarbeiteten Tokens pro Jahr rechnen.
Dabei geht es nicht nur um geschriebenen Output.
Es geht um Lesen, Prüfen, Vergleichen, Zusammenfassen, Recherchieren, Analysieren, Entscheiden und Dokumentieren.
Ein Mensch schreibt vielleicht nicht 15 Millionen Tokens pro Jahr. Aber er verarbeitet über E-Mails, Offerten, Berichte, Verträge, Präsentationen, Tabellen, Protokolle, Projektunterlagen und Entscheidungsgrundlagen enorme Mengen an Information.
Genau diese Informationsarbeit wird durch KI messbar, skalierbar und teilweise automatisierbar.
Warum Tokens bei AI-Agents besonders wichtig werden
Bei einfachen Chatbots wirken Tokenkosten oft klein. Eine einzelne Frage kostet häufig nur Bruchteile eines Cents.
Doch bei AI-Agents ändert sich die Rechnung.
Ein Agent stellt nicht nur eine Frage. Er liest Daten, prüft Dokumente, analysiert Informationen, erstellt Zwischenschritte, ruft Tools auf, vergleicht Resultate und formuliert am Ende eine Antwort.
Dadurch entstehen deutlich mehr Tokens als bei einer normalen Chatantwort.
Ein sichtbarer Output von wenigen Seiten kann im Hintergrund viel mehr Verarbeitung auslösen – besonders bei Reasoning-Modellen, Coding-Agenten, Recherche-Agenten oder Analyse-Workflows.
Deshalb werden Tokenkosten bei Automatisierung zu einem echten betriebswirtschaftlichen Faktor.
Beispielrechnung für ein Unternehmen
Nehmen wir an, ein Unternehmen verarbeitet monatlich zwischen 100 Millionen und 1 Milliarde Input-Tokens sowie zwischen 20 Millionen und 200 Millionen Output-Tokens.
Das klingt nach sehr viel. Für Unternehmen mit vielen Dokumenten, vielen Mitarbeitenden oder automatisierten AI-Agent-Workflows kann diese Grössenordnung aber realistisch werden.
Bei günstigen Modellen können solche Volumen monatlich im tiefen dreistelligen bis tiefen vierstelligen Dollarbereich liegen.
Bei stärkeren Modellen kann dieselbe Nutzung in den vier- bis fünfstelligen Dollarbereich steigen.
Bei Premium- oder Reasoning-Modellen können die Kosten nochmals deutlich höher ausfallen, vor allem wenn viele interne Denk- oder Zwischenschritte verrechnet werden.
Die wichtigste Erkenntnis lautet deshalb:
Nicht nur die Modellqualität zählt.
Auch der Tokenpreis entscheidet, ob ein AI-Workflow wirtschaftlich skalierbar ist.
Was bedeutet das für die Bauwirtschaft?
Für die Bauwirtschaft ist das besonders relevant.
Bau, Immobilien und Handwerk arbeiten mit vielen daten- und dokumentenintensiven Prozessen: Ausschreibungen, Offerten, Projektbeschriebe, Zertifizierungen, Referenzen, ESG-Nachweise, Firmenprofile, technische Unterlagen, Verträge und Qualitätsbewertungen.
Wenn solche Dokumente mit KI analysiert werden, entstehen Tokens.
Wenn AI-Agenten Firmen vergleichen, Risiken einschätzen, Zertifizierungsberichte erstellen oder Business-Analysen vorbereiten, entstehen Tokens.
Wenn ganze Branchenprozesse automatisiert werden, entstehen sehr viele Tokens.
Die Kosten pro Token entscheiden deshalb mit, wie schnell KI im Bau- und Handwerksmarkt wirklich breit eingesetzt werden kann.
Warum die 15-Millionen-Token-Denkfigur wichtig ist
Rechnet man menschliche Wissensarbeit modellhaft in Tokens um, wird sichtbar, warum AI-Agents wirtschaftlich so relevant werden.
Wenn ein Wissensarbeiter grob 10 bis 20 Millionen Tokens pro Jahr verarbeitet, dann entspricht ein Team von 10 Personen bereits einer Informationsleistung von vielleicht 100 bis 200 Millionen Tokens pro Jahr.
Bei 100 Personen sind es schnell 1 bis 2 Milliarden Tokens.
Natürlich ersetzt ein Token nicht automatisch menschliches Urteilsvermögen, Erfahrung oder Verantwortung. Aber die Rechnung zeigt, welche Informationsmengen in Unternehmen täglich verarbeitet werden – oft manuell, langsam und teuer.
Genau hier entsteht das Potenzial von KI.
Nicht als Ersatz für alles.
Sondern als Beschleuniger für Lesen, Strukturieren, Prüfen, Vergleichen, Bewerten und Zusammenfassen.
Günstige Tokens machen KI skalierbar
Je günstiger Tokens werden, desto mehr Anwendungsfälle werden wirtschaftlich möglich.
Dann kann KI nicht nur einzelne Texte schreiben, sondern ganze Prozesse unterstützen:
Ausschreibungen analysieren,
Offerten vergleichen,
Firmenprofile strukturieren,
Zertifizierungen auswerten,
Referenzen prüfen,
ESG-Signale einordnen,
Risiken bewerten,
Reports erstellen,
Entscheidungen vorbereiten.
Sinkende Tokenpreise bedeuten deshalb nicht, dass KI weniger wertvoll wird.
Im Gegenteil: Wenn die Nutzung günstiger wird, kann KI viel breiter eingesetzt werden.
Der eigentliche Wert liegt im Kontext
Doch günstige Tokens allein reichen nicht.
Ein KI-Modell kann nur so gut arbeiten wie die Daten, die es versteht. Gerade in der Bauwirtschaft braucht KI verlässlichen Kontext: Firmeninformationen, Kompetenzen, Referenzen, Ratings, Zertifizierungen, Kapazitäten, Regionen, Qualitätsmerkmale und Risikosignale.
Wenn diese Daten unstrukturiert, veraltet oder nicht vergleichbar sind, hilft auch ein günstiges Modell nur begrenzt.
Deshalb werden Vertical Industry Data Platforms und Data-as-a-Service immer wichtiger.
Sie liefern den Kontext, den AI-Agents brauchen.
Quellenhinweis:
xAI API Docs, OpenAI Token-Dokumentation, Anthropic Pricing, DeepSeek API Docs; Einordnung auf Basis öffentlich verfügbarer Preis- und Modelldokumentationen. Die Kostenbeispiele sind modellhafte Von-bis-Annahmen und können je nach Anbieter, Modell, Caching, Reasoning und Nutzung stark variieren. Die 10–20-Millionen-Tokens-pro-Jahr-Angabe ist eine modellhafte Vergleichsgrösse für Wissensarbeit, keine exakte wissenschaftliche Norm. Stand der Preisprüfung: 26. Mai 2026.
Fazit
Tokens sind die Grundeinheit der KI-Nutzung.
Sie bestimmen, wie viel Text ein Modell verarbeitet, wie lange Antworten werden und wie hoch die Kosten im Betrieb ausfallen.
Für einfache Chatfragen wirken Tokenkosten klein. Für Unternehmen, AI-Agents und automatisierte Workflows können sie jedoch entscheidend werden.
Als grobe Denkfigur kann ein Wissensarbeiter mit rund 10 bis 20 Millionen verarbeiteten Tokens pro Jahr modelliert werden – nicht als reiner Schreiboutput, sondern als Summe aus Lesen, Prüfen, Analysieren und Entscheiden.
Die Zukunft der KI wird deshalb nicht nur durch die besten Modelle bestimmt.
Sie wird auch durch die günstigsten Tokens, die besten Daten und den vertrauenswürdigsten Kontext entschieden.
Oder kurz gesagt:
Wer KI skalieren will, muss Tokens verstehen.
Disclaimer handwerker.ch (Erweiterte Fassung 2026): Alle Angaben, Bildquellen und Informationen auf handwerker.ch, deren Subdomains sowie zugehörigen Plattformen sind unverbindlich und ohne Gewähr. Die bereitgestellten Informationen dienen ausschliesslich der allgemeinen Information und stellen keine professionelle Beratung dar, insbesondere keine Bau-, Rechts-, Finanz-, Versicherungs-, Steuer- oder Investitionsberatung. Bitte prüfen Sie relevante Angaben stets anhand der offiziellen Webseiten, Register, Unterlagen oder direkten Auskünfte der jeweiligen Unternehmen. Änderungen, Irrtümer und abweichende Verfügbarkeiten bleiben jederzeit vorbehalten. Bildquellen & Urheberrechte: Bilder, Abbildungen, Firmenzeichen und Logos werden von den jeweiligen Unternehmen direkt oder indirekt öffentlich im digitalen Raum bereitgestellt oder stammen aus öffentlich zugänglichen Quellen (z. B. Screenshots von Websites oder Social-Media-Präsenzen). Die Urheber- und Markenrechte verbleiben beim jeweiligen Rechteinhaber. Die Nutzung durch handwerker.ch dient ausschliesslich der redaktionellen Berichterstattung und Veranschaulichung – es besteht keine Kooperation oder Werbeabsicht, sofern nicht ausdrücklich angegeben. Technischer Hinweis & KI-Einsatz: Zur Optimierung von Daten, Texten und Bildern sowie zur Erstellung von Zusammenfassungen (z. B. durch HandwerkerGPT) setzen wir modernste Systeme der Künstlichen Intelligenz (KI/AI) sowie AI Agents ein. Diese Technologien dienen der effizienten Informationsaufbereitung. Bitte beachten Sie, dass KI-generierte Inhalte ("Halluzinationen") Fehler enthalten, Fakten falsch verknüpfen oder unvollständig sein können. handwerker.ch übernimmt ausdrücklich keine Haftung für die Richtigkeit, Vollständigkeit oder Aktualität dieser automatisiert erstellten Inhalte. Massgeblich sind stets die offiziellen Angaben der jeweiligen Unternehmen sowie deren eigene Webpräsenzen. Weiterführende Informationen (siehe Footer handwerker.ch): a) Transparenzbericht, b) Datenschutzerklärung, c) Impressum, d) Allgemeine Geschäftsbedingungen (AGB)
- 27.05.2026
- 1148
- KI, Robotik & Zukunft Bau
- Lesezeit: 17 Minuten












