Ein KI-Insider packt aus: So drastisch fallen Token-Preise und so kräftig steigt gleichzeitig der Bedarf an Chips. Dabei erfüllt sich eine alte Prophezeiung: CPUs sind gefragt wie nie und treten aus den Schatten der Nvidia-GPUs. Die Depot-2030-Firma Intel hat sich in einem Monat verdoppelt.
Die Mathematik auf aggregierter Ebene ist brutal: 100-mal billigere Token mal 10.000 Token mehr ergeben eine 100-mal höhere Gesamtrechnung. Auf X geht ein Post viral von Dylan, der für die Nebius Token Factory „im großen Maßstab“ im Bereich KI-Inferenz arbeitet.
Zunächst verrät er den Preisverfall für KI-Token-Bezieher: Vor 12 Monaten lagen die Kosten für 1 Million Tokens für Frontier-Class Reasoning bei etwa 60 Dollar. Heute kostet eine gleichwertige Leistung etwa 0,50 Dollar. Dennoch wird immer mehr Rechenkraft und Chip-Power gebucht. Denn: Ein Modell mit logischem Denken verbraucht für dieselbe Aufgabe etwa zehnmal so viele Token wie ein Modell ohne logisches Denken, da es den Großteil seiner Token für lautes Nachdenken vor der Antwort verwendet. Ein agentenbasierter Workflow verarbeitet etwa zwanzigmal so viele Anfragen wie eine einmalige Ausführung, da er Schleifen durchläuft, Tools aufruft, plant, wiederholt und Ergebnisse zusammenführt.
Inference got a hundred times cheaper this year. The compute bill went up anyway.
— dylan ツ (@demian_ai) May 7, 2026
If you understand why those two sentences are both true at the same time, you understand the most important thing happening in AI right now.
I work on inference for a living, at @nebiustf, where… pic.twitter.com/dRLQEHhNQM
CPU holt auf!
Und in der Anwendung der zuvor (mit GPU) trainierten KI-Modelle geschieht Entscheidendes: „Das Verhältnis von CPU zu GPU verändert sich. Beim Training liegt es bei 1:8. Bei einfacher Chat-Inferenz bei 1:4. Agentenbasierte Inferenz bei 1:1, wobei die CPU mitunter stark beansprucht wird.“ Das erklärt die enorm starken Zahlen von Intel und die Kursverdopplung im Depot 2030.
Intel: Visionär gedacht
Das freut mich besonders. Denn Intel wurde lange belächelt, galt als Dino und abgehängt. Dabei sagte mir der sympathische KI-Experte Stephan Gillich bereits 2023 und 2024 im Teams-Videocall: „Es ist vielleicht nicht so bekannt, dass CPUs auch im Bereich KI breit vertreten sind. Doch CPUs tragen in der Praxis eine große Rechenlast.“
Chance laut Dylan: „Inferenz hingegen läuft kontinuierlich, skaliert mit der Nutzung, und die Nutzungskurve verläuft exponentiell. Ihre Stromkosten, Ihre Kühlkosten, die Anzahl Ihrer Transceiver, Ihr Speicherbedarf – all das wurde für eine Workload-Mischung dimensioniert, die heute nicht mehr existiert.“ Daher setzen wir mit Bloom Energy, 2G , Aixtron oder Technotrans auch auf Lösungsanbieter des neuen Bedarfs.
„Wir sehen die neue KI-Dynamik durchaus auch bei uns“, so damalige Director of Artificial Intelligence für die Intel EMEA Datacenter Group. In Datencenter-CPUs wurden etwa Matrix Extensions integriert, um KI-Berechnungen für Kunden wie Alibaba schneller auszuführen. „Das Wachstum ist und wird sehr stark sein. Das sehen wir absolut. Daher stellen wir unsere gesamte Produktlinie auf KI-Workloads um.“
Und jetzt gibt es ein neues TPU-Gerücht mit Google, was im neuen AKTIONÄR HSR beleuchtet wird.
Neue KI-Transaktion im Depot 2030
Der Depot 2030 setzt auf 12 KI-Trend-Titel wie Nvidia, Intel, Baidu, AT&S und Aixtron und hat damit nun die 500-Prozent-Marke geknackt. Und wir legen nach: In der neuen Ausgabe 17/2026 gibt es eine neue Transaktion im Depot 2030 und es wird nach der 600-Prozent-Rallye der TFA-Aktie Hochtief ein neuer KI-Datencenter-Profiteur vorgestellt. Einfach hier für alle Transaktionen und Details freischalten und ab sofort die Reise in die spannende Zukunft 2030 mitmachen!
Hinweis auf Interessenkonflikte
Der Vorstand und Mehrheitsinhaber der Herausgeberin Börsenmedien AG, Herr Bernd Förtsch, ist unmittelbar und mittelbar Positionen über die in der Publikation angesprochenen nachfolgenden Finanzinstrumente oder hierauf bezogene Derivate eingegangen, die von der durch die Publikation etwaig resultierenden Kursentwicklung profitieren können: Nvidia.
Heute, 11:34