OpenAI stellt mit Broadcom seinen ersten eigenen Chip vor

Michael Dobler

Autor Dr. Web

28. Juni 2026

4 Min. Lesezeit

OpenAI lässt mit Broadcom einen eigenen KI-Chip fertigen und greift damit Nvidia dort an, wo der Marktführer am meisten verdient. Der Beschleuniger namens Jalapeño dient allein dem Beantworten von Anfragen. Für europäische Unternehmen verschiebt sich eine ohnehin enge Abhängigkeit.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Ein eigener KI-Chip hat für ein Software-Unternehmen wie OpenAI lange als undenkbar gegolten. Genau diesen Schritt hat der ChatGPT-Anbieter am 24. Juni 2026 mit dem Halbleiterkonzern Broadcom verkündet. Die eigentliche Nachricht steckt nicht im Chip, sondern in der Rechnung dahinter.

Das Wichtigste in Kürze

Jalapeño ist ausschließlich für KI-Inferenz gebaut, also für den laufenden Modellbetrieb statt fürs Training.
Laut OpenAI liegt die Leistung pro Watt deutlich über dem heutigen Stand der Technik, erster Einsatz Ende 2026.
Google, Amazon und Meta bauen längst eigenes Silizium gegen Nvidias Vormacht.
Europäische Anbieter bleiben hardware-abhängig, der Strombedarf der Rechenzentren wächst weiter.

Warum baut OpenAI einen Chip nur fürs Antworten?

Transparente Chilischote mit Mikrochip, daneben Anhänger — Nvidia-Grafikkarten trainieren, rendern und antworten, verbrauchen aber unnötig Energie. ASICs rechnen effizienter nur die laufenden Antworten

Eine Grafikkarte von Nvidia kann fast alles: trainieren, rendern, antworten. Diese Flexibilität kostet Strom und Geld. Jeder Token aus ChatGPT läuft über Hardware, die für viel mehr taugt als den einen Zweck. Ein anwendungsspezifischer Schaltkreis, kurz ASIC, lässt den Ballast weg und rechnet nur die laufende Antwort.

Der wirtschaftliche Hebel liegt im Dauerbetrieb. Trainiert wird ein Modell einmal, beantwortet werden Anfragen milliardenfach. Hier entscheidet jedes eingesparte Watt über die Marge. Branchenanalysen beziffern den Kostenvorteil von Spezialchips gegenüber GPUs auf 50 bis 70 % pro Milliarde Tokens. Greg Brockman, Präsident von OpenAI, nennt das in der Ankündigung von OpenAI und Broadcom eine echte Verbesserung „bei Leistung pro Watt und Leistung pro Dollar“.

Bemerkenswert bleibt das Tempo. Vom Entwurf bis zur Fertigungsfreigabe hat der Chip nur neun Monate gebraucht, nach Angaben der Partner einer der schnellsten ASIC-Zyklen überhaupt. OpenAI hat eigene Modelle genutzt, um Teile des Entwurfs zu beschleunigen. Die KI hat also an der Hardware für künftige Modelle mitgebaut.

Ist Jalapeño ein Einzelfall oder ein Muster?

Vier Prozessoren mit Buchstaben G, A, Chili, M und einem Metallsiegel mit Text — Google, Amazon und Meta setzen längst auf eigenes Silizium, OpenAI zieht mit Jalapeño nach.

Der Schritt reiht sich in einen klaren Trend ein. Google rechnet seit Jahren auf eigenen Tensor Processing Units, Amazon setzt mit Trainium auf eigene Beschleuniger, Meta entwickelt die MTIA-Familie. Jeder große Cloud-Betreiber will sich aus der Preis- und Liefermacht eines einzigen Zulieferers lösen, ein Muster, das die aktuelle KI-Berichterstattung seit Monaten prägt. TrendForce erwartet 2026 erstmals stärkeres Wachstum bei Spezialchips als bei Standard-GPUs.

Naheliegend wäre der Schluss, Nvidia stehe vor dem Aus. Diese Lesart greift zu kurz. OpenAI bestellt parallel weiter Nvidia-Hardware im großen Stil, weil Training und neue Aufgaben die flexiblen GPUs brauchen. Die Eigenchips zielen auf den reifen, planbaren Teil der Last. Hyperscaler fahren also zweigleisig.

Der eigentliche Kampf läuft nicht um die schnellste Grafikkarte, sondern um den Preis einer einzigen Antwort. Sinkt der Strom pro Token, verschieben sich die Spielregeln des KI-Marktes.
— Markus Seyfferth, Chefredakteur Dr. Web

Was bedeutet das für Europa?

Platine mit Zähler und Deutschlandfahne, beschriftet mit „STROM-MANAGER“ und „IMPORT“ — Europa bezieht KI-Hardware weiter aus Übersee, während der Strombedarf der Rechenzentren steigt.

Für den DACH-Raum verschärft sich eine alte Abhängigkeit. Europa hält laut Branchenschätzungen nur rund 4 % der weltweiten KI-Rechenkapazität, etwa 70 % liegen in den USA. Ob Unternehmen auf Nvidia-GPUs oder auf OpenAI-Beschleuniger setzen, die Schlüsseltechnologie kommt weiter aus Übersee. Digitale Souveränität beantwortet kein Server-Standort in Frankfurt allein.

Konkret wächst der Strombedarf. Die Internationale Energieagentur erwartet bis 2030 einen weltweiten Rechenzentrums-Verbrauch von rund 945 Terawattstunden, fast doppelt so viel wie 2024. Neue Rechenzentren in Deutschland müssen ab Juli 2026 einen PUE-Wert von höchstens 1,2 erreichen. Effizientere Inferenz-Chips dämpfen die Last, doch die größten deutschen Rechenzentren zeigen, dass der Hunger nach Fläche und Strom bleibt.

Prüfen Sie deshalb bei jedem KI-Projekt nicht nur die Modellqualität, sondern auch die Betriebskosten pro Anfrage und die Herkunft der Hardware. Verhandeln Sie konkrete Konditionen für Inferenz, klären Sie Datenstandort und Ausweichoptionen und behalten Sie europäische KI-Fabriken wie HammerHAI in Stuttgart im Blick. So bleiben Sie handlungsfähig, falls sich Preise verschieben.