AMD hat am 20. Mai 2026 die Ryzen AI Halo Plattform und die neuen Ryzen AI Max Pro 400 Prozessoren vorgestellt. Das Spitzenmodell trägt 16 Zen-5-Kerne, 40 RDNA-3.5-Grafikeinheiten, bis zu 192 Gigabyte vereinheitlichten Arbeitsspeicher und kann bis zu 160 Gigabyte davon als Grafik-RAM nutzen.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenDamit läuft erstmals auf einer x86-Plattform ein Sprachmodell mit 200 Milliarden Parametern lokal. Für deutsche Mittelständler, die wegen DSGVO, EU-AI-Act und Datensouveränität nicht in eine US-Cloud wollen, ist das eine harte Veränderung der Optionen. Lokale KI war bisher Bastelthema. Mit Ryzen AI Halo wird sie zur Workstation-Frage.
Kommt Ihnen das bekannt vor? Sie haben einen KI-Workflow gebaut, der gut funktioniert, aber Sie schicken Kunden- oder Mitarbeiterdaten zu einem US-Anbieter. Der Datenschutzbeauftragte stellt jeden zweiten Monat die gleiche Frage. Die Datenschutzfolgenabschätzung wird länger. Und die Buchhaltung klagt über schwankende Token-Kosten.
- AMD Ryzen AI Halo läuft mit dem aktuellen Ryzen AI Max+ 395, die nächste Generation mit Max+ Pro 495 folgt im dritten Quartal 2026.
- Vorbestellungen für das Halo-Developer-Kit starten im Juni 2026 exklusiv über Micro Center für rund 3.999 US-Dollar.
- Die Ryzen AI Max Pro 400 Serie unterstützt bis zu 192 Gigabyte Arbeitsspeicher, davon bis zu 160 Gigabyte als VRAM.
- Die neuropsychische Recheneinheit erreicht laut AMD bis zu 55 TOPS NPU-Leistung.
- HP und Lenovo sind als erste OEM-Partner bestätigt, ihre Systeme starten im dritten Quartal 2026.
Was kann die Plattform konkret?

Die offizielle AMD-Ankündigung beschreibt zwei Produkte. Das Ryzen AI Halo Developer Kit ist ein kompakter Mini-PC, gedacht für lokale Entwicklung agentischer KI-Anwendungen. Mit bis zu 128 Gigabyte vereinheitlichtem Speicher in der Erstauflage und Modellen bis 200 Milliarden Parametern positioniert es sich als europäische Antwort auf Apples Mac Mini Pro und Nvidias DGX Spark. Im dritten Quartal 2026 wird das Kit mit dem neuen Max+ Pro 495 und 192 Gigabyte aufgerüstet.
Die Ryzen AI Max Pro 400 Serie ist die Hardware-Basis für sogenannte „Agent Computers“ in OEM-Systemen. HP und Lenovo bringen ab dem dritten Quartal 2026 Workstations und Business-Laptops mit den neuen Prozessoren. Das Spitzenmodell Ryzen AI Max+ Pro 495 hat 16 Zen-5-Kerne mit Basistakt 3,1 und Boost-Takt 5 Gigahertz, 80 Megabyte Cache und eine konfigurierbare Leistungsaufnahme zwischen 45 und 120 Watt.
Drei Eckpunkte verändern die lokale KI-Rechnung. Die NPU liefert 55 TOPS, der vereinheitlichte Speicher erlaubt Modelle, die bisher nur auf Server-GPUs liefen. Und der Preis bleibt auf Mini-PC-Niveau.
Für die Praxis heißt das: Ein Werkstattcomputer, der ein eigenes Sprachmodell hostet, statt jede Anfrage an einen US-Cloud-Dienst zu schicken. Das ist nicht nur eine Datenschutz-Frage. Es ist eine wirtschaftliche Verschiebung, weil die Token-Kosten der Cloud-LLMs eliminiert sind.
Was bedeutet das für deutsche KMU mit Daten-Souveränitäts-Anspruch?

Drei Use-Cases werden für DACH-Mittelständler in den nächsten zwölf Monaten praktikabel. Erstens lokale Document Intelligence. Eine Anwaltskanzlei oder Steuerberatung kann Verträge, Mandantenakten und Mails durch ein lokales LLM laufen lassen, ohne dass Informationen das Bürogebäude verlassen.
Zweitens domänenspezifische Code-Assistenten. Eine Softwareschmiede kann auf eigenen Repositories ein lokales Coding-Modell hosten, das keine Trainingsdaten zu OpenAI oder Anthropic schickt.
Drittens KI-gestütztes ERP- und CRM-Tooling, bei dem Kundendaten in geschlossenen Systemen bleiben.
Das verbindet sich direkt mit der DSGVO-Lage, dem EU-AI-Act und der NIS2-Pflicht zum Risikomanagement. Wer heute KI-Funktionen in Produktion bringt, muss die Datenverarbeitung dokumentieren, Subunternehmer benennen, Drittlandtransfers begründen. Eine lokale KI-Lösung reduziert diese Pflichten dramatisch. Sie ist die saubere Antwort auf die Compliance-Frage, die im Audit ohnehin kommt.
Lokal heißt nicht primitiv. Ein 200-Milliarden-Modell auf einem Workplace-Mini-PC ist 2026 das, was 2023 noch ein Datacenter-Rack gebraucht hätte. Wer im deutschen Mittelstand seinen Datenschutzbeauftragten regelmäßig Kopfschmerzen bereitet, sollte die Ryzen-AI-Halo-Roadmap auf die IT-Agenda 2026 setzen. Souveräne KI ist keine Vision mehr — sie ist ein Bestellvorgang.
— Michael Dobler, Herausgeber Dr. Web
Wann macht der Wechsel auf lokale KI Sinn?

Vier Kriterien helfen bei der Entscheidung.
Erstens das Datenvolumen: Wer monatlich mehr als 500 Euro für Cloud-LLM-Token bezahlt, amortisiert eine Workstation für 3.999 US-Dollar in unter zwölf Monaten.
Zweitens die Datensensibilität: Branche, Mandantengeheimnis, Berufsgeheimnis, Tariftransparenz – wo die Cloud schwer zu rechtfertigen ist, gewinnt lokal.
Drittens die Modellgröße: Wer mit Modellen unter 30 Milliarden Parametern arbeitet, kann auch günstigere Lösungen wählen. Wer 70 bis 200 Milliarden Parameter ausfahren will, braucht die Halo-Klasse.
Viertens die Latenz: Lokale Inferenz reagiert schneller, weil der Netzwerkweg entfällt.
Die Kehrseite: AMD Ryzen AI Halo ist Hardware. Software-Komplexität, Modellpflege, Update-Zyklen und Sicherheit liegen beim Käufer. Hier braucht es entweder Inhouse-Kompetenz oder einen DACH-Dienstleister, der den Workstation-Stack als Managed Service anbietet. Diese Anbieter entstehen gerade, sind aber noch nicht flächendeckend verfügbar.
Mehr aus dem KI- und Infrastruktur-Cluster

Die Frage nach souveräner KI zieht sich durch unsere Berichterstattung. Unser Bericht zu Mistrals Warnung vor US-KI ordnet die geopolitische Dimension ein. Unser Beitrag zur Bitkom-KI-Studie 2026 zeigt, wo deutsche Unternehmen heute mit KI stehen. Unsere Recherche zu den verschobenen EU-KI-Fristen ordnet die regulatorische Lage ein. Und der Bericht zur Bundes-KI-Wahl BfV nimmt ArgonOS statt Palantir zeigt, wie deutsche Behörden Souveränität gerade konkret umsetzen.
Für die Infrastruktur-Seite helfen drei weitere Anker. Unser Ranking der 15 größten Rechenzentren Deutschlands zeigt, wo die Cloud-Alternative geographisch sitzt. Der WordPress Hosting Vergleich 2026 ergänzt die Server-Frage für Website-Workloads. Und der Beitrag zum Selbstständigen-Gehalt 2026 ordnet ein, ob sich die Investition in lokale KI für Solo-Tätige rechnet.
Was wir konkret empfehlen

IT-Verantwortliche im Mittelstand sollten die Ryzen-AI-Halo-Roadmap in den Investitionsplan für das vierte Quartal 2026 aufnehmen. Bis dahin lohnt ein realistischer Vergleich zwischen Cloud-Token-Kosten der letzten zwölf Monate und einer Halo-basierten Workstation.
Wer dem Datenschutzbeauftragten regelmäßig erklären muss, warum Daten in Drittländer fließen, sollte die Computex-Ankündigung Ende Mai im Auge behalten. Dort liefert AMD die finalen Spezifikationen und Preise der OEM-Systeme von HP und Lenovo.