Ein KI-Modell hat in 57 Open-Source-Projekten elf echte Fehler aufgespürt, fünf davon standen bei GitHub noch nirgends. Mistral nennt sein neues Werkzeug Leanstral 1.5 und stellt es unter Apache-2.0-Lizenz frei zur Verfügung. Ein europäischer Anbieter liefert damit maschinell prüfbare Korrektheit für kritischen Code, ohne Lizenzbindung an US-Konzerne.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

587 von 672 Aufgaben aus dem Mathematik-Wettbewerb PutnamBench löst das Modell laut Mistral zu Kosten von rund 3,50 € je Aufgabe. Ein konkurrierendes System kostet für dieselbe Klasse an Beweisen nach Anbieterangaben ein Vielfaches. Diese Zahlen stammen aus Mistrals eigener Veröffentlichung vom 2. Juli 2026.

Das Wichtigste in Kürze

  • Leanstral 1.5 prüft mathematische Beweise und Programmcode maschinell gegen den Beweisassistenten Lean 4, statt Antworten nur zu raten.
  • Das Modell arbeitet als Mixture-of-Experts mit 119 Milliarden Parametern, von denen nur rund 6 Milliarden je Rechenschritt aktiv sind.
  • In einem Praxistest fand Leanstral 1.5 elf echte Fehler in 57 Repositorys, darunter fünf bislang unbekannte.
  • Lizenz Apache-2.0, verfügbar über Hugging Face und eine kostenlose Programmierschnittstelle: keine Lizenzbindung an einen US-Anbieter.

Was macht Leanstral 1.5 anders als ein normales KI-Modell?

Stempel und Papier mit Prägung „Beweisbar korrekt“ und Häkchen auf weißem Grund
Leanstral 1.5 konstruiert Beweise durch Echtzeit-Kommunikation mit dem Lean-4-Compiler, der jeden Schritt überprüft und falsche Lösungen sofort erkennt

Leanstral 1.5 baut Beweise im Dialog mit dem Lean-4-Compiler auf, statt Code nur zu imitieren. Jeder Beweisschritt wird maschinell geprüft, bevor das Modell weitermacht. Halluzinierte Lösungen fallen so sofort durch.

Generalistische Sprachmodelle erzeugen Text, der wie Lean-Code aussieht, aber nicht zwingend korrekt ist. Leanstral spricht dagegen über das Model Context Protocol direkt mit dem Compiler und erhält nach jedem Schritt eine harte Rückmeldung. Diese Rückkopplung unterscheidet ein Beweiswerkzeug von einem Vervollständiger.

Trainiert wurde das Modell laut Mistral mit einem Verfahren namens CISPO über zwei Umgebungen, eine für mehrstufiges Beweisen und eine für autonome Dateiarbeit im Projekt. Wer bereits gesehen hat, dass KI-Agenten im Senior-SWE-Bench mit erfahrenen Entwicklern mithalten, erkennt hier die nächste Stufe: nicht mehr plausibler Code, sondern beweisbar korrekter Code.

Leanstral 1.5 in Zahlen
Formale Verifikation von Mistral: Was das offene Beweismodell laut Anbieter leistet

587/672
geloeste PutnamBench-Aufgaben

6 Mrd.
aktive Parameter je Schritt (von 119 Mrd. gesamt)

11
echte Fehler in 57 Repositorys, 5 davon neu

~3,50 €
Kosten je geloester Aufgabe

Kosten je Aufgabe: Leanstral 1.5 gegen Wettbewerber (Schaetzung laut Anbieter)

Leanstral 1.5
~3,50 €
Seed-Prover (hoch)
~260 € oder mehr
Werte gerundet und aus USD umgerechnet. Mistral ist nicht boersennotiert, die Angaben stammen aus der Herstellerveroeffentlichung.

Warum ist formale Verifikation für KMU plötzlich bezahlbar?

Formale Verifikation prüft jeden logischen Schritt einer Software oder eines Beweises mechanisch durch. Bislang war das teuer und Spezialisten vorbehalten. Leanstral 1.5 senkt die Kosten laut Mistral auf rund 3,50 € je Aufgabe.

Bisher kostete diese Art der Absicherung so viel Rechenzeit, dass sie sich nur für Luft- und Raumfahrt oder Chipdesign lohnte. Der Wettbewerber Seed-Prover kommt in seiner starken Einstellung nach Anbieterangaben auf geschätzt 260 € oder mehr je Aufgabe. Für ein KMU war das unerreichbar.

Der Praxistest zeigt den Nutzen ohne Mathematik-Umweg: In einer Bibliothek für Zahlencodierung stieß das Modell auf einen Überlauf in der Vorzeichenfunktion, der im Debug-Modus abstürzte und im Betrieb stille Datenfehler verursachte. Solche Fehler entgehen dem klassischen Testen. Wer die Debatte um KI-generierten Code in Open-Source-Projekten verfolgt oder gelesen hat, dass Entwickler mit KI teils langsamer werden, findet hier ein Gegenmittel: eine Instanz, die Korrektheit mechanisch nachweist statt sie zu behaupten.

Was bedeutet ein europäisches Beweismodell für DACH-Unternehmen?

Mistral sitzt in Frankreich und unterliegt damit voll dem EU-Rechtsrahmen. Für DACH-Unternehmen bedeutet die Apache-2.0-Lizenz: eigener Betrieb möglich, keine Datenabflüsse an US-Server, klare Einordnung unter dem EU AI Act.

Der EU AI Act stuft Software mit hohem Schadenspotenzial als Hochrisiko ein und verlangt nachweisbare Robustheit. Ein Werkzeug, das Korrektheit formal belegt, liefert genau die Art von Dokumentation, die Prüfer sehen wollen. Zugleich erleichtert der offene Betrieb die Einhaltung der DSGVO, weil sensible Repositorys das eigene Netz nicht verlassen müssen.

Die frei nutzbaren Gewichte reihen sich in eine Entwicklung ein, in der auch offene Codemodelle wie Kimi K2.7 in Standardwerkzeuge einziehen und selbst die US-Regierung Modelle freigibt. Für die eigene Roadmap heißt das: erst prüfen, ob ein souveräner europäischer Baustein passt, bevor die Abhängigkeit von einem US-Anbieter wächst.

Mehr Newshunger?

4,2 21 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?