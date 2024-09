Google hat gestern (6.12.2023) Gemini vorgestellt, eine KI, die direkt in Google-Apps integriert wird und als Konkurrent von GPT-4 gilt.

The capabilities of multimodal AI | Gemini Demo

Dieses Video auf YouTube ansehen

Diese Entwicklung ist bemerkenswert, da Gemini multimodal ist und Bilder erkennen sowie in Echtzeit sprechen kann. Das Ultra-Modell von Gemini ist das erste KI-Modell, das in der Lage ist, menschliche Experten in einem spezifischen Leistungstest, dem MMLU-Benchmark (Multimodal Multi-Task Language Understanding), zu übertreffen.

Dabei erreicht dieses Modell eine Genauigkeit von 90%. Dies zeigt, dass das Ultra-Modell von Gemini in der Lage ist, Aufgaben im Bereich des Sprachverständnisses und der Problemlösung besser zu bewältigen als menschliche Experten, was durchaus bahnbrechenden Charakter hat.

In drei Modellen verfügbar

Die drei Modelle von Gemini sind für unterschiedliche Aufgaben konzipiert:

Ultra : Konzipiert für komplexe Aufgaben wie Mathe- und Physikaufgaben sowie Programmierung , ist das Ultra-Modell das größte und leistungsstärkste Modell von Gemini.

: Konzipiert für komplexe Aufgaben wie sowie , ist das Ultra-Modell das größte und leistungsstärkste Modell von Gemini. Pro : Geeignet für eine breite Palette von Aufgaben, ist das Pro-Modell kleiner und leistungsfähiger als das Ultra-Modell, aber immer noch fähig, komplexe Aufgaben zu bewältigen.

: Geeignet für eine breite Palette von Aufgaben, ist das Pro-Modell kleiner und leistungsfähiger als das Ultra-Modell, aber immer noch fähig, komplexe Aufgaben zu bewältigen. Nano: Entwickelt für effiziente Aufgaben direkt auf Geräten, ist das Nano-Modell das kleinste und am wenigsten leistungsstarke Modell, aber dennoch fähig, grundlegende Aufgaben zu erledigen.

Gemini Pro wird kostenlos in Bard und anderen Google-Apps angeboten, allerdings noch nicht in der EU. Gemini Nano wird für generative KI-Funktionen auf dem Pixel 8 Pro verwendet und bietet Funktionen wie Zusammenfassungen im Recorder, Smart Reply in Gboard, fortschrittliche Video- und Bildbearbeitung.

Jedoch noch nicht in der EU verfügbar

Einziger, nicht ganz unwesentlicher Wehrmutstropfen: Google Gemini steht noch nicht in der EU zur Verfügung. Es gab zunächst widersprüchliche Berichte darüber, dass Gemini Pro angeblich bereits über den Chatbot Google Bard zur Verfügung stehen würde.

Einen einfachen Rechentest hat Google Bard heute (7.12.2023) nicht bestanden:

Wer also Gemini benutzen möchte, muss sich also wohl einen VPN besorgen. Als Alternative kann man auch weiterhin ChatGPT benutzen, das dieselbe Aufgabe richtig gelöst hat:

Was kann Gemini denn alles?

Gemini zeichnet sich durch seine Fähigkeit aus, Text, Bilder und Sprache zu integrieren und zu verstehen. Dies eröffnet ihm Möglichkeiten in verschiedenen Bereichen wie Sprachübersetzung, Erstellung kreativer Inhalte und Beantwortung komplexer Fragen. So kann Gemini Text und Bilder kombinieren, sowie Fragen beantworten, die sowohl visuelle als auch textuelle Elemente beinhalten.

Durch seine Fähigkeit, komplexe Probleme zu lösen und Schlussfolgerungen zu ziehen, ist Gemini in der Lage, eine Vielzahl von Aufgaben zu bewältigen. Dazu gehören das Lösen von Physikaufgaben, das Schreiben von Code und das Treffen fundierter Entscheidungen. Hier einige Beispiele:

Programmierung

Durch seine Kompetenz im Schreiben und Verstehen von Code kann Gemini Aufgaben in der Softwareentwicklung, beim Programmieren von Robotern und beim Webdesign übernehmen.

Im Folgenden sehen wir mehrere Beispiele im Bereich Software-Programmierung:

Using AI to solve complex problems | Gemini

Dieses Video auf YouTube ansehen

Mathe & Physik

Gemini ist auch in der Mathematik versiert, was ihm ermöglicht, Aufgaben wie das Lösen von Physikaufgaben, das Programmieren und das Durchführen statistischer Berechnungen zu meistern.

Im folgenden sehen wir die Lösung verschiedener mathematischer und physikalischer Probleme:

Math & physics with AI | Gemini

Dieses Video auf YouTube ansehen

Wissenschaftliches Arbeiten

Gemini besitzt die Fähigkeit, Forschungsergebnisse aus einer Vielzahl wissenschaftlicher Arbeiten zu extrahieren und zu nutzen. Dies befähigt es zur Entwicklung neuer Technologien, zum Verständnis komplexer wissenschaftlicher Konzepte und zum Verfassen wissenschaftlicher Artikel:

This is changing the way scientists research | Gemini

Dieses Video auf YouTube ansehen

Fazit

Die Entwicklung von Google Gemini markiert einen Meilenstein in der Welt der künstlichen Intelligenz. Es zeigt, wie KI-Technologie zunehmend in alltägliche Anwendungen integriert wird, um Aufgaben zu vereinfachen und zu verbessern. Mit seinen fortschrittlichen Fähigkeiten in verschiedenen Bereichen setzt Gemini neue Maßstäbe für die Leistungsfähigkeit und Vielseitigkeit von KI-Modellen.

Quellen:

Google Blog Post

Googles Landing Page für Gemini