Gamechanger Google Gemini
Google hat gestern (6.12.2023) Gemini vorgestellt, eine KI, die direkt in Google-Apps integriert wird und als Konkurrent von GPT-4 gilt.
Diese Entwicklung ist bemerkenswert, da Gemini multimodal ist und Bilder erkennen sowie in Echtzeit sprechen kann. Das Ultra-Modell von Gemini ist das erste KI-Modell, das in der Lage ist, menschliche Experten in einem spezifischen Leistungstest, dem MMLU-Benchmark (Multimodal Multi-Task Language Understanding), zu übertreffen.
Dabei erreicht dieses Modell eine Genauigkeit von 90%. Dies zeigt, dass das Ultra-Modell von Gemini in der Lage ist, Aufgaben im Bereich des Sprachverständnisses und der Problemlösung besser zu bewältigen als menschliche Experten, was durchaus bahnbrechenden Charakter hat.
In drei Modellen verfügbar
Die drei Modelle von Gemini sind für unterschiedliche Aufgaben konzipiert:
- Ultra: Konzipiert für komplexe Aufgaben wie Mathe- und Physikaufgaben sowie Programmierung, ist das Ultra-Modell das größte und leistungsstärkste Modell von Gemini.
- Pro: Geeignet für eine breite Palette von Aufgaben, ist das Pro-Modell kleiner und leistungsfähiger als das Ultra-Modell, aber immer noch fähig, komplexe Aufgaben zu bewältigen.
- Nano: Entwickelt für effiziente Aufgaben direkt auf Geräten, ist das Nano-Modell das kleinste und am wenigsten leistungsstarke Modell, aber dennoch fähig, grundlegende Aufgaben zu erledigen.
Gemini Pro wird kostenlos in Bard und anderen Google-Apps angeboten, allerdings noch nicht in der EU. Gemini Nano wird für generative KI-Funktionen auf dem Pixel 8 Pro verwendet und bietet Funktionen wie Zusammenfassungen im Recorder, Smart Reply in Gboard, fortschrittliche Video- und Bildbearbeitung.
Jedoch noch nicht in der EU verfügbar
Einziger, nicht ganz unwesentlicher Wehrmutstropfen: Google Gemini steht noch nicht in der EU zur Verfügung. Es gab zunächst widersprüchliche Berichte darüber, dass Gemini Pro angeblich bereits über den Chatbot Google Bard zur Verfügung stehen würde.
Einen einfachen Rechentest hat Google Bard heute (7.12.2023) nicht bestanden:
Wer also Gemini benutzen möchte, muss sich also wohl einen VPN besorgen. Als Alternative kann man auch weiterhin ChatGPT benutzen, das dieselbe Aufgabe richtig gelöst hat:
Was kann Gemini denn alles?
Gemini zeichnet sich durch seine Fähigkeit aus, Text, Bilder und Sprache zu integrieren und zu verstehen. Dies eröffnet ihm Möglichkeiten in verschiedenen Bereichen wie Sprachübersetzung, Erstellung kreativer Inhalte und Beantwortung komplexer Fragen. So kann Gemini Text und Bilder kombinieren, sowie Fragen beantworten, die sowohl visuelle als auch textuelle Elemente beinhalten.
Durch seine Fähigkeit, komplexe Probleme zu lösen und Schlussfolgerungen zu ziehen, ist Gemini in der Lage, eine Vielzahl von Aufgaben zu bewältigen. Dazu gehören das Lösen von Physikaufgaben, das Schreiben von Code und das Treffen fundierter Entscheidungen. Hier einige Beispiele:
Programmierung
Durch seine Kompetenz im Schreiben und Verstehen von Code kann Gemini Aufgaben in der Softwareentwicklung, beim Programmieren von Robotern und beim Webdesign übernehmen.
Im Folgenden sehen wir mehrere Beispiele im Bereich Software-Programmierung:
Mathe & Physik
Gemini ist auch in der Mathematik versiert, was ihm ermöglicht, Aufgaben wie das Lösen von Physikaufgaben, das Programmieren und das Durchführen statistischer Berechnungen zu meistern.
Im folgenden sehen wir die Lösung verschiedener mathematischer und physikalischer Probleme:
Wissenschaftliches Arbeiten
Gemini besitzt die Fähigkeit, Forschungsergebnisse aus einer Vielzahl wissenschaftlicher Arbeiten zu extrahieren und zu nutzen. Dies befähigt es zur Entwicklung neuer Technologien, zum Verständnis komplexer wissenschaftlicher Konzepte und zum Verfassen wissenschaftlicher Artikel:
Fazit
Die Entwicklung von Google Gemini markiert einen Meilenstein in der Welt der künstlichen Intelligenz. Es zeigt, wie KI-Technologie zunehmend in alltägliche Anwendungen integriert wird, um Aufgaben zu vereinfachen und zu verbessern. Mit seinen fortschrittlichen Fähigkeiten in verschiedenen Bereichen setzt Gemini neue Maßstäbe für die Leistungsfähigkeit und Vielseitigkeit von KI-Modellen.
Nicht schön: Durch simple Texteingaben haben sie dabei getrickst. 😉
Nicht schön: Durch simple Texteingaben haben sie dabei getrickst. 😉
Ja, habe ich auch im Nachhinein via Twitter (X) erfahren. Zumindest haben Sie wohl Gemini nur statische Bilder gezeigt, was wiederum auch nicht mit einer Stimme geantwortet hat, sondern nur über eine schnöde Textausgabe.
Die Beispiele zu Programmierung & Co. finde ich dennoch sehr beeindruckend.
Ja, habe ich auch im Nachhinein via Twitter (X) erfahren. Zumindest haben Sie wohl Gemini nur statische Bilder gezeigt, was wiederum auch nicht mit einer Stimme geantwortet hat, sondern nur über eine schnöde Textausgabe.
Die Beispiele zu Programmierung & Co. finde ich dennoch sehr beeindruckend.