Google entwickelt seine Gemini-KI von einem Tool, das lediglich Bilder „zeigt“, zu einem Tool, das komplexe Prozesse „demonstriert“. Ein neues Update ermöglicht es dem Chatbot, interaktive, dynamische Visualisierungen direkt in der Chat-Oberfläche zu generieren und geht damit über die Einschränkungen statischer Bilder hinaus.
Von statischen Bildern zu dynamischen Simulationen
Wenn Benutzer Gemini bisher aufforderten, ein Konzept zu visualisieren, verließ sich die KI auf ihre Bilderzeugungsfähigkeiten, um ein einzelnes, unbewegtes Bild zu erzeugen. Obwohl statische Bilder für künstlerische Zwecke nützlich sind, können sie oft nicht erklären, wie sich Dinge im Laufe der Zeit bewegen, verändern oder funktionieren.
Mit dieser neuen Funktion kann Gemini Simulationen erstellen, die Benutzer manipulieren können. Anstatt nur ein Bild eines Konzepts anzusehen, können Benutzer sich damit beschäftigen. Dies wird durch einen spezifischen Workflow erreicht:
1. Der Benutzer bittet Gemini, mir ein bestimmtes Thema zu „zeigen“ oder „mir bei der Visualisierung zu helfen“.
2. Im Chat wird eine Schaltfläche mit der Bezeichnung „Zeige mir die Visualisierung“ angezeigt.
3. Durch Klicken auf die Schaltfläche wird ein dynamisches, interaktives Modell generiert.
Praktische Funktionalität: Bewegliche Teile und Bedienelemente
Erste Tests der Funktion zeigen, dass es sich bei diesen Visualisierungen nicht nur um einfache Animationen, sondern um Funktionsmodelle mit benutzergesteuerten Parametern handelt.
Wenn Sie beispielsweise Himmelsmechanik (wie die Umlaufbahn des Mondes um die Erde) visualisieren, bietet das Tool Schieberegler, mit denen Benutzer die Geschwindigkeit der Umlaufbahn anpassen und den Betrachtungswinkel ändern können. Ähnlich verhält es sich mit der Erklärung mechanischer Prozesse (z. B. des Innenlebens eines Automotors): Über die Benutzeroberfläche können Benutzer die Animation abspielen oder die einzelnen Phasen des Zyklus manuell durchlaufen.
Diese Fähigkeit verwandelt die KI von einem passiven Antwortgeber in ein aktives Lehrmittel und macht sie so viel effektiver für die Erklärung von Physik, Ingenieurwesen oder Biologie.
Die Wettbewerbslandschaft: Zwillinge vs. Claude
Google ist nicht der Erste, der in diese Richtung geht. Im März führte Anthropic ähnliche Funktionen für seine Claude AI ein, die Benutzer auch durch ihre Fähigkeit, komplexe Ideen darzustellen, beeindruckte.
Es besteht jedoch eine bemerkenswerte funktionale Lücke zwischen den beiden:
– Claude ermöglicht Benutzern derzeit, ihre generierten Visuals zur späteren Verwendung zu speichern.
– Gemini verfügt derzeit nicht über einen Mechanismus zum Speichern oder Exportieren dieser interaktiven Simulationen.
Da sich der Wettlauf um „multimodale“ KI – KI, die Text, Bilder, Videos und interaktive Daten verarbeiten und erstellen kann – intensiviert, wird die Fähigkeit, diese komplexen visuellen Hilfsmittel beizubehalten und erneut zu betrachten, wahrscheinlich zu einem entscheidenden Unterscheidungsmerkmal werden.
Verfügbarkeit und technische Anforderungen
Die Einführung dieser Funktion ist derzeit weltweit im Gange, es sind jedoch bestimmte Einschränkungen zu beachten:
– Modellanforderung: Visualisierungen werden nur generiert, wenn das Modell Gemini Pro verwendet wird.
– Kontoeinschränkungen: Die Funktion ist derzeit für Google Workspace – oder Education -Konten nicht verfügbar.
Während die Funktion einen bedeutenden Schritt hin zu einem intuitiveren KI-gesteuerten Lernen darstellt, hängt ihr langfristiger Nutzen davon ab, ob Google seine Komplexität erweitern und die Möglichkeit hinzufügen kann, diese interaktiven Sitzungen zu speichern.
Zusammenfassend lässt sich sagen, dass Gemini durch die neue interaktive Funktion von Google von einem Text- und Bildgenerator zu einem funktionalen Simulationstool wird, obwohl es derzeit in Bezug auf Dateiverwaltung und Speicherfunktionen hinter der Konkurrenz zurückbleibt.













































