Google vyvíjí svou AI Gemini a přeměňuje ji z nástroje, který jednoduše „ukazuje“ obrázky, na systém, který „demonstruje“ složité procesy. Nová aktualizace umožňuje chatbotovi vytvářet interaktivní dynamické vizualizace přímo v rozhraní chatu, čímž překonává omezení statických obrázků.
Od statických obrázků po dynamické simulace
Dříve, když uživatelé požádali Gemini o vizualizaci konceptu, AI spoléhala na své schopnosti generování obrázků, aby vytvořila jeden statický obrázek. To je užitečné pro umělecké účely, ale statika často nedokáže vysvětlit, jak se objekty pohybují, mění nebo fungují v průběhu času.
S novou funkcí mohou Gemini vytvářet simulace, které mohou uživatelé ovládat. Namísto pouhého prohlížení obrázku s ním mohou uživatelé pracovat. To se děje podle následujícího algoritmu:
1. Uživatel požádá Blížence, aby „ukázali“ nebo „pomohli vizualizovat“ konkrétní téma.
2. V chatu se objeví tlačítko s nápisem “zobrazit vizualizaci” (ukaž mi vizualizaci ).
3. Když kliknete na tlačítko, vygeneruje se dynamický interaktivní model.
Praktická funkčnost: pohyblivé části a ovládací prvky
První testy funkce ukazují, že tyto vizualizace nejsou jen jednoduché animace, ale funkční modely s parametry, které může uživatel ovládat.
Například při vizualizaci nebeské mechaniky (jako je oběžná dráha Měsíce kolem Země) nástroj poskytuje posuvníky, které umožňují upravit rychlost oběhu a změnit úhel pohledu. Podobně při vysvětlování mechanických procesů (jako je vnitřní fungování motoru automobilu) vám rozhraní umožňuje spouštět animace nebo ručně procházet každý krok cyklu.
Tato schopnost přeměňuje umělou inteligenci z pasivního odpovídače na aktivní vzdělávací nástroj, díky čemuž je mnohem efektivnější při vysvětlování fyziky, inženýrství nebo biologie.
Konkurenční krajina: Blíženci vs Claude
Google není první, kdo se tímto směrem vydal. V březnu společnost Anthropic představila podobné funkce pro svou Claude AI, která také zapůsobila na uživatele svou schopností vizualizovat složité nápady.
Mezi nimi je však znatelný funkční rozdíl:
– Claude v současné době umožňuje uživatelům ukládat vytvořené vizuály pro pozdější použití.
– Gemini zatím nemá mechanismus pro ukládání nebo export těchto interaktivních simulací.
Jak se závod o „multimodální“ AI – AI schopnou zpracovávat a vytvářet text, obrázky, video a interaktivní data – zintenzivňuje, schopnost ukládat a vracet se k těmto komplexním vizuálním pomůckám se pravděpodobně stane kritickým konkurenčním faktorem.
Dostupnost a technické požadavky
Zavádění této funkce v současné době probíhá po celém světě, ale je třeba si uvědomit určitá omezení:
– Požadavek na model: Vizualizace se vytváří pouze při použití modelu Gemini Pro.
– Omezení účtu: Funkce momentálně není dostupná pro účty Google Workspace nebo Education.
I když je tato funkce významným krokem k intuitivnějšímu učení s umělou inteligencí, její dlouhodobá užitečnost bude záviset na tom, zda Google dokáže svým modelům přidat složitost a přidat možnost ukládat tyto interaktivní relace.
Abych to shrnul: Nová interaktivní funkce Google přeměňuje Gemini z generátoru textu a obrázků na plnohodnotný modelovací nástroj, i když v současnosti poněkud zaostává za konkurencí, pokud jde o správu souborů a ukládání dat.











































