Google sedang mengembangkan Gemini AI-nya dari alat yang hanya “menampilkan” gambar menjadi alat yang “menunjukkan” proses yang kompleks. Pembaruan baru memungkinkan chatbot menghasilkan visualisasi interaktif dan dinamis langsung dalam antarmuka obrolan, melampaui batasan citra statis.
Dari Gambar Statis ke Simulasi Dinamis
Sebelumnya, ketika pengguna meminta Gemini untuk memvisualisasikan sebuah konsep, AI akan mengandalkan kemampuan menghasilkan gambar untuk menghasilkan satu gambar yang tidak bergerak. Meskipun berguna untuk tujuan artistik, gambar statis sering kali gagal menjelaskan bagaimana benda bergerak, berubah, atau berfungsi seiring waktu.
Dengan fitur baru ini, Gemini dapat membuat simulasi yang dapat dimanipulasi oleh pengguna. Daripada hanya melihat gambar sebuah konsep, pengguna dapat terlibat dengannya. Hal ini dicapai melalui alur kerja tertentu:
1. Pengguna meminta Gemini untuk “menunjukkan” atau “membantu saya memvisualisasikan” topik tertentu.
2. Tombol berlabel “tunjukkan visualisasinya” muncul di obrolan.
3. Mengklik tombol menghasilkan model yang dinamis dan interaktif.
Fungsi Praktis: Memindahkan Bagian dan Kontrol
Pengujian awal fitur ini mengungkapkan bahwa visualisasi ini bukan sekadar animasi sederhana, namun model fungsional dengan parameter yang dikontrol pengguna.
Misalnya, saat memvisualisasikan mekanika langit (seperti orbit Bulan mengelilingi Bumi), alat ini menyediakan penggeser yang memungkinkan pengguna menyesuaikan kecepatan orbit dan mengubah sudut pandang. Demikian pula, saat menjelaskan proses mekanis (seperti cara kerja bagian dalam mesin mobil), antarmuka memungkinkan pengguna memutar animasi atau menelusuri setiap tahap siklus secara manual.
Kemampuan ini mengubah AI dari responden pasif menjadi alat pendidikan aktif, sehingga jauh lebih efektif untuk menjelaskan fisika, teknik, atau biologi.
Lanskap Kompetitif: Gemini vs. Claude
Google bukanlah yang pertama bergerak ke arah ini. Pada bulan Maret, Anthropic memperkenalkan kemampuan serupa untuk Claude AI, yang juga membuat pengguna terkesan dengan kemampuannya dalam mewujudkan ide-ide kompleks.
Namun, ada kesenjangan fungsional yang mencolok antara keduanya:
– Claude saat ini memungkinkan pengguna menyimpan visual yang dihasilkan untuk digunakan nanti.
– Gemini saat ini tidak memiliki mekanisme untuk menyimpan atau mengekspor simulasi interaktif ini.
Ketika persaingan untuk mendapatkan AI “multimodal”—AI yang dapat memproses dan membuat teks, gambar, video, dan data interaktif—meningkat, kemampuan untuk menyimpan dan meninjau kembali alat bantu visual yang kompleks ini kemungkinan besar akan menjadi pembeda yang penting.
Ketersediaan dan Persyaratan Teknis
Peluncuran fitur ini sedang berlangsung secara global, namun ada batasan khusus yang perlu diperhatikan:
– Persyaratan Model: Visualisasi hanya dihasilkan saat menggunakan model Gemini Pro.
– Batasan Akun: Fitur ini saat ini tidak tersedia untuk akun Google Workspace atau Education.
Meskipun fitur ini menandai langkah signifikan menuju pembelajaran berbasis AI yang lebih intuitif, kegunaan jangka panjangnya akan bergantung pada apakah Google dapat memperluas kompleksitasnya dan menambahkan kemampuan untuk menyimpan sesi interaktif ini.
Singkatnya, fitur interaktif baru Google mengubah Gemini dari pembuat teks dan gambar menjadi alat simulasi fungsional, meskipun saat ini fitur tersebut tertinggal dari pesaing dalam hal manajemen file dan kemampuan menyimpan.














































