– Perusahaan teknologi raksasa Google memperkenalkan model AI terbuka
(open source)
terbarunya, bernama Gemma 3 pada Rabu (12/3/2025).
Gemma 3 hadir sebagai model AI
open source
Google yang lebih canggih dari pendahulunya, Gemma 2B dan Gemma 7B yang debut pada Februari 2024.
“Hari ini, kami memperkenalkan Gemma 3, koleksi model terbuka yang ringan dan canggih yang dibuat dari penelitian dan teknologi yang sama yang mendukung model Gemini 2.0 kami,” kata VP Research Google DeepMind. Clement Farabet di blog resmi Google.
Sebagai model terbaru, Gemma 3 menawarkan keunggulan dalam efisiensi komputasi, dukungan multibahasa, kemampuan memahami berbagai jenis data (teks, gambar, video), dan kapasitas pemrosesan teks yang lebih luas.
Dukungan multibahasa menjadi kemampuan baru yang signifikan, mengingat sebelumnya model Gemma 2B dan Gemma 7B hanya mendukung input bahasa Inggris saja.
Selain itu, Gemma 3 hadir dalam berbagai ukuran parameter, seperti 1B, 4B, 12B, dan 27B. Huruf “B” merujuk pada “billion” alias miliar. Ini memungkinkan
developer
memilih ukuran Gemma terbaik untuk kebutuhan perangkat keras dan kinerja spesifik.
Semakin besar jumlah parameter, semakin kompleks dan canggih modelnya, tetapi juga membutuhkan lebih banyak daya komputasi dan memori untuk dijalankan.
Model dengan parameter lebih kecil biasanya lebih ringan dan bisa berjalan di perangkat dengan spesifikasi lebih rendah.
“Gemma 3 ini dirancang untuk berjalan cepat, langsung di perangkat, mulai dari ponsel dan laptop hingga
workstation,
membantu pengembang membuat aplikasi AI, di mana pun orang membutuhkannya,” kata Farabet.
Kemampuan baru Gemma 3
Farabet merinci enam poin kemampuan baru Gemma 3, sebagai berikut:
1. Dibangun dengan model akselerator tunggal terbaik di dunia
Gemma 3 dirancang untuk berjalan secara efisien pada satu GPU atau TPU. Artinya pengembang bisa menjalankan model ini tanpa memerlukan banyak unit komputasi.
Dalam pengujian awal di LMArena, model ini mengungguli beberapa model lain seperti Llama-405B, DeepSeek-V3, dan GPT o3-mini milik OpenAI dalam evaluasi berbasis preferensi manusia.
Intinya, performanya dioptimalkan agar tetap kuat meskipun ukuran modelnya lebih kecil dibanding model AI besar lainnya.
2. Dukungan multibahasa
Gemma 3 memiliki dukungan bawaan untuk lebih dari 35 bahasa. Artinya, model ini bisa langsung digunakan dalam berbagai bahasa asing, bukan hanya bahasa Inggris seperti model Gemma 2B dan 7B sebelumnya.
Sayangnya, Google tidak merinci lebih lanjut 35 bahasa mana yang didukung secara bawaan.
Google juga menyebutkan bahwa Gemma 3 telah dilatih dengan lebih dari 140 bahasa, sehingga bisa memahami dan menghasilkan teks dalam banyak bahasa lainnya.
3. Kemampuan penalaran teks dan visual tingkat lanjut
Gemma 3 dapat menganalisis gambar, teks, dan video pendek, sehingga bisa digunakan untuk membangun aplikasi AI multimodal yang dapat memahami berbagai jenis input, bukan hanya teks.
Ini membuka peluang untuk aplikasi yang lebih interaktif. Misalnya chatbot yang bisa memahami gambar atau analisis video otomatis.
4. Jendela konteks yang diperluas
Gemma dibangun dengan kemampuan jendela konteks 128k-token. Artinya, model ini dapat memahami dan mengolah lebih banyak teks dalam satu kali pemrosesan.
Ini sangat berguna untuk tugas-tugas yang membutuhkan pemahaman konteks yang luas, seperti merangkum dokumen panjang, memproses percakapan panjang, atau melakukan analisis mendalam terhadap data teks yang besar.
Seperti dua model Gemma sebelumnya, pengembang bisa mengakses dan mengotak-atik kode-kode pada model Gemma 3 ini secara bebas dan gratis.
5. Dukungan
function calling
Gemma 3 mendukung
function calling
, yaitu kemampuan model untuk memanggil fungsi tertentu berdasarkan input yang diberikan.
Ini berguna untuk mengotomatiskan tugas dan membangun sistem AI yang lebih interaktif, seperti:
- Chatbot yang bisa menjalankan perintah. Misalnya, “Buatkan jadwal meeting” di mana AI memanggil fungsi kalender.
- Agen AI yang bisa berinteraksi dengan API eksternal untuk mengambil data, melakukan transaksi, atau menjalankan workflow bisnis.
6. Ada versi kuantisasi resmi
Quantized models adalah versi yang lebih ringan dari model AI, yang menggunakan teknik kuantisasi untuk mengurangi ukuran model dan kebutuhan komputasi tanpa mengorbankan akurasi terlalu banyak.
Ini berarti model bisa berjalan lebih cepat di perangkat dengan sumber daya terbatas. Selain itu, konsumsi dayanya juga lebih rendah, cocok untuk aplikasi
edge
AI (seperti di ponsel atau perangkat IoT).
Google menghadirkan versi resmi yang sudah dioptimalkan, sehingga pengembang tidak perlu melakukan kuantisasi sendiri.
Di samping itu, Google menyebutkan Gemma 3 dikembangkan secara bertanggung jawab dan sudah dilengkapi dengan ShieldGemma 2.
ShieldGemma 2 adalah model keamanan gambar berbasis AI yang dirancang untuk mendeteksi, mengklasifikasikan, dan memfilter
input-output
berbahaya, eksplisit seksual, atau kekerasan dalam gambar.
Untuk ketersediaan, model AI Gemma 3 kini sudah bisa digunakan secara bebas dan gratis untuk keperluan komersial melalui Kaggle, Hugging Face, Google Vertex AI, hingga Google AI Studio, sebagaimana dihimpun
KompasTekno
dari blog Google, Kamis (13/3/2025).







