Google sedang membangun Gemini AI, sistem kecerdasan buatan atau artificial intelligence yang diklaim melampaui kecanggihan ChatGPT milik Open AI. Apa alasannya?
Pada dasarnya, sistem AI Gemini adalah arsitektur AI generasi berikutnya yang akan menggantikan PaLM 2, model AI saat ini di belakang semua layanan AI Google.
Dikutip dari Gizmochina, CEO Google Deepmind, Demis Hassabis yakin AI Gemini akan lebih unggul dari AI yang sudah ada. Hassabis mengatakan sistem tersebut masih dalam pengembangan, dan akan memakan waktu beberapa bulan untuk menyelesaikan teknologi AI tersebut.
Menurut Hassabis, biaya pengembangan AI Gemini diperkirakan mencapai ratusan juta dolar AS. Ini berarti Google memasukkan banyak sumber daya ke dalam sistem AI. Investasi ini menjadi salah satu faktor utama keyakinan Google bahwa Gemini AI akan mengungguli model GPT 4 ChatGPT.
Keyakinan bahwa AI Gemini akan mengalahkan ChatGPT bukan hanya karena faktor biaya besar yang dikeluarkan Google, tetapi juga tentang inti dari sistem AI.
Sistem AI Gemini akan disematkan di Google, termasuk duet AI di aplikasi Workspace dan Bard chatbot. Google sedang membangun AI Gemini agar lebih kuat daripada ChatGPT-4. Model OpenAI GPT 4 sudah menjadi model bahasa besar yang dapat menghasilkan teks dan gambar.
Sebelumnya, Google mengumumkan bahwa AI Gemini dibuat untuk menjadi alat multimodal yang sangat efisien dan integrasi antarmuka pemrograman aplikasi (API). Sistem ini dibangun untuk memungkinkan inovasi masa depan.
Menurut Google, AI Gemini akan hadir dalam berbagai ukuran dan kemampuan. Artinya fleksibel dan dapat diatur sesuai kebutuhan.
Google tidak ingin menyalin sesuatu yang sudah ada. Karena itulah perusahaan raksasa asal Amerika Serikat ini tidak menawarkan performa Gemini AI serupa GPT 4 sebagai perhatian utama.
Hassabis dan timnya mencoba meningkatkan AI Gemini dengan ide-ide dari bidang lain, seperti ilmu saraf dan robotika. “Kami juga memiliki beberapa inovasi baru yang akan sangat menarik,” kata Hassabis.
Seperti yang diumumkan Google, AI Gemini dirancang untuk multimodal, yang artinya dapat menangani berbagai jenis data. Misalnya, dapat bekerja dengan video, audio, teks, dan gambar.