Ketika berbagai negara berusaha keras untuk membangun Generative AI (GenAI) dan Large Language Models (LLM), India berada pada titik kritis. Ada keinginan yang semakin besar untuk menciptakan LLM dasar yang dikembangkan sendiri. Kami percaya bahwa ambisi ini harus diimbangi dengan realisme dan pemikiran strategis. Dalam lanskap yang didominasi oleh investasi miliaran dolar untuk model-model miliaran parameter, India harus secara hati-hati menilai di mana ia dapat memimpin, di mana ia harus berkolaborasi, dan di mana ia harus memungkinkan.
Arus global saat ini dalam pengembangan model dasar, siklus inovasi yang cepat, dan kebutuhan modal yang sangat besar menunjukkan bahwa membangun model-model seperti itu dari awal seharusnya tidak menjadi fokus pemerintah India, setidaknya tidak menggunakan dana publik. Sebaliknya, penekanannya harus bergeser ke arah memanfaatkan LLM sumber terbuka, memungkinkan akses bahasa lokal, dan mendukung inovasi swasta.
Model Dasar: Biaya Tinggi, Hasil Tidak Pasti
Membangun LLM dasar yang mutakhir saat ini mirip dengan mendanai proyek rembulan. Model seperti GPT-4 dan Gemini membutuhkan ribuan GPU, kumpulan data yang sangat besar, talenta elit, dan kocek yang dalam. Model-model ini berkembang dengan cepat, dengan terobosan yang sering membuat versi yang lebih lama "ketinggalan zaman" dalam hitungan bulan.
Untuk ekonomi yang sedang berkembang seperti India, investasi publik harus memprioritaskan hasil-hasil yang terukur dan inklusif. Mengerahkan uang pembayar pajak untuk model-model dasar yang spekulatif sangat berisiko, tanpa adanya jaminan manfaat. Lebih bijaksana untuk fokus pada inovasi terapan dan infrastruktur publik yang baik daripada bersaing dalam perlombaan senjata yang didominasi oleh perusahaan-perusahaan teknologi raksasa.
BharatGen dan Model Param 1: Sebuah Langkah Maju yang Seimbang
Salah satu upaya penting di India adalah konsorsium BharatGen, sebuah kolaborasi dari lembaga-lembaga akademis terkemuka - IIT Bombay, IIT Kanpur, IIT Mandi, IIT Madras, IIT Hyderabad, IIIT Hyderabad, dan IIM Indore. Konsorsium ini baru-baru ini meluncurkan Param 1, sebuah LLM dwibahasa dengan 2,9 miliar parameter yang kini tersedia untuk umum melalui platform AIKosha milik MeitY.
Yang membedakan Param 1 adalah komposisi data bahasa Indic 25%, sebuah lompatan yang signifikan dari 0.01% pada model internasional seperti LLaMA milik Meta. Model ini tidak berfungsi sebagai moonshot tetapi sebagai enabler-pos pemeriksaan dasar yang dapat disempurnakan oleh pengembang India untuk membangun alat AI khusus domain seperti chatbot Indic, copilot, dan sistem pengetahuan.
Yang terpenting, BharatGen juga telah mengembangkan 20 model ucapan dalam 19 bahasa India, termasuk sistem Speaker Adaptive dan Voicebox TTS. Semua ini dibangun dari awal untuk memenuhi kebutuhan bicara India yang unik, yang menunjukkan bahwa investasi yang terfokus dan terarah dalam infrastruktur yang memungkinkan memberikan hasil yang lebih baik daripada mencoba meniru model dasar global.
Upaya ini mencerminkan model ideal untuk partisipasi sektor publik-bukan untuk bersaing secara global, tetapi untuk memperkuat kapasitas lokal dan mengurangi ketergantungan pada kumpulan data dan teknologi asing.
Sarvam AI: Inisiatif LLM Berdaulat yang Didukung Pemerintah
Dalam sebuah langkah penting di bawah Misi IndiaAI senilai ₹10.000 crore, Pemerintah India telah memilih startup yang berbasis di Bengaluru, Sarvam AI, untuk mengembangkan LLM berdaulat pertama di negara tersebut. Sarvam AI akan menerima akses ke 4.096 GPU Nvidia H100 selama enam bulan untuk melatih model dengan 70 miliar parameter dari awal. Model ini bertujuan untuk unggul dalam penalaran, tugas-tugas berbasis suara, dan kefasihan dalam berbagai bahasa di India, mengingat latar belakang pendiri AI4Bharat.
Contoh-contoh Global: Gunakan Apa yang Ada, Bangun Apa yang Hilang
Negara-negara seperti Prancis (Mistral), Uni Emirat Arab (Falcon), dan institusi seperti Meta (LLaMA 2) menawarkan peta jalan yang berharga. LLM sumber terbuka berkinerja tinggi ini dapat diadaptasi, dilokalkan, dan digabungkan menggunakan pendekatan ansambel atau Mixture of Experts (MoE) untuk memberikan hasil yang kompetitif tanpa biaya yang besar.
India harus mengadopsi pendekatan pragmatis ini-menggunakan model terbuka, menyesuaikannya dengan kumpulan data India, dan menyempurnakannya untuk pemerintahan lokal, pertanian, pendidikan, dan hukum. Hal ini tidak hanya menghemat sumber daya tetapi juga mempercepat penerapannya.
Peluang Nyata India: Bahasa Lokal dan Antarmuka Suara
India harus memimpin negara-negara di belahan dunia selatan dalam membangun AI yang benar-benar membantu semua lapisan masyarakat. Fokusnya haruslah pada jangkauan dan kesetaraan, bukan pada ukuran model. Kami mencatat tiga area utama yang akan memiliki dampak paling besar:
LLM Bahasa Daerah:
Mendukung perusahaan rintisan yang membuat model yang memprioritaskan 22 bahasa yang dijadwalkan di India. Upaya ini lebih selaras untuk membantu menjangkau populasi India yang secara linguistik beragam daripada model yang mengutamakan bahasa Inggris. Pemahaman bahasa lokal adalah dasar untuk inklusi digital.
Antarmuka Suara untuk Massa:
Segmen besar masyarakat India masih belum tersentuh secara digital karena rendahnya tingkat melek huruf, rendahnya penetrasi ponsel pintar, dan kurangnya kenyamanan dengan keyboard berbahasa Inggris. Bagi masyarakat ini, suara dalam bahasa lokal mereka adalah antarmuka yang paling alami. Model speech-to-text dan text-to-speech berkualitas tinggi yang mendukung dialek regional sangat penting. Mereka dapat mendukung bot IVR, asisten AI, dan layanan dengan bandwidth rendah.
Sistem Multimoda:
Sistem AI yang menggabungkan berbagai input, termasuk teks, ucapan, dan gambar, akan membantu dengan jangkauan yang lebih luas. Misalnya, petani dapat mengambil foto tanaman dan mendapatkan respons berbasis suara dalam bahasa Telugu atau Odia; warga lanjut usia dapat berbicara dengan sistem permintaan pensiun dalam bahasa Marathi atau Tamil. Sistem seperti ini membutuhkan pemikiran yang mengutamakan penerapan, dengan fokus pada kebutuhan pengguna akhir.
Peran Pemerintah: Infrastruktur, Bukan Penemuan
Daripada menjadi pembangun model dengan miliaran parameter, pemerintah India harus fokus pada:
Buka Dataset: Merilis set data publik berskala besar untuk bahasa, kesehatan, pertanian, dan tata kelola India agar startup dan peneliti dapat menyempurnakan model yang ada.
Infrastruktur AI sebagai Barang Publik: Menyediakan akses ke komputasi (GPU/TPU), penyimpanan, dan hub model melalui platform yang didukung pemerintah seperti AIKosha.
Pemberdayaan Kebijakan dan Peraturan: Mendorong eksperimen yang bertanggung jawab, menawarkan lingkungan kotak pasir, dan mendanai penyebaran percontohan di wilayah pedesaan dan semi-perkotaan.
Pemberdayaan Sektor Swasta: Biarkan perusahaan rintisan dan industri mengambil risiko yang berani dalam pengembangan model dasar, sementara pemerintah memastikan bahwa dukungan regulasi dan infrastruktur tersedia.
Kesimpulan: Kesuksesan LLM India Akan Datang Dari Memungkinkan, Bukan Membangun
India harus menghindari jatuh ke dalam perangkap nasionalisme AI yang didorong oleh kesombongan. Keunggulan kompetitif kami tidak terletak pada ukuran, tetapi pada penyesuaian, inklusivitas, dan penyebaran dalam skala besar.
Kita tidak perlu membangun GPT berikutnya. Kita perlu memastikan bahwa para LLM berbicara dalam bahasa India, memahami konteks India, dan melayani warga India, dari desa-desa terpencil hingga ke pusat-pusat kota.
Dengan kebijakan yang mendukung, akses terbuka ke model global dan model lokal, dan fokus tanpa henti pada nilai lokal, India dapat memimpin dunia dalam AI terapan. Inisiatif BharatGen, fokus Indic dari Sarvam AI, dan ekosistem sumber terbuka yang terus berkembang.
Sumber Online:
Komputer Ekspres