El camino pragmático de la India hacia los grandes modelos lingüísticos (LLM)

"

"

El camino pragmático de la India hacia los grandes modelos lingüísticos (LLM)

Por

Mientras los países se esfuerzan por crear IA generativa (GenAI) y grandes modelos lingüísticos (LLM), la India se encuentra en un momento crítico. Cada vez es mayor el deseo de crear LLM fundacionales propios. Creemos que estas ambiciones deben atemperarse con realismo y pensamiento estratégico. En un panorama dominado por inversiones multimillonarias para modelos de mil millones de parámetros, la India debe evaluar cuidadosamente dónde puede liderar, dónde debe colaborar y dónde debe simplemente facilitar.

El actual flujo mundial en el desarrollo de modelos fundacionales, los rápidos ciclos de innovación y las enormes necesidades de capital sugieren que el Gobierno indio no debería centrarse en construir esos modelos desde cero, al menos no con fondos públicos. En su lugar, el énfasis debe desplazarse hacia el aprovechamiento de los LLM de código abierto, permitiendo el acceso al idioma local y apoyando la innovación privada.

Modelos fundacionales: Coste elevado, rendimiento incierto

Hoy en día, crear un LLM fundacional de vanguardia es como financiar un proyecto lunar. Modelos como GPT-4 y Gemini requieren miles de GPU, conjuntos de datos masivos, talento de élite y mucho dinero. Estos modelos evolucionan con rapidez, y los frecuentes avances hacen que las versiones más antiguas pasen a un segundo plano en cuestión de meses.

Para una economía en desarrollo como la india, la inversión pública debe dar prioridad a resultados escalables e integradores. Invertir el dinero de los contribuyentes en modelos fundacionales especulativos es arriesgado y no garantiza ningún beneficio. Es más prudente centrarse en la innovación aplicada y en infraestructuras de interés público que competir en una carrera armamentística dominada por los gigantes tecnológicos.

BharatGen y el modelo Param 1: Un paso adelante equilibrado

Una iniciativa destacada en la India es el consorcio BharatGen, una colaboración de las principales instituciones académicas: IIT Bombay, IIT Kanpur, IIT Mandi, IIT Madras, IIT Hyderabad, IIIT Hyderabad e IIM Indore. Este consorcio ha lanzado recientemente Param 1, un LLM bilingüe de 2.900 millones de parámetros que ya está a disposición del público a través de la plataforma AIKosha de MeitY.

Lo que distingue a Param 1 es su composición de datos de 25% de lenguas índicas, un salto significativo respecto a los 0,01% de modelos internacionales como LLaMA de Meta. El modelo no es una apuesta arriesgada, sino un elemento facilitador, un punto de control fundacional que los desarrolladores indios pueden perfeccionar para crear herramientas de IA específicas del dominio, como chatbots, copilotos y sistemas de conocimiento en índico.

Cabe destacar que BharatGen también ha desarrollado 20 modelos de voz en 19 lenguas indias, incluidos los sistemas Speaker Adaptive y Voicebox TTS. Estos sistemas se crearon desde cero para responder a las necesidades lingüísticas específicas de la India, lo que demuestra que una inversión centrada y decidida en infraestructuras habilitadoras da mejores resultados que intentar replicar modelos fundacionales mundiales.

Este esfuerzo refleja un modelo ideal de participación del sector público, no para competir a escala mundial, sino para reforzar la capacidad local y reducir la dependencia de conjuntos de datos y tecnologías extranjeros.

Sarvam AI: Iniciativa LLM soberana respaldada por el gobierno

En un importante paso en el marco de la misión IndiaAI de ₹10.000 millones de rupias, el Gobierno de la India ha seleccionado a la startup Sarvam AI, con sede en Bengaluru, para desarrollar el primer LLM soberano del país. Sarvam AI tendrá acceso a 4.096 GPU Nvidia H100 durante seis meses para entrenar desde cero un modelo de 70.000 millones de parámetros. Este modelo pretende destacar en razonamiento, tareas basadas en la voz y fluidez en las lenguas indias, dada la experiencia de su fundador en AI4Bharat.

Ejemplos globales: Utilizar lo que hay, construir lo que falta

Países como Francia (Mistral), los EAU (Falcon) e instituciones como Meta (LLaMA 2) ofrecen una valiosa hoja de ruta. Estos LLM de código abierto de alto rendimiento pueden adaptarse, localizarse y combinarse utilizando enfoques de conjunto o de Mezcla de Expertos (MoE) para ofrecer resultados competitivos sin un coste masivo.

La India debería adoptar este enfoque pragmático: utilizar modelos abiertos, personalizarlos con conjuntos de datos indios y adaptarlos a la gobernanza local, la agricultura, la educación y la legislación. Esto no solo ahorra recursos, sino que acelera la implantación.

La verdadera oportunidad de la India: Idiomas locales e interfaces de voz

La India debe liderar al Sur global en la construcción de una IA que realmente ayude a todos los estratos de la sociedad. Hay que centrarse más en el alcance y la equidad que en el tamaño del modelo. Observamos tres áreas principales que tendrán el mayor impacto:

LLM en lengua local:
Apoyar a las nuevas empresas que creen modelos que den prioridad a las 22 lenguas oficiales de la India. Estos esfuerzos están más alineados para ayudar a llegar a la población lingüísticamente diversa de la India que los modelos que dan prioridad al inglés. La comprensión de la lengua local es la base de la inclusión digital.

Interfaces de voz para las masas:
Un amplio sector de la población india sigue estando excluido digitalmente debido a su bajo nivel de alfabetización, la escasa penetración de los teléfonos inteligentes y la falta de comodidad con los teclados en inglés. Para estos ciudadanos, la voz en su lengua local es la interfaz más natural. Los modelos de voz a texto y de texto a voz de alta calidad que admiten dialectos regionales son cruciales. Pueden alimentar bots IVR, asistentes de inteligencia artificial y servicios con poco ancho de banda.

Sistemas multimodales:
Los sistemas de IA que combinan diversas entradas, como texto, voz e imágenes, ayudarán a tener un mayor alcance. Por ejemplo, los agricultores pueden hacer fotos de los cultivos y obtener respuestas de voz en telugu u odia; los ciudadanos mayores pueden hablar con un sistema de consulta de pensiones en marathi o tamil. Estos sistemas exigen pensar primero en el despliegue, centrándose en las necesidades del usuario final.

El papel del Gobierno: infraestructura, no invención

En lugar de convertirse en un constructor de modelos de mil millones de parámetros, el gobierno indio debería centrarse en:

Conjuntos de datos abiertos: Publicar conjuntos de datos públicos a gran escala sobre lenguas indias, sanidad, agricultura y gobernanza para que las nuevas empresas y los investigadores puedan perfeccionar los modelos existentes.
Infraestructura de IA como bien público: Proporcionar acceso a centros de computación (GPUs/TPUs), almacenamiento y modelos a través de plataformas apoyadas por el gobierno como AIKosha.
Habilitación política y normativa: Fomentar la experimentación responsable, ofrecer entornos "caja de arena" y financiar despliegues piloto en regiones rurales y semiurbanas.
Capacitación del sector privado: Dejar que las empresas emergentes y la industria asuman riesgos audaces en el desarrollo de modelos fundacionales, mientras el gobierno garantiza el apoyo normativo e infraestructural.
Conclusiones: El éxito del LLM en la India vendrá de capacitar, no de construir

La India debe evitar caer en la trampa del nacionalismo vanidoso de la IA. Nuestra ventaja competitiva no reside en el tamaño, sino en la personalización, la inclusión y el despliegue a escala.

No necesitamos construir el próximo GPT. Tenemos que asegurarnos de que los LLM hablen lenguas indias, entiendan los contextos indios y sirvan a los ciudadanos indios, desde las aldeas remotas hasta los centros urbanos.

Con una política propicia, acceso abierto a modelos globales y autóctonos, y un enfoque implacable en el valor local, la India puede liderar el mundo en IA aplicada. La iniciativa BharatGen, el enfoque Indica de Sarvam AI y los crecientes ecosistemas de código abierto.

Fuente en línea:
Ordenador exprés

Más cobertura de prensa

Utilizamos cookies y/o tecnologías similares necesarias para que este sitio web funcione y para recopilar información cuando usted interactúa con este sitio web con el fin de mejorar su experiencia. Al utilizar este sitio web, usted reconoce y consiente nuestras política de cookies y política de privacidad