La India ocupa una posición privilegiada para liderar el desarrollo de sistemas de IA imparciales que reflejen realmente su diversidad, ignorada por los modelos globales de GenAI. Iniciativas como Bhashini, de MEITY, y AI4Bharat, del IIT Madras, son fundamentales en este movimiento. Estas iniciativas se centran en la recopilación de datos en lenguas regionales, garantizando que las diversas voces estén representadas en los conjuntos de datos de entrenamiento de IA.
Por Kamal Das
En los últimos años, la inteligencia artificial (IA) y las tecnologías de IA generativa (GenAI), como ChatGPT, han logrado avances notables en la transformación de diversas industrias y se han convertido en parte integral de la vida de todos. Sin embargo, cada vez preocupa más el sesgo inherente a estas tecnologías.
El problema de la parcialidad en GenAI
Los modelos de IA y GenAI suelen reflejar los datos con los que se entrenan, lo que puede llevar a dejar de lado las necesidades y perspectivas únicas de los grupos minoritarios. Estudios de reputadas instituciones como Oxford University Press han demostrado que GenAI, incluidas varias versiones de ChatGPT, reflejan los valores culturales predominantes en los países europeos de habla inglesa y protestantes. Otro estudio publicado en Nature examinó el contenido generado por IA a partir de modelos como ChatGPT y LLaMA y descubrió importantes sesgos raciales y de género. En la Conferencia Internacional sobre Aprendizaje Automático, los investigadores señalaron que los modelos de parámetros grandes como GenAI empeoran la precisión de las muestras de minorías. Como resultado, los modelos GenAI corren el riesgo de perpetuar las desigualdades sociales y marginar las opiniones no dominantes y minoritarias.
Esto afecta a países tan diversos como la India, donde existen multitud de lenguas, culturas y entornos socioeconómicos. India tiene más de 1.400 millones de habitantes y un rico tapiz de más de 400 lenguas. Según el censo de 2011, 60 lenguas indias son habladas por más de un millón de personas cada una. A pesar de representar aproximadamente 17% de las lenguas del mundo, los contenidos en lengua india constituyen menos del 0,1% de todos los recursos en línea. Esta marginación digital pone de manifiesto un problema acuciante: la infrarrepresentación de la diversidad lingüística y cultural de la India en Internet.
El papel de la India como pionera de la IA imparcial
La India ocupa una posición privilegiada para liderar el desarrollo de sistemas de IA imparciales que reflejen realmente su diversidad, ignorada por los modelos globales de GenAI. Iniciativas como Bhashini, de MEITY, y AI4Bharat, del IIT Madras, son fundamentales en este movimiento. Estas iniciativas se centran en la recopilación de datos en lenguas regionales, garantizando que las diversas voces estén representadas en los conjuntos de datos de entrenamiento de IA.
Dar prioridad a las lenguas regionales es tanto una cuestión de accesibilidad como de representación. Cuando estas lenguas se integran en los sistemas de inteligencia artificial, las comunidades ganan en autonomía, ya que pueden comunicarse con la tecnología en sus propias lenguas y no sólo en las europeas. Esta estrategia garantiza que la tecnología sea siempre accesible para todos.
Hoja de ruta hacia una IA imparcial
India puede adoptar estrategias para aprovechar todo el potencial de una IA y una GenAI inclusivas e imparciales:
- Diversificación de datos: Ampliar los conjuntos de datos para incluir varias lenguas y dialectos regionales puede ayudar a crear sistemas de IA más sólidos y justos. Es crucial apoyar los esfuerzos para recopilar más datos lingüísticos.
- Asociaciones de colaboración: Fomentar la colaboración entre las empresas tecnológicas, el mundo académico y las comunidades locales puede facilitar un enfoque más integrador del desarrollo de la IA. La diversidad de las partes interesadas garantizará la inclusión de perspectivas variadas en el diseño de las tecnologías de IA.
- Promoción de políticas y sensibilización pública: Las políticas gubernamentales deben promover una IA inclusiva e imparcial. También es importante educar al público sobre la importancia de la IA imparcial y el papel del lenguaje en la configuración de los resultados de la IA.
Codificar la diversidad de la India en la IA ayudará al Sur Global
El enfoque de la India debe abordar los desafíos únicos a los que se enfrenta el Sur Global, fomentando la inclusión y la accesibilidad. La multitud de lenguas de la India tiene paralelismos con las más de 3.000 lenguas indígenas de África y las más de 450 de Sudamérica. El énfasis de la India en las capacidades multilingües de la IA es un paso adelante para salvar esta distancia.
Por otra parte, el Sur Global se enfrenta a elevadas tasas de analfabetismo, un reto que la India pretende superar mediante un planteamiento en el que "la voz es lo primero". Además, la India está aprovechando tecnologías que no se basan únicamente en los teléfonos inteligentes, sino que también pueden funcionar en teléfonos fijos, ampliando así la accesibilidad. La primacía de la voz y la compatibilidad con los teléfonos fijos garantizan que estas tecnologías puedan atraer a usuarios con una alfabetización digital mínima, fomentando una inclusión social más amplia.
Por último, la tradición de innovación frugal de la India, junto con su compromiso con la infraestructura de bienes públicos digitales, tiene como objetivo ofrecer soluciones GenAI escalables y de bajo coste. Esto garantiza que las tecnologías GenAI sigan siendo asequibles, beneficiando a los ciudadanos de todos los niveles socioeconómicos.
Conclusión
A medida que la IA y la GenAI siguen configurando el futuro, resulta esencial abordar los prejuicios inherentes. La India tiene una oportunidad única para liderar la creación de un panorama de IA que valore la diversidad y la inclusión. Al centrarse en los idiomas regionales y comprometer a las comunidades marginadas, la India puede establecer un estándar global para una IA imparcial, fomentando un mundo digital más equitativo.
Fuente: India IA