{"id":16556,"date":"2022-06-07T06:38:12","date_gmt":"2022-06-07T06:38:12","guid":{"rendered":"https:\/\/www.wfglobal.org\/?post_type=press&#038;p=16556"},"modified":"2025-03-25T14:49:33","modified_gmt":"2025-03-25T09:19:33","slug":"a-localizacao-da-ia-para-a-india","status":"publish","type":"press","link":"https:\/\/wadhwanifoundation.org\/pt\/press\/the-localization-of-ai-for-india\/","title":{"rendered":"A localiza\u00e7\u00e3o da IA para a \u00cdndia"},"content":{"rendered":"<p style=\"text-align: center;\">Por Kamal Das<\/p>\n<div id=\"vendor_chk\" class=\"col-md-8 width_img\">\n<div class=\"section\">\n<div class=\"col-lg-5 col-md-5 col-sm-5\">\n<div class=\"text_style\"><b>Limita\u00e7\u00f5es da IA estrangeira para criar solu\u00e7\u00f5es centradas na \u00cdndia<\/b><\/p>\n<p>Em 2019, o conselheiro permanente do governo central, representando o Minist\u00e9rio da Mulher e do Desenvolvimento Infantil, observou que o n\u00famero de crian\u00e7as combinadas usando o software de reconhecimento facial (FRS) era inferior a um por cento! O advogado lamentou que, \u00e0s vezes, o FRS tamb\u00e9m n\u00e3o conseguia identificar o g\u00eanero correto da crian\u00e7a.<\/p>\n<p>O FRS \u00e9 um dos casos de uso mais comuns de IA na \u00cdndia, com aplica\u00e7\u00f5es em verifica\u00e7\u00f5es de \"conhe\u00e7a seu cliente\" (KYC), sistemas de atendimento, triagem de emprego, seguran\u00e7a e aplica\u00e7\u00e3o da lei. Em seu estudo sobre rostos indianos em 2021, os pesquisadores Gaurav Jain e Smriti Parsheera observaram que os FRS podem classificar erroneamente at\u00e9 14,68% (ou um em cada sete) das mulheres como homens. Eles tamb\u00e9m observaram que o FRS fornece previs\u00f5es err\u00f4neas de idade de mais de dez anos em at\u00e9 42,2% (ou tr\u00eas em sete) para rostos indianos.<\/p>\n<p><b>Falta de localiza\u00e7\u00e3o: Um dos principais motivos para as altas imprecis\u00f5es<\/b><\/p>\n<p>H\u00e1 muitos motivos para a maior imprecis\u00e3o dos modelos de IA no contexto indiano. Os modelos de IA precisam de dados para serem treinados e requerem grandes quantidades de dados para poderem entender e derivar o padr\u00e3o. Os dados centrados na \u00cdndia para IA n\u00e3o est\u00e3o t\u00e3o facilmente dispon\u00edveis. O maior banco de dados de imagens do mundo, o ImageNet , tem apenas 2% de imagens da \u00cdndia, embora o pa\u00eds represente quase 18% da popula\u00e7\u00e3o mundial. Da mesma forma, embora seis idiomas indianos fa\u00e7am parte dos 20 principais idiomas globais por popula\u00e7\u00e3o, a Microsoft \u00cdndia observou que nenhum desses idiomas est\u00e1 no topo da lista de conte\u00fado digital. .<\/p>\n<p>Os esfor\u00e7os para criar e integrar os bancos de dados indianos s\u00e3o frequentemente atrasados. Em 2020, o National Crimes Records Bureau da \u00cdndia lan\u00e7ou a licita\u00e7\u00e3o revisada para o National Automated Facial Recognition System (Sistema Nacional de Reconhecimento Facial Automatizado), que visa integrar v\u00e1rios bancos de dados, como o Crime and Criminal Tracking Network &amp; Systems (Rede e Sistemas de Rastreamento de Crimes e Criminosos), em um \u00fanico grande banco de dados criminal. Esse sistema tem o potencial de ser um dos maiores sistemas de reconhecimento facial do mundo. No entanto, essa licita\u00e7\u00e3o foi prorrogada mais de uma d\u00fazia de vezes!<\/p>\n<p>Tem havido um esfor\u00e7o para melhorar a igualdade demogr\u00e1fica com conjuntos de dados de diversas ra\u00e7as e grupos, como brancos, negros, sul-asi\u00e1ticos e similares. No entanto, a \u00cdndia \u00e9 classificada como parte do sul da \u00c1sia na maioria dos conjuntos de dados. Mais de 20% da popula\u00e7\u00e3o global, com imensa diversidade de idiomas e tons de pele, s\u00e3o frequentemente classificados como um mon\u00f3lito. Entretanto, nem todas as pessoas das categorias raciais s\u00e3o iguais. \u201cA categoria indiano\/sul asi\u00e1tico apresenta um excelente exemplo das armadilhas das categorias raciais\u201d, destaca a pesquisa da Northeastern University . A IA deve abra\u00e7ar e ser capaz de identificar e abra\u00e7ar a diversidade dos indianos de estados como Gujarat a Arunachal Pradesh e Caxemira a Kerala.<\/p>\n<p>De acordo com um estudo da Deloitte e da NASSCOM, a \u00cdndia abriga atualmente mais de 1.300 Centros de Capacidade Global, empregando cerca de 1,3 milh\u00e3o de pessoas. Embora grande parte da IA global esteja sendo desenvolvida fora da \u00cdndia, o foco na IA centrada na \u00cdndia n\u00e3o era um foco importante anteriormente. A necessidade de ter diversidade e IA espec\u00edfica para cada pa\u00eds \u00e9 um desenvolvimento recente.<\/p>\n<p><b>Esfor\u00e7os para localizar a IA para a \u00cdndia<\/b><\/p>\n<p>A localiza\u00e7\u00e3o da IA depende do desenvolvimento de grandes conjuntos de dados gerados pela experi\u00eancia do usu\u00e1rio local e espec\u00edfica da regi\u00e3o para personalizar a IA e entender o contexto local. De acordo com o Censo de 2011, muitas vezes esquecemos que apenas 11% dos indianos entendem ingl\u00eas como primeiro, segundo ou terceiro idioma. As estimativas atuais sugerem que menos de 20% dos indianos t\u00eam confian\u00e7a no ingl\u00eas. Mais de 90% preferem conte\u00fado em sua l\u00edngua materna ou em outros idiomas regionais indianos. Na comunidade de IA, percebe-se que n\u00e3o h\u00e1 material suficiente na Internet que possa ser usado para treinar a IA voltada para a \u00cdndia.<\/p>\n<p>Os esfor\u00e7os iniciais na \u00cdndia foram feitos por multinacionais indianas para explorar o crescente mercado indiano. Elas come\u00e7aram a incorporar idiomas, sotaques e estilos de fala locais. Atualmente, muitos assistentes de voz podem interpretar e responder a consultas em idiomas regionais. Em 2018, o Google Assistant introduziu o suporte para hindi. Em 2019, ele expandiu o suporte para mais oito idiomas indianos. O Windows da Microsoft agora funciona com todos os 22 idiomas indianos. No entanto, existem falhas nas habilidades de tradu\u00e7\u00e3o. A compreens\u00e3o dos idiomas regionais indianos precisa de pesquisas cont\u00ednuas.<\/p>\n<p>Institui\u00e7\u00f5es acad\u00eamicas como o IIT Madras est\u00e3o ajudando a localizar a IA. O corpo docente do principal instituto fundou a AI4Bh\u0101rat, uma comunidade sem fins lucrativos e de c\u00f3digo aberto que colabora para criar solu\u00e7\u00f5es de IA para resolver os problemas da \u00cdndia. Eles est\u00e3o ajudando a criar conte\u00fado digital em idiomas indianos que ajudar\u00e1 a melhorar a compreens\u00e3o da IA nos idiomas indianos.<\/p>\n<p>O governo indiano tamb\u00e9m est\u00e1 se concentrando em melhorar e aumentar o acesso a conjuntos de dados centrados na \u00cdndia. O compartilhamento de dados de cidad\u00e3os com o governo, mesmo entre v\u00e1rios minist\u00e9rios, \u00e9 lento e oneroso. Esses esfor\u00e7os para aumentar o compartilhamento e o acesso aos dados ganharam ritmo nos \u00faltimos anos. A Pol\u00edtica e a Estrutura Nacional de Governan\u00e7a de Dados foram reintroduzidas e est\u00e3o dispon\u00edveis para consulta at\u00e9 11 de junho de 2022. A pol\u00edtica visa disponibilizar conjuntos de dados em um formato an\u00f4nimo para permitir que os dados n\u00e3o pessoais dos cidad\u00e3os dispon\u00edveis no governo sejam compartilhados com o p\u00fablico para melhorar o mecanismo de governan\u00e7a e a pesquisa centrada na \u00cdndia.<\/p>\n<p><b>Pr\u00f3ximas etapas: Concentre-se na qualidade e na quantidade!<\/b><\/p>\n<p>Andrew Ng, professor adjunto da Universidade de Stanford, observa que dados melhores do que modelos melhores levar\u00e3o \u00e0 pr\u00f3xima onda de melhorias nas solu\u00e7\u00f5es de IA. Para que a \u00cdndia participe dessa onda, devemos nos concentrar na qualidade e na quantidade dos dados. Est\u00e3o sendo feitos esfor\u00e7os para aumentar a quantidade de dados locais dispon\u00edveis centrados na \u00cdndia. Tamb\u00e9m devemos nos esfor\u00e7ar para garantir que a qualidade dos dados seja aprimorada. Os dados capturados devem ser auditados, e as bases devem incluir dados precisos para garantir decis\u00f5es pol\u00edticas adequadas. Esperamos que os esfor\u00e7os atuais para localizar dados e promover o compartilhamento de dados ajudem a \u00cdndia a avan\u00e7ar rapidamente na IA!<\/p><\/div>\n<\/div>\n<\/div>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>By Kamal Das Limitations of Foreign AI for building India-centric Solutions In 2019, the central government\u2019s standing counsel, representing the Ministry of Woman and Child Development, noted that the number of children matched using facial recognition software (FRS) was less than one per cent ! The counsel rued that the FRS was sometimes unable to [&hellip;]<\/p>\n","protected":false},"author":34,"featured_media":16557,"template":"","tags":[7],"press-category":[],"coauthors":[],"class_list":["post-16556","press","type-press","status-publish","has-post-thumbnail","hentry","tag-authored-articles"],"acf":[],"_links":{"self":[{"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/press\/16556","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/press"}],"about":[{"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/types\/press"}],"author":[{"embeddable":true,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/users\/34"}],"version-history":[{"count":0,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/press\/16556\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/media\/16557"}],"wp:attachment":[{"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/media?parent=16556"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/tags?post=16556"},{"taxonomy":"press-category","embeddable":true,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/press-category?post=16556"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/wadhwanifoundation.org\/pt\/wp-json\/wp\/v2\/coauthors?post=16556"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}