Processamento de linguagem natural: A Big Leap in Conversing with the Human Mind (Um grande salto na conversa com a mente humana)

"

"

Processamento de linguagem natural: A Big Leap in Conversing with the Human Mind (Um grande salto na conversa com a mente humana)

A PNL pode ser um grande benefício para a criação de chatbots em idiomas regionais, mas ainda há muito a ser feito antes de chegarmos lá.

Por Prakash Kumar e Apoorv Vishnoi

Você já se perguntou como os e-mails de spam são filtrados, os mecanismos de pesquisa exibem as páginas mais adequadas, o aplicativo Word continua corrigindo a gramática, os assistentes de voz conversam conosco enquanto escrevemos uma mensagem no WhatsApp e você recebe sugestões sobre as próximas palavras? Como os avaliadores descobrem rapidamente casos de plágio em trabalhos enviados on-line? Por trás de tudo isso, há um importante aplicativo de inteligência artificial (IA) chamado Processamento de linguagem natural ou PNL.

Nós, humanos, sempre fomos fascinados por pessoas que podem falar como nós, seja um papagaio ou um assistente de voz como a Alexa. Agora, os papagaios simplesmente repetem o que ouvem sem entender o verdadeiro significado do que estão dizendo. Ainda assim, nossos assistentes de voz são mais inteligentes do que isso; eles podem realizar tarefas significativas para nós, controlar nossos dispositivos e até mesmo ter uma conversa interativa conosco. O principal campo que dá aos assistentes de voz esse poder é o Processamento de Linguagem Natural (NLP). Simplificando, a PNL permite que os dispositivos processem linguagens naturais em formato escrito ou falado e interajam conosco. No caso de comandos falados, há outra etapa de conversão de fala para texto quando falamos com o dispositivo e de texto para fala quando o dispositivo fala conosco.

Como esses dispositivos entendem idiomas naturais como inglês, hindi ou francês? Bem, os computadores e os algoritmos não entendem realmente as palavras. O texto é convertido em números por programas de computador, pois os computadores entendem apenas números. No caso da NLP, há um processo intermediário chamado conversão da fala humana em propriedades ou características computáveis chamadas vetores de recursos, como intenção, tempo e sentimento. Isso é necessário porque a linguagem, diferentemente dos comandos de computador, tem muitas nuances. Tudo isso acontece usando determinados algoritmos especializados de aprendizado de máquina e aprendizado profundo. Esses aplicativos são então treinados para tarefas específicas usando uma grande quantidade de dados. Quando usamos esses aplicativos em nossos telefones para ditar uma mensagem, não apenas usamos o aplicativo de PNL, mas também fornecemos mais dados que são usados pelo programa para aprimorar seu desempenho. Em outras palavras, esses aplicativos continuam aprendendo, e é por isso que notamos uma melhoria em seu desempenho à medida que usamos o aplicativo cada vez mais.

Recebemos alertas sobre o sentimento predominante em plataformas de mídia social como o Twitter, especialmente quando ocorre um incidente, como a derrota da Índia em uma partida de críquete na Copa do Mundo T20. Como isso é feito? Ao ler um tweet, sabemos se o texto está exibindo um sentimento positivo, negativo ou neutro. Os aplicativos baseados em NLP são treinados para analisar os tweets observando as palavras/frases depois de remover artigos, sinais de pontuação etc. Um dicionário de palavras/frases é preparado com base em tweets anteriores, marcando-os como negativos, positivos ou neutros. Novos tweets são analisados com hashtags apropriadas, como @T20World Cup, no nosso exemplo, e, usando a NLP, avalia-se se as pessoas estão felizes, tristes ou neutras com o resultado.

As empresas estão usando ferramentas baseadas em PNL. Um desses aplicativos é a identificação de um tópico em um documento grande e o resumo do relatório. O uso de um algoritmo bem treinado para resumir esses relatórios em pontos-chave economiza muito tempo. As ferramentas para escrever relatórios resumidos estão sendo usadas por escritórios de advocacia e departamentos governamentais que precisam examinar um grande número de páginas.

Os governos convidam as pessoas a darem sugestões sobre projetos de políticas. O grande número de respostas dificulta a análise manual de milhares de respostas. As ferramentas de PNL estão em uma posição ideal para fazer isso para os órgãos governamentais.

Os chatbots, que são ferramentas baseadas em PNL, tornaram-se subitamente muito populares nos sites. Eles são treinados nas perguntas frequentes e podem responder às chamadas de forma eficaz, aliviando a carga da equipe do helpdesk. Eles também resolvem consultas puramente informativas, que muitas pessoas acham difícil localizar nos sites. Muitos departamentos governamentais começaram a usar Chatbots. A próxima etapa poderia ser um Chatbot multilíngue nos portais do governo para permitir que pessoas de vários estados interajam e obtenham informações/ajuda falando com ele em sua língua materna ou usando texto.

Os assistentes de voz são a aplicação mais conhecida da PNL. Eles são uma mistura de várias tecnologias emergentes: Um ser humano dirá: "Ei, assistente, acenda a luz". Por meio do reconhecimento de voz, as palavras faladas são convertidas em texto; o texto é convertido em números que o sistema entende; os números passam por um conjunto de algoritmos de PLN treinados que fornecem uma mensagem sobre a ação. A mensagem de ação é transmitida à lâmpada usando a Internet das Coisas ou IoT e, por fim, a lâmpada é ligada. É claro que tudo isso ocorrerá em uma fração de segundo.

Outro caso de uso marcante da PNL é a tradução de idiomas. Há muitos aplicativos disponíveis que ajudam os usuários a traduzir de um idioma para outro. Em um país como o nosso, que tem 22 idiomas oficiais, um tradutor treinado em NLP pode nos ajudar a converter documentos, sites e avisos públicos em vários idiomas regionais. Na verdade, ele pode até nos ajudar a falar em idiomas regionais.

Embora muito progresso tenha sido feito, no momento, a PNL não pode nos dar uma precisão muito alta nas tarefas. Até mesmo uma precisão de 75% é considerada muito boa. Um dos motivos para isso é que os idiomas têm atributos complexos, como sarcasmo, ironia, expressões idiomáticas e muitos outros. Por exemplo, uma pessoa escreveu "I want to jump from the bridge" (Quero pular da ponte). O aplicativo respondeu com uma lista de seis pontes nas proximidades. Um passageiro frustrado tuitou: "@XXX Obrigado por enviar minha bagagem para Hyderabad e me levar para Calcutá ao mesmo tempo. Serviço brilhante. #XXX". O chatbot da companhia aérea respondeu: "Fico feliz em ouvir isso. #KeepFlying XXX." Além disso, o algoritmo de PNL é muito específico ao domínio, portanto, um algoritmo treinado para analisar documentos jurídicos não será adequado para analisar registros médicos.

Por fim, os algoritmos de PNL fornecem melhores resultados para idiomas como o inglês, para o qual há uma grande quantidade de dados disponíveis. Se precisarmos de um desempenho semelhante em idiomas regionais, precisaremos nos esforçar muito para coletar e limpar os dados e treinar esses aplicativos.

Mais cobertura da imprensa

Utilizamos os cookies necessários e/ou tecnologias semelhantes para fazer com que este site funcione e para coletar informações quando você interage com este site para melhorar sua experiência. Ao usar este site, você reconhece e consente com nosso Política de cookies e política de privacidade