O que é Processamento de Linguagem Natural (PLN)

O que é Processamento de Linguagem Natural (PLN)

Processamento de linguagem natural (PLN) é a capacidade de um programa de computador para entender a linguagem humana como ela é falada. O PLN é um componente da inteligência artificial (IA).

O desenvolvimento de aplicativos de PLN é desafiador porque os computadores tradicionalmente exigem que os seres humanos “falem” com eles em uma linguagem de programação precisa, sem ambiguidade e altamente estruturada, ou através de um número limitado de comandos de voz claramente enunciados. A fala humana, no entanto, nem sempre é precisa – muitas vezes é ambígua e a estrutura linguística pode depender de muitas variáveis ​​complexas, incluindo gírias, dialetos regionais e contexto social.

Usos do processamento de linguagem natural

A maior parte dos estudos que está sendo feita no processamento de linguagem natural gira em torno de pesquisa, especialmente da pesquisa corporativa. Isso envolve permitir que os usuários consultem conjuntos de dados na forma de uma pergunta que eles possam representar para outra pessoa. A máquina interpreta os elementos importantes da sentença da linguagem humana, como aqueles que podem corresponder a recursos específicos em um conjunto de dados e retorna uma resposta.

O PLN pode ser usada para interpretar texto livre e torná-lo analisável. Há uma enorme quantidade de informações armazenadas em arquivos de texto livre, como registros médicos de pacientes, por exemplo. Antes dos modelos de processamento de linguagem natural baseados em aprendizagem profunda (deep learning), essa informação era inacessível à análise assistida por computador e não podia ser analisada de nenhum modo sistemático. Mas o PLN permite que os analistas vasculhem enormes quantidades de texto livre para encontrar informações relevantes nos arquivos.

A análise de sentimentos é outro caso de uso primário para o processamento de linguagem natural. Usando a análise de sentimentos, os cientistas de dados podem avaliar comentários nas mídias sociais para ver como a marca de seus negócios está funcionando, por exemplo, ou revisar anotações de equipes de atendimento para identificar áreas onde as pessoas querem que a empresa tenha um desempenho melhor.

O Google e outros mecanismos de busca baseiam sua tecnologia de tradução automática em modelos de aprendizagem profunda do PLN. Isso permite que algoritmos leiam texto em uma página da Web, interpretem seu significado e traduzam para outro idioma.

Como funciona o processamento de linguagem natural

As abordagens atuais do PLN são baseadas em aprendizado profundo, um tipo de IA que examina e usa padrões em dados para melhorar o entendimento de um programa. Os modelos de deep learning exigem quantidades massivas de dados rotulados para treinar e identificar correlações relevantes, e a montagem desse tipo de conjunto de dados grandes é um dos principais obstáculos ao PLN atualmente.

Abordagens anteriores ao PLN envolveram uma abordagem mais baseada em regras, em que algoritmos de machine learning mais simples eram informados sobre quais palavras e frases procurar no texto e respostas específicas quando essas frases apareciam. Mas o deep learning é uma abordagem mais flexível e intuitiva, na qual os algoritmos aprendem a identificar a intenção dos oradores a partir de muitos exemplos, quase como a maneira como uma criança aprenderia a linguagem humana.

Importância do PLN

A vantagem do processamento de linguagem natural pode ser vista ao considerar as duas declarações a seguir: “O seguro de computação em nuvem deve fazer parte de todo contrato de nível de serviço” e “Um bom SLA garante uma noite de sono mais leve – até mesmo na nuvem”. Se você usar o processamento de linguagem, o programa reconhecerá que a computação em nuvem é uma entidade, que a nuvem é uma forma abreviada de computação em nuvem e que o SLA é um acrônimo da indústria de TI para Service Level Agreement ou acordo do nível de serviço.

Esses são os tipos de elementos vagos que aparecem frequentemente na linguagem humana e que os algoritmos de machine learning têm historicamente sido ruins na interpretação. Agora, com melhorias na aprendizagem profunda e inteligência artificial, os algoritmos podem efetivamente interpretá-los.

Isso tem implicações para os tipos de dados que podem ser analisados. Cada vez mais informações estão sendo criadas on-line e muito disso é linguagem humana natural. Até recentemente, as empresas não conseguiam analisar esses dados. Mas os avanços no PLN tornam possível analisar e aprender com uma variedade maior de fontes de dados.

[Total: 0    Média: 0/5]