O que são Redes Neurais Artificiais? Tipos e Aplicações

O que são Redes Neurais Artificiais? Tipos e Aplicações

Em tecnologia da informação (TI), redes neurais artificiais são sistemas de hardware ou software padronizados baseados no funcionamento de neurônios no cérebro humano. Redes neurais – também chamadas de redes neurais artificiais – são uma variedade de tecnologia de aprendizagem profunda, que também se enquadra no âmbito da inteligência artificial, ou IA.

Aplicações comerciais dessas tecnologias geralmente se concentram na solução de problemas complexos de processamento de sinais ou reconhecimento de padrões. Exemplos de aplicações comerciais significativas desde 2000 incluem reconhecimento de manuscrito para processamento de cheques, transcrição de fala para texto, análise de dados de exploração de petróleo, previsão de tempo e reconhecimento facial.

Como funcionam

Uma rede neural geralmente envolve um grande número de processadores operando em paralelo e organizados em camadas. O primeiro nível recebe a informação de entrada bruta – análoga aos nervos ópticos no processamento visual humano. Cada camada sucessiva recebe a saída da camada que a precede, e não a entrada bruta – da mesma forma que os neurônios mais distantes do nervo óptico recebem sinais daqueles que estão mais próximos a ela. O último nível produz a saída do sistema.

Cada nó de processamento tem sua própria pequena esfera de conhecimento, incluindo o que viu e as regras para as quais foi originalmente programado ou desenvolvido para si próprio. As camadas são altamente interconectadas, o que significa que cada nó na camada n será conectado a muitos nós na camada n-1– suas entradas – e na camada n + 1, que fornece entrada para esses nós. Pode haver um ou vários nós na camada de saída, a partir dos quais a resposta produzida pode ser lida.

As redes neurais são notáveis ​​por serem adaptativas, o que significa que elas se modificam à medida que aprendem com o treinamento inicial e as corridas subsequentes fornecem mais informações sobre o mundo. O modelo de aprendizado mais básico está centrado na ponderação dos fluxos de entrada, que é como cada nó pondera a importância da entrada de cada um de seus predecessores. Entradas que contribuem para obter respostas corretas são mais pesadas.

Como as redes neurais aprendem

Normalmente, uma rede neural é inicialmente treinada ou recebe grandes quantidades de dados. O treinamento consiste em fornecer entrada e dizer à rede qual deve ser a saída. Por exemplo, para construir uma rede para identificar os rostos dos atores, o treinamento inicial pode ser uma série de imagens de atores, não-atores, máscaras, estátuas, rostos de animais e assim por diante. Cada entrada é acompanhada pela identificação correspondente, como nomes dos atores, informações “não-ator” ou “não-humano”. Fornecer as respostas permite que o modelo ajuste suas ponderações internas para aprender a fazer melhor seu trabalho.

Ao definir as regras e fazer determinações – ou seja, cada nó decide o que enviar para o próximo nível com base em suas próprias entradas do nível anterior – as redes neurais usam vários princípios. Estes incluem treinamento baseado em gradiente, lógica fuzzy, algoritmos genéticos e métodos Bayesianos. Eles podem receber algumas regras básicas sobre relacionamentos de objetos no espaço que está sendo modelado. Por exemplo, um sistema de reconhecimento facial pode ser instruído: “As sobrancelhas são encontradas acima dos olhos” ou “Os bigodes estão abaixo do nariz. Os bigodes estão acima e/ou ao lado da boca”. As regras de pré-carregamento podem tornar o treinamento mais rápido e tornar o modelo mais poderoso mais cedo. Mas também se baseia em suposições sobre a natureza do espaço do problema, que pode revelar-se irrelevante e inútil ou incorreto e contraproducente, tornando a decisão sobre o que, se houver, é muito importante.

Além disso, as suposições que as pessoas fazem quando treinam algoritmos fazem com que as redes neurais amplifiquem os vieses culturais. Conjuntos de dados tendenciosos são um desafio constante em sistemas de treinamento que encontram respostas por conta própria, reconhecendo padrões em dados. Se os dados que alimentam o algoritmo não são neutros – e quase nenhum dado é – a máquina propaga o viés.

Tipos de redes neurais artificiais

Às vezes, redes neurais são descritas em termos de profundidade, incluindo quantas camadas elas têm entre entrada e saída, ou as chamadas camadas ocultas do modelo. É por isso que o termo rede neural é usado quase como sinônimo de aprendizado profundo. Eles também podem ser descritos pelo número de nós ocultos que o modelo possui ou em termos de quantas entradas e saídas cada nó possui. Variações no design da rede neural clássica permitem várias formas de propagação direta e reversa de informações entre camadas.

A variante mais simples é a rede neural feed-forward. Esse tipo de algoritmo de rede neural artificial passa informações diretamente da entrada para os nós de processamento e saídas. Pode ou não ter camadas de nós ocultos, tornando seu funcionamento mais interpretável.

Mais complexas são as redes neurais recorrentes. Esses algoritmos de aprendizado profundo salvam a saída dos nós de processamento e alimentam o resultado de volta ao modelo. É assim que se diz que o modelo aprende.

Redes neurais convolucionais são populares hoje em dia, particularmente no domínio do reconhecimento de imagens. Este tipo específico de algoritmo de rede neural tem sido usado em muitas das aplicações mais avançadas de IA, incluindo reconhecimento facial, digitalização de texto e processamento de linguagem natural.

Aplicações

O reconhecimento de imagem foi uma das primeiras áreas em que as redes neurais foram aplicadas com sucesso, mas os usos da tecnologia se expandiram para muitas outras áreas, incluindo:

Estas são apenas algumas áreas específicas às quais as redes neurais estão sendo aplicadas hoje. Usos principais envolvem qualquer processo que opera de acordo com regras ou padrões rígidos e possui grandes quantidades de dados. Se os dados envolvidos forem muito grandes para um humano entender em um período de tempo razoável, o processo provavelmente será um dos principais candidatos à automação por meio de redes neurais artificiais.

História das redes neurais artificiais

A história das redes neurais artificiais remonta aos primórdios da computação. Em 1943, os matemáticos Warren McCulloch e Walter Pitts construíram um sistema de circuitos destinado a aproximar o funcionamento do cérebro humano que executava algoritmos simples.

Em 1957, o pesquisador da Universidade de Cornell, Frank Rosenblatt, desenvolveu o perceptron, um algoritmo projetado para executar o reconhecimento avançado de padrões, em última análise, construindo a capacidade de as máquinas reconhecerem objetos em imagens. Mas o perceptron não cumpriu sua promessa e, durante a década de 1960, a pesquisa de redes neurais artificiais caiu.

Em 1969, os pesquisadores do MIT Marvin Minsky e Seymour Papert publicaram o livro Perceptrons, que detalhava várias questões com redes neurais, incluindo o fato de que os computadores da época eram limitados demais em sua capacidade de processamento para processar os dados necessários para redes neurais operarem como pretendido. Muitos acham que este livro levou a um prolongado “inverno artificial”, no qual a pesquisa de redes neurais cessou.

Não foi até cerca de 2010 que a pesquisa se recuperou novamente. A tendência dos grandes volumes de dados, em que as empresas acumulam grandes quantidades de dados, e a computação paralela deram aos cientistas de dados os dados de treinamento e os recursos de computação necessários para executar redes neurais artificiais complexas. Em 2012, uma rede neural conseguiu superar o desempenho humano em uma tarefa de reconhecimento de imagem como parte da competição ImageNet. Desde então, o interesse em redes neurais artificiais aumentou e a tecnologia continua a melhorar.

[Total: 1    Média: 5/5]