Notícias

Novo modelo de rede neural pode tornar IA mais transparente

Um novo método de construção de redes neurais artificiais promete simplificar a interpretação do funcionamento da inteligência artificial (IA), segundo estudo conduzido por pesquisadores do MIT. O modelo, chamado Redes Kolmogorov-Arnold (KANs), altera a maneira como os neurônios artificiais processam informações, movendo parte da complexidade para fora das células neurais e tornando mais fácil entender as saídas produzidas por essas redes, segundo informações do MIT Technology Review.

Diferente das redes neurais tradicionais, usadas em modelos como o GPT-4, que dependem de operações matemáticas complexas dentro de cada neurônio, as KANs simplificam essa dinâmica. Nas novas redes, os neurônios somam suas entradas e geram uma saída direta, sem a necessidade de operações adicionais ocultas. A simplificação, que é inspirada no trabalho de matemáticos russos, promete facilitar a compreensão de como as redes chegam a determinados resultados, ajudando a detectar possíveis vieses.

Leia também: De outubro a outubro: o cronograma do conflito entre o X de Elon Musk e o STF

De acordo com os pesquisadores, a nova arquitetura também pode ser mais eficiente. Evidências preliminares sugerem que, à medida que as KANs são ampliadas, sua precisão cresce mais rapidamente em comparação às redes neurais tradicionais, o que pode ter grande impacto em áreas como reconhecimento de imagem e problemas de dinâmica de fluidos.

“É bom ver que as pessoas estão tentando repensar fundamentalmente o design dessas [redes]”, afirmou Andrew Wilson, da Universidade de Nova York, à MIT Technology Review.

As Redes Kolmogorov-Arnold, propostas nos anos 1990, ganharam nova relevância com o avanço promovido por uma equipe do MIT, que desenvolveu e testou redes maiores e mais interpretáveis. Ziming Liu, da equipe, destacou que essa inovação pode acabar com a visão das redes neurais como “caixas-pretas”.

O projeto, embora ainda inicial, já atrai interesse, com exemplos práticos no GitHub que demonstram o uso das KANs em aplicações como reconhecimento de imagens e solução de problemas complexos, como a dinâmica de fluidos.

Apesar do otimismo, a equipe do MIT ressalta que o novo método ainda está em fase experimental e foi testado apenas em pequenos conjuntos de dados sintéticos. Desafios como a aplicabilidade em problemas mais complexos, como reconhecimento de imagem em larga escala, ainda precisam ser superados. Além disso, a publicação também destaca que o treinamento das KANs exige mais tempo e poder computacional em comparação às redes tradicionais.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Pure Storage aposta em mudança de paradigma para gestão de dados corporativos

A Pure Storage está redefinindo sua estratégia de mercado com uma abordagem que abandona o…

4 semanas ago

A inteligência artificial é mesmo uma catalisadora de novos unicórnios?

A inteligência artificial (IA) consolidou-se como a principal catalisadora de novos unicórnios no cenário global…

1 mês ago

Finlândia ativa a maior bateria de areia do mundo

À primeira vista, não parece grande coisa. Mas foi na pequena cidade de Pornainen, na…

1 mês ago

Reforma tributária deve elevar custos com mão de obra no setor de tecnologia

O processo de transição previsto na reforma tributária terá ao menos um impacto negativo sobre…

1 mês ago

Relação entre OpenAI e Microsoft entra em clima de tensão, aponta WSJ

O que antes parecia uma aliança estratégica sólida começa a mostrar rachaduras. Segundo reportagem do…

1 mês ago

OpenAI fecha contrato de US$ 200 milhões com Departamento de Defesa dos EUA

O Departamento de Defesa dos Estados Unidos firmou um contrato de US$ 200 milhões com…

1 mês ago