Novo modelo de rede neural pode tornar IA mais transparente

A abordagem simplificada facilita a interpretação de como as redes neurais tomam decisões e pode aumentar sua precisão

Author Photo
5:30 pm - 10 de outubro de 2024
Imagem: Shutterstock

Um novo método de construção de redes neurais artificiais promete simplificar a interpretação do funcionamento da inteligência artificial (IA), segundo estudo conduzido por pesquisadores do MIT. O modelo, chamado Redes Kolmogorov-Arnold (KANs), altera a maneira como os neurônios artificiais processam informações, movendo parte da complexidade para fora das células neurais e tornando mais fácil entender as saídas produzidas por essas redes, segundo informações do MIT Technology Review.

Diferente das redes neurais tradicionais, usadas em modelos como o GPT-4, que dependem de operações matemáticas complexas dentro de cada neurônio, as KANs simplificam essa dinâmica. Nas novas redes, os neurônios somam suas entradas e geram uma saída direta, sem a necessidade de operações adicionais ocultas. A simplificação, que é inspirada no trabalho de matemáticos russos, promete facilitar a compreensão de como as redes chegam a determinados resultados, ajudando a detectar possíveis vieses.

Leia também: De outubro a outubro: o cronograma do conflito entre o X de Elon Musk e o STF

De acordo com os pesquisadores, a nova arquitetura também pode ser mais eficiente. Evidências preliminares sugerem que, à medida que as KANs são ampliadas, sua precisão cresce mais rapidamente em comparação às redes neurais tradicionais, o que pode ter grande impacto em áreas como reconhecimento de imagem e problemas de dinâmica de fluidos.

“É bom ver que as pessoas estão tentando repensar fundamentalmente o design dessas [redes]”, afirmou Andrew Wilson, da Universidade de Nova York, à MIT Technology Review.

As Redes Kolmogorov-Arnold, propostas nos anos 1990, ganharam nova relevância com o avanço promovido por uma equipe do MIT, que desenvolveu e testou redes maiores e mais interpretáveis. Ziming Liu, da equipe, destacou que essa inovação pode acabar com a visão das redes neurais como “caixas-pretas”.

O projeto, embora ainda inicial, já atrai interesse, com exemplos práticos no GitHub que demonstram o uso das KANs em aplicações como reconhecimento de imagens e solução de problemas complexos, como a dinâmica de fluidos.

Apesar do otimismo, a equipe do MIT ressalta que o novo método ainda está em fase experimental e foi testado apenas em pequenos conjuntos de dados sintéticos. Desafios como a aplicabilidade em problemas mais complexos, como reconhecimento de imagem em larga escala, ainda precisam ser superados. Além disso, a publicação também destaca que o treinamento das KANs exige mais tempo e poder computacional em comparação às redes tradicionais.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.