Novo modelo de rede neural pode tornar IA mais transparente

Imagem: Shutterstock

Um novo método de construção de redes neurais artificiais promete simplificar a interpretação do funcionamento da inteligência artificial (IA), segundo estudo conduzido por pesquisadores do MIT. O modelo, chamado Redes Kolmogorov-Arnold (KANs), altera a maneira como os neurônios artificiais processam informações, movendo parte da complexidade para fora das células neurais e tornando mais fácil entender as saídas produzidas por essas redes, segundo informações do MIT Technology Review.

Diferente das redes neurais tradicionais, usadas em modelos como o GPT-4, que dependem de operações matemáticas complexas dentro de cada neurônio, as KANs simplificam essa dinâmica. Nas novas redes, os neurônios somam suas entradas e geram uma saída direta, sem a necessidade de operações adicionais ocultas. A simplificação, que é inspirada no trabalho de matemáticos russos, promete facilitar a compreensão de como as redes chegam a determinados resultados, ajudando a detectar possíveis vieses.

De acordo com os pesquisadores, a nova arquitetura também pode ser mais eficiente. Evidências preliminares sugerem que, à medida que as KANs são ampliadas, sua precisão cresce mais rapidamente em comparação às redes neurais tradicionais, o que pode ter grande impacto em áreas como reconhecimento de imagem e problemas de dinâmica de fluidos.

“É bom ver que as pessoas estão tentando repensar fundamentalmente o design dessas [redes]”, afirmou Andrew Wilson, da Universidade de Nova York, à MIT Technology Review.

As Redes Kolmogorov-Arnold, propostas nos anos 1990, ganharam nova relevância com o avanço promovido por uma equipe do MIT, que desenvolveu e testou redes maiores e mais interpretáveis. Ziming Liu, da equipe, destacou que essa inovação pode acabar com a visão das redes neurais como “caixas-pretas”.

O projeto, embora ainda inicial, já atrai interesse, com exemplos práticos no GitHub que demonstram o uso das KANs em aplicações como reconhecimento de imagens e solução de problemas complexos, como a dinâmica de fluidos.

Apesar do otimismo, a equipe do MIT ressalta que o novo método ainda está em fase experimental e foi testado apenas em pequenos conjuntos de dados sintéticos. Desafios como a aplicabilidade em problemas mais complexos, como reconhecimento de imagem em larga escala, ainda precisam ser superados. Além disso, a publicação também destaca que o treinamento das KANs exige mais tempo e poder computacional em comparação às redes tradicionais.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!