Alibaba lança modelo de IA que afirma superar o DeepSeek

Qwen 2.5 promete superar o amplamente elogiado DeepSeek-V3, segundo informações da Reuters

Author Photo
3:20 pm - 29 de janeiro de 2025
Imagem: Shutterstock

A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial (IA), o Qwen 2.5, afirmando que ele supera o amplamente elogiado DeepSeek-V3.

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está descansando com suas famílias, aponta para a pressão gerada pelo crescimento meteórico da startup chinesa DeepSeek nas últimas três semanas. Esse crescimento impactou não apenas concorrentes internacionais, mas também rivais domésticos.

Leia também: Pesquisa indica que 49% das empresas estão reduzindo investimentos em IA, no Brasil

Alibaba desafia gigantes da IA

“O Qwen 2.5-Max supera… quase em todos os aspectos os modelos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat. A declaração faz referência aos modelos de IA mais avançados da OpenAI e da Meta.

A imprensa internacional tem falado que o lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, seguido pelo lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e causou queda nas ações de empresas de tecnologia. Os baixos custos de desenvolvimento e uso do DeepSeek levaram investidores a questionar os altos gastos planejados pelas principais empresas de IA dos Estados Unidos.

No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance (dona do TikTok) lançou uma atualização do seu modelo de IA principal, afirmando que ele superava o modelo o1, da OpenAI, em AIME, um teste de referência que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas. Isso ecoou a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.

DeepSeek versus concorrência na China

O modelo DeepSeek-V2, antecessor do V3, já havia desencadeado uma guerra de preços de modelos de IA na China quando foi lançado em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato – custando apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a Alibaba Cloud a anunciar reduções de preços de até 97% em uma variedade de seus modelos.

Outras gigantes chinesas de tecnologia seguiram o mesmo caminho, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a Tencent, a empresa de internet mais valiosa do país.

O enigmático fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista ao portal chinês Waves, em julho, que a startup “não se importava” com guerras de preços e que seu principal objetivo era alcançar a Inteligência Artificial Geral (AGI).

A OpenAI define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, contam com centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, formado principalmente por jovens graduados e doutorandos das melhores universidades da China.

Na entrevista de julho, Liang afirmou que as maiores empresas de tecnologia da China podem não estar preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas hierárquicas rígidas com a operação enxuta e a gestão flexível da DeepSeek.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.

 

Pular para a barra de ferramentas