Novo assistente de voz da Kyutai desafia líderes de mercado da IA

Laboratório francês de pesquisa em IA apoiado por investidores de peso, lança o Moshi, um assistente de voz inovador com capacidade de 70 emoções

Author Photo
5:00 pm - 04 de julho de 2024
Xavier Niel, investidor na Kyutai. Imagem: Shutterstock

Em um evento realizado na última quarta-feira (03) em Paris, o laboratório de pesquisa em inteligência artificial Kyutai apresentou seu novo assistente de voz, o Moshi. O assistente surge como um forte concorrente ao ChatGPT, da OpenAI, destacando-se por sua capacidade de expressar 70 diferentes emoções e estilos, uma inovação que promete transformar a interação entre humanos e máquinas.

O Moshi surge como um forte concorrente ao ChatGPT da OpenAI, um dos chatbots mais conhecidos do mercado. “Acreditamos que o Moshi tem um potencial tremendo para mudar a forma como nos comunicamos com e através das máquinas”, disse Patrick Pérez, CEO da Kyutai, durante a apresentação do Moshi. Na ocasião, o assistente demonstrou habilidades impressionantes em relação aos modelos lançados até o momento, como oferecer conselhos sobre a escalada do Monte Everest e recitar um poema com um marcado sotaque francês.

A Kyutai, que foi fundada no ano passado, conta com um robusto financiamento de € 300 milhões (aproximadamente US$ 324 milhões), com contribuições significativas de investidores como os bilionários Xavier Niel, Rodolphe Saadé, e Eric Schmidt, ex-presidente do Google.

Leia também: 5 dicas para usar de forma efetiva a Inteligência Artificial 

Em uma iniciativa de transparência e colaboração, a Kyutai anunciou que tornará seus modelos e pesquisas subjacentes ao Moshi disponíveis como tecnologia de código aberto. Isso permitirá que desenvolvedores e pesquisadores ao redor do mundo acessem e aprimorem a tecnologia. “O Moshi é o primeiro assistente de IA de voz em tempo real lançado”, afirmou Pérez, enfatizando a importância da inovação aberta para o avanço da tecnologia.

Apesar das promessas e do entusiasmo, a Kyutai não ignorou as preocupações com a segurança. Hervé Jégou, Chief Science Officer da Kyutai, mencionou brevemente durante o evento que a empresa utilizará ferramentas de indexação e marcação d’água para identificar e rastrear o áudio gerado pela IA, visando mitigar possíveis abusos da tecnologia.

O desenvolvimento do Moshi envolveu a colaboração de uma atriz de voz identificada apenas como Alice, cuja contribuição foi crucial para treinar o modelo de IA.

“Todos os produtos que mostraram hoje são os melhores da classe mundial”, afirmou Xavier Niel em entrevista durante o evento. “Estamos muito felizes por ter isso na Europa”.

*Com informações da Bloomberg

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.