AiotAiot


Novo modelo de IA chega para brigar com GPT-4o

Desenvolvido pela organização sem fins lucrativos Ai2 (criada em 2014 por Paul Allen, o lendário cofundador da Microsoft), o Molmo utiliza código aberto

07/10/2024

Novo modelo de IA chega para brigar com GPT-4o
Tamanho fonte

Por redação AIoT Brasil

O Allen Institute for Artificial Intelligence (Ai2), uma organização de pesquisa sem fins lucrativos criada em 2014 por Paul Allen, o lendário cofundador da Microsoft, acaba de apresentar ao mercado uma família de modelos de linguagem de código aberto que promete concorrer em pé de igualdade com a OpenAI, o Google e a Anthropic. Com o lançamento, o Ai2 pretende mostrar que o desenvolvimento de IA de código aberto já se encontra no mesmo nível dos modelos fechados e proprietários utilizados pelas big techs.

Chamada de Molmo, a série tem modelos multimodais de diferentes tamanhos, o maior com 72 bilhões de parâmetros e o menor com 1 bilhão – o que parece pouco quando comparado com o GPT-4o da OpenAI, que trabalha com mais de 1 trilhão de parâmetros. Porém, é nesse aspecto que se destaca o diferencial do Molmo: de acordo com o Ai2, nos testes que medem habilidades como compreensão de imagens, gráficos e documentos, o modelo de código aberto apresentou um desempenho semelhante ou superior ao GPT-4o.

O segredo, segundo Ani Kembhavi, diretor de pesquisa do Ai2, está nos critérios aplicados no treinamento do Molmo: “Os modelos foram treinados em um conjunto de dados significativamente menor e selecionado com mais cuidado, contendo apenas 600 mil imagens e entre 1 bilhão e 72 bilhões de parâmetros. Esse foco em dados de alta qualidade, em vez de em dados coletados de forma indiscriminada, levou a um bom desempenho com muito menos recursos”, afirmou.

Para isso, assistentes humanos do Ai2 descreveram em detalhes as imagens do conjunto de dados de treinamento. Depois, foram usadas técnicas de IA para converter essas descrições orais em dados, o que acelerou o processo de treinamento e reduziu o nível de recursos computacionais necessários.

A demonstração do Molmo está disponível, e em breve os desenvolvedores poderão explorá-la no site Hugging Face, embora certos elementos do modelo mais poderoso ainda estejam protegidos do acesso público. Ali Farhadi, CEO do Ai2, explicou que os modelos de código aberto apresentam uma vantagem significativa, já que permitem que qualquer usuário construa livremente suas aplicações. “Nosso trabalho mostra que a IA de código aberto também pode ser construída de maneira a fazer uso eficiente de dinheiro e tempo”, acrescentou.

TAGS

#código aberto#GPT-4o#IA de código aberto#modelos de linguagem#open AI

COMPARTILHE

Notícias Relacionadas