IA de Elon Musk viraliza depois de sugerir voto em Lula
Grok provoca polêmica ao dizer que escolheria o presidente pelo seu alinhamento com a democracia, o meio ambiente e o bem-estar social
04/04/202507/10/2024
Por redação AIoT Brasil
O Allen Institute for Artificial Intelligence (Ai2), uma organização de pesquisa sem fins lucrativos criada em 2014 por Paul Allen, o lendário cofundador da Microsoft, acaba de apresentar ao mercado uma família de modelos de linguagem de código aberto que promete concorrer em pé de igualdade com a OpenAI, o Google e a Anthropic. Com o lançamento, o Ai2 pretende mostrar que o desenvolvimento de IA de código aberto já se encontra no mesmo nível dos modelos fechados e proprietários utilizados pelas big techs.
Chamada de Molmo, a série tem modelos multimodais de diferentes tamanhos, o maior com 72 bilhões de parâmetros e o menor com 1 bilhão – o que parece pouco quando comparado com o GPT-4o da OpenAI, que trabalha com mais de 1 trilhão de parâmetros. Porém, é nesse aspecto que se destaca o diferencial do Molmo: de acordo com o Ai2, nos testes que medem habilidades como compreensão de imagens, gráficos e documentos, o modelo de código aberto apresentou um desempenho semelhante ou superior ao GPT-4o.
O segredo, segundo Ani Kembhavi, diretor de pesquisa do Ai2, está nos critérios aplicados no treinamento do Molmo: “Os modelos foram treinados em um conjunto de dados significativamente menor e selecionado com mais cuidado, contendo apenas 600 mil imagens e entre 1 bilhão e 72 bilhões de parâmetros. Esse foco em dados de alta qualidade, em vez de em dados coletados de forma indiscriminada, levou a um bom desempenho com muito menos recursos”, afirmou.
Para isso, assistentes humanos do Ai2 descreveram em detalhes as imagens do conjunto de dados de treinamento. Depois, foram usadas técnicas de IA para converter essas descrições orais em dados, o que acelerou o processo de treinamento e reduziu o nível de recursos computacionais necessários.
A demonstração do Molmo está disponível, e em breve os desenvolvedores poderão explorá-la no site Hugging Face, embora certos elementos do modelo mais poderoso ainda estejam protegidos do acesso público. Ali Farhadi, CEO do Ai2, explicou que os modelos de código aberto apresentam uma vantagem significativa, já que permitem que qualquer usuário construa livremente suas aplicações. “Nosso trabalho mostra que a IA de código aberto também pode ser construída de maneira a fazer uso eficiente de dinheiro e tempo”, acrescentou.
#código aberto#GPT-4o#IA de código aberto#modelos de linguagem#open AI
Grok provoca polêmica ao dizer que escolheria o presidente pelo seu alinhamento com a democracia, o meio ambiente e o bem-estar social
04/04/2025IA de busca lançada no Brasil em agosto do ano passado promete resumos concisos e relevantes e aprofundamento das pesquisas
03/04/2025Os dois filmes do partido foram produzidos inteiramente com a tecnologia e alertam para o risco de manipulação nas eleições
02/04/2025