OpenAI é acusada na Índia de violação de direitos autorais
Processo foi aberto por uma das principais agências de notícias do país e envolve dados usados no treinamento do ChatGPT
21/11/202407/10/2024
Por redação AIoT Brasil
O Allen Institute for Artificial Intelligence (Ai2), uma organização de pesquisa sem fins lucrativos criada em 2014 por Paul Allen, o lendário cofundador da Microsoft, acaba de apresentar ao mercado uma família de modelos de linguagem de código aberto que promete concorrer em pé de igualdade com a OpenAI, o Google e a Anthropic. Com o lançamento, o Ai2 pretende mostrar que o desenvolvimento de IA de código aberto já se encontra no mesmo nível dos modelos fechados e proprietários utilizados pelas big techs.
Chamada de Molmo, a série tem modelos multimodais de diferentes tamanhos, o maior com 72 bilhões de parâmetros e o menor com 1 bilhão – o que parece pouco quando comparado com o GPT-4o da OpenAI, que trabalha com mais de 1 trilhão de parâmetros. Porém, é nesse aspecto que se destaca o diferencial do Molmo: de acordo com o Ai2, nos testes que medem habilidades como compreensão de imagens, gráficos e documentos, o modelo de código aberto apresentou um desempenho semelhante ou superior ao GPT-4o.
O segredo, segundo Ani Kembhavi, diretor de pesquisa do Ai2, está nos critérios aplicados no treinamento do Molmo: “Os modelos foram treinados em um conjunto de dados significativamente menor e selecionado com mais cuidado, contendo apenas 600 mil imagens e entre 1 bilhão e 72 bilhões de parâmetros. Esse foco em dados de alta qualidade, em vez de em dados coletados de forma indiscriminada, levou a um bom desempenho com muito menos recursos”, afirmou.
Para isso, assistentes humanos do Ai2 descreveram em detalhes as imagens do conjunto de dados de treinamento. Depois, foram usadas técnicas de IA para converter essas descrições orais em dados, o que acelerou o processo de treinamento e reduziu o nível de recursos computacionais necessários.
A demonstração do Molmo está disponível, e em breve os desenvolvedores poderão explorá-la no site Hugging Face, embora certos elementos do modelo mais poderoso ainda estejam protegidos do acesso público. Ali Farhadi, CEO do Ai2, explicou que os modelos de código aberto apresentam uma vantagem significativa, já que permitem que qualquer usuário construa livremente suas aplicações. “Nosso trabalho mostra que a IA de código aberto também pode ser construída de maneira a fazer uso eficiente de dinheiro e tempo”, acrescentou.
#código aberto#GPT-4o#IA de código aberto#modelos de linguagem#open AI
Processo foi aberto por uma das principais agências de notícias do país e envolve dados usados no treinamento do ChatGPT
21/11/2024O AIoT Brasil acompanhará de perto um dos mais importantes eventos de tecnologia do mundo, que deverá receber mais de 70 mil participantes
11/11/2024Confira novas profissões que estão surgindo com a inteligência artificial e saiba como se preparar para esse mercado em expansão
05/11/2024