AiotAiot


Google apresenta o modelo experimental de IA Gemini 2.0

Disponível para desenvolvedores e parceiros, a nova versão oferece geração nativa de imagens e áudio, entre outras funcionalidades

13/12/2024

Google apresenta o modelo experimental de IA Gemini 2.0
Tamanho fonte

Por Ricardo Marques da Silva

O Google acaba de apresentar ao mercado a nova versão do seu modelo de IA Gemini, que havia sido lançado em dezembro do ano passado como o mais forte concorrente do ChatGPT e rapidamente conquistou os usuários. Trata-se do Gemini 2.0, o modelo mais avançado já desenvolvido pela big tech californiana, com recursos que incluem suporte a entradas multimodais, como imagens, vídeos e áudio, além da geração de saídas multimodais e imagens nativas combinadas com texto e áudio multilíngue ajustável por meio de texto-para-fala (TTS).

Em um comunicado publicado em seu blog, assinado pelo seu próprio CEO, Sundar Pichai, o Google disse que o Gemini 2.0 “abre caminho para agentes de IA ainda mais sofisticados que se aproximam do objetivo de criar um assistente universal”. Por enquanto, o novo modelo está disponível para desenvolvedores e “parceiros de confiança” e o objetivo é, segundo o Google, integrá-lo rapidamente aos seus produtos, começando pela plataforma Gemini e pelo Search.

Enquanto isso não ocorre, os usuários do Gemini terão acesso à versão experimental do Gemini 2.0 Flash no Google AI Studio e no Vertex AI. Basta escolher essa opção no menu de modelos, disponível para computadores e dispositivos móveis. A disponibilidade geral está planejada para janeiro, juntamente com novas opções de tamanhos de modelo.

Também foi lançada a funcionalidade Deep Research, que utiliza raciocínio avançado e contexto expandido para atuar como um assistente de pesquisa capaz de explorar temas complexos e criar relatórios detalhados. Essa ferramenta já está disponível no Gemini Advanced.

“Nenhum produto mudou tanto com a IA quanto o Google Search. Overviews criados por IA já chegam a 1 bilhão de pessoas, abrindo espaço para novos tipos de perguntas e rapidamente se tornando uma das funcionalidades mais populares do Search”, disse Sundar Pichai. “O próximo passo será levar a capacidade de raciocínio avançado do Gemini 2.0 para os overviews criados por IA, para abordar temas mais complexos e questões em várias etapas, como equações matemáticas avançadas, consultas multimodais e programação”, acrescentou.

Os primeiros testes já começaram, e o lançamento do modelo mais abrangente está previsto para o início de 2025. O Gemini 2.0 foi desenvolvido com hardware personalizado e com o Trillium, a sexta geração das TPUs do Google, que alimentaram todo o treinamento e o processamento do modelo. Agora o Trillium está disponível para clientes que desejam criar suas próprias soluções com essa tecnologia.

TAGS

#Gemini 2.0

COMPARTILHE

Notícias Relacionadas