Google apresenta o modelo experimental de IA Gemini 2.0

Disponível para desenvolvedores e parceiros, a nova versão oferece geração nativa de imagens e áudio, entre outras funcionalidades

13/12/2024

Google apresenta o modelo experimental de IA Gemini 2.0

Tamanho fonte

Por Ricardo Marques da Silva

O Google acaba de apresentar ao mercado a nova versão do seu modelo de IA Gemini, que havia sido lançado em dezembro do ano passado como o mais forte concorrente do ChatGPT e rapidamente conquistou os usuários. Trata-se do Gemini 2.0, o modelo mais avançado já desenvolvido pela big tech californiana, com recursos que incluem suporte a entradas multimodais, como imagens, vídeos e áudio, além da geração de saídas multimodais e imagens nativas combinadas com texto e áudio multilíngue ajustável por meio de texto-para-fala (TTS).

Em um comunicado publicado em seu blog, assinado pelo seu próprio CEO, Sundar Pichai, o Google disse que o Gemini 2.0 “abre caminho para agentes de IA ainda mais sofisticados que se aproximam do objetivo de criar um assistente universal”. Por enquanto, o novo modelo está disponível para desenvolvedores e “parceiros de confiança” e o objetivo é, segundo o Google, integrá-lo rapidamente aos seus produtos, começando pela plataforma Gemini e pelo Search.

Enquanto isso não ocorre, os usuários do Gemini terão acesso à versão experimental do Gemini 2.0 Flash no Google AI Studio e no Vertex AI. Basta escolher essa opção no menu de modelos, disponível para computadores e dispositivos móveis. A disponibilidade geral está planejada para janeiro, juntamente com novas opções de tamanhos de modelo.

Também foi lançada a funcionalidade Deep Research, que utiliza raciocínio avançado e contexto expandido para atuar como um assistente de pesquisa capaz de explorar temas complexos e criar relatórios detalhados. Essa ferramenta já está disponível no Gemini Advanced.

“Nenhum produto mudou tanto com a IA quanto o Google Search. Overviews criados por IA já chegam a 1 bilhão de pessoas, abrindo espaço para novos tipos de perguntas e rapidamente se tornando uma das funcionalidades mais populares do Search”, disse Sundar Pichai. “O próximo passo será levar a capacidade de raciocínio avançado do Gemini 2.0 para os overviews criados por IA, para abordar temas mais complexos e questões em várias etapas, como equações matemáticas avançadas, consultas multimodais e programação”, acrescentou.

Os primeiros testes já começaram, e o lançamento do modelo mais abrangente está previsto para o início de 2025. O Gemini 2.0 foi desenvolvido com hardware personalizado e com o Trillium, a sexta geração das TPUs do Google, que alimentaram todo o treinamento e o processamento do modelo. Agora o Trillium está disponível para clientes que desejam criar suas próprias soluções com essa tecnologia.

COMPARTILHE

Notícias Relacionadas

OpenAI fecha acordo bilionário com a Disney para licenciamento de personagens

Negócio levará personagens da Disney à ferramenta de IA Sora, prevê um investimento de US$ 1 bilhão em ações da OpenAI e assegura os direitos autorais na geração de vídeos

17/12/2025

Google anuncia o lançamento de tradução de voz em tempo real

Versão beta está sendo disponibilizada nos EUA, México e Índia para mais de 70 idiomas e deverá chegar a outros países em 2026

16/12/2025

A arte feita com IA começa a ganhar um respeito inesperado

Por trás de muita banalidade, alguns artistas que usam a tecnologia estão sendo reconhecidos e já chegam a museus e galerias

15/12/2025