AiotAiot


Gemini, novo modelo de IA do Google, chega ao smartphone

Pixel 8 Pro é o primeiro celular projetado para rodar o Gemini Nano; modelo multimodal trabalha com textos, imagens, áudio, vídeo e linguagens de programação; veja a tecnologia em ação

08/12/2023

Gemini, novo modelo de IA do Google, chega ao smartphone
Tamanho fonte

Por redação AIoT Brasil

O Google anunciou  o Gemini, que segundo a empresa é o “o modelo de IA mais avançado e o maior projeto científico e tecnológico que a empresa já desenvolveu até agora”. Ele é  o resultado de um esforço colaborativo em grande escala que envolveu vários times do Google, incluindo as equipes do Google DeepMind e Google Research. Veja o vídeo de divulgação que o Google fez para o Gemini:

Em sua primeira versão do modelo, ele é otimizado em três tamanhos diferentes, como explica a empresa abaixo:
Gemini Ultra — o maior e mais hábil modelo para tarefas altamente complexas.
Gemini Pro — o melhor modelo para escalar uma grande variedade de tarefas.
Gemini Nano — o modelo mais eficiente para realizar tarefas em dispositivos.

Mas o que é o Gemini?
É um modelo de IA multimodal, com capacidade de organizar, compreender, operar e combinar diferentes tipos de informação, incluindo:

  • Textos
  • Imagens
  • Áudios
  • Vídeos
  • Linguagens de programação

Esse é também o modelo de IA mais flexível do Google, capaz de funcionar, segundo a empresa, com eficiência desde dispositivos móveis até data centers.

Até agora, o método padrão para a criação de modelos multimodais envolvia treinar componentes separados para diferentes modalidades e depois juntá-los para imitar algumas dessas funcionalidades. Às vezes, esses modelos podem ser bons na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com raciocínios mais conceituais e complexos.

Por isso, o Google projetou o Gemini para ser um modelo multimodal nativo, ou seja, previamente treinado desde o início em diferentes modalidades. E aperfeiçou o modelo com dados multimodais adicionais para refinar ainda mais a sua eficácia.

Isso ajuda o Gemini a compreender e raciocinar sobre todos os tipos de informações desde o começo.

O Bard com Gemini Pro está disponível em inglês em mais de 170 países e territórios . Ele terá capacidade de compreender, resumir, raciocinar, fazer brainstorming, escrever e planejar. Essa é a maior melhoria de qualidade do Bard desde o seu lançamento

E o Gemini está disponível também para o Pixel . O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como “Summarize no aplicativo Recorder” e lançando o “Smart Reply” no Gboard, começando pelo WhatsApp e, no próximo ano, em mais aplicativos de mensagens.

Nos próximos meses, o Gemini estará disponível em mais dos principais produtos e serviços do Google, como a Busca, Ads, Chrome e Duet AI.

TAGS

#Gemini#google#Google DeepMind#Google Research#IA#IA multimodal

COMPARTILHE

Notícias Relacionadas