Gemini, novo modelo de IA do Google, chega ao smartphone
Pixel 8 Pro é o primeiro celular projetado para rodar o Gemini Nano; modelo multimodal trabalha com textos, imagens, áudio, vídeo e linguagens de programação; veja a tecnologia em ação
08/12/2023
Tamanho fonte
Por redação AIoT Brasil
O Google anunciou o Gemini, que segundo a empresa é o “o modelo de IA mais avançado e o maior projeto científico e tecnológico que a empresa já desenvolveu até agora”. Ele é o resultado de um esforço colaborativo em grande escala que envolveu vários times do Google, incluindo as equipes do Google DeepMind e Google Research. Veja o vídeo de divulgação que o Google fez para o Gemini:
Em sua primeira versão do modelo, ele é otimizado em três tamanhos diferentes, como explica a empresa abaixo: Gemini Ultra — o maior e mais hábil modelo para tarefas altamente complexas. Gemini Pro — o melhor modelo para escalar uma grande variedade de tarefas. Gemini Nano — o modelo mais eficiente para realizar tarefas em dispositivos.
Mas o que é o Gemini?
É um modelo de IA multimodal, com capacidade de organizar, compreender, operar e combinar diferentes tipos de informação, incluindo:
Textos
Imagens
Áudios
Vídeos
Linguagens de programação
Esse é também o modelo de IA mais flexível do Google, capaz de funcionar, segundo a empresa, com eficiência desde dispositivos móveis até data centers.
Até agora, o método padrão para a criação de modelos multimodais envolvia treinar componentes separados para diferentes modalidades e depois juntá-los para imitar algumas dessas funcionalidades. Às vezes, esses modelos podem ser bons na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com raciocínios mais conceituais e complexos.
Por isso, o Google projetou o Gemini para ser um modelo multimodal nativo, ou seja, previamente treinado desde o início em diferentes modalidades. E aperfeiçou o modelo com dados multimodais adicionais para refinar ainda mais a sua eficácia.
Isso ajuda o Gemini a compreender e raciocinar sobre todos os tipos de informações desde o começo.
O Bard com Gemini Pro está disponível em inglês em mais de 170 países e territórios . Ele terá capacidade de compreender, resumir, raciocinar, fazer brainstorming, escrever e planejar. Essa é a maior melhoria de qualidade do Bard desde o seu lançamento
E o Gemini está disponível também para o Pixel . O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como “Summarize no aplicativo Recorder” e lançando o “Smart Reply” no Gboard, começando pelo WhatsApp e, no próximo ano, em mais aplicativos de mensagens.
Nos próximos meses, o Gemini estará disponível em mais dos principais produtos e serviços do Google, como a Busca, Ads, Chrome e Duet AI.