Gemini: o novo modelo de IA revolucionário do Google.

BlogDicas

,

Dicas

,

Dicas e novidades

Gemini é um modelo de IA multimodal do Google que pode compreender não apenas texto, mas também vídeo, imagens e áudio. Ele também pode compreender e gerar código e gerar texto e imagens combinados.

Outro recurso interessante é que ele pode compreender idiomas visualmente. Por exemplo, se você mostrar a câmera de uma partitura musical com notação italiana, ele será capaz de entender o que isso significa e explicar de volta para você.

Gemini é a IA “maior e mais capaz” do Google, que pode processar imagens, vídeo, texto e até áudio. 

O início de uma nova era de IA no Google, diz o CEO Sundar Pichai: a era Gemini. Gemini é o mais recente modelo de linguagem grande do Google, que Pichai apresentou pela primeira vez na conferência de desenvolvedores I/O em junho e agora está sendo lançado ao público. Para ouvir a descrição de Pichai e do CEO do Google DeepMind, Demis Hassabis, é um grande avanço em um modelo de IA que acabará afetando praticamente todos os produtos do Google. “Uma das coisas poderosas deste momento”, diz Pichai, “é que você pode trabalhar em uma tecnologia subjacente e torná-la melhor, e ela flui imediatamente em nossos produtos”. 

O que é Gemini?

Gemini é mais do que um único modelo de IA. Existe uma versão mais leve chamada Gemini Nano que deve ser executada de forma nativa e offline em dispositivos Android. Há uma versão mais robusta chamada Gemini Pro, que em breve alimentará muitos serviços de IA do Google e é a espinha dorsal do Bard a partir de hoje. E há um modelo ainda mais capaz chamado Gemini Ultra, que é o LLM mais poderoso que o Google já criou e parece ter sido projetado principalmente para data centers e aplicativos empresariais. 

O Google está lançando o modelo de algumas maneiras agora: Bard agora é desenvolvido com Gemini Pro , e os usuários do Pixel 8 Pro obterão alguns novos recursos graças ao Gemini Nano. (Gemini Ultra será lançado no próximo ano.) Desenvolvedores e clientes corporativos poderão acessar o Gemini Pro por meio do Google Generative AI Studio ou Vertex AI no Google Cloud a partir de 13 de dezembro. Gemini está disponível apenas em inglês por enquanto, com outros idiomas evidentemente chegando em breve. Mas Pichai diz que o modelo será eventualmente integrado ao mecanismo de busca do Google , aos seus produtos publicitários, ao navegador Chrome e muito mais, em todo o mundo. É o futuro do Google e não chegará tão cedo.

 “Gemini é o resultado de esforços colaborativos em grande escala entre equipes do Google, incluindo nossos colegas do Google Research”, segundo Dennis Hassabis, CEO e cofundador do Google DeepMind. “Ele foi construído desde o início para ser multimodal, o que significa que pode generalizar e compreender, operar e combinar diferentes tipos de informações, incluindo texto, código, áudio, imagem e vídeo.”

Quem fez o Gemini?

Gemini foi criado pelo Google e pela Alphabet, empresa controladora do Google, e lançado como o modelo de IA mais avançado da empresa até o momento. O Google DeepMind também fez contribuições significativas para o desenvolvimento do Gemini. 

A princípio, o Gemini vem em três tamanhos, destinados a três finalidades diferentes. Imagem: Google

Existem diferentes versões de Gemini?

O Google descreve o Gemini como um modelo flexível capaz de funcionar em tudo, desde os data centers do Google até dispositivos móveis. Para alcançar essa escalabilidade, o Gemini está sendo lançado em três tamanhos: Gemini Nano, Gemini Pro e Gemini Ultra.

  • Gemini Nano:  O tamanho do modelo Gemini Nano foi projetado para funcionar em smartphones, especificamente no Google Pixel 8. Ele foi desenvolvido para executar tarefas no dispositivo que exigem processamento de IA eficiente sem conexão com servidores externos, como sugerir respostas em aplicativos de bate-papo ou resumir texto . 
  • Gemini Pro:  rodando nos data centers do Google, o Gemini Pro foi projetado para alimentar a versão mais recente do  chatbot de IA da empresa, Bard . É capaz de fornecer tempos de resposta rápidos e compreender consultas complexas. 
  • Gemini Ultra:  Embora ainda indisponível para uso generalizado, o Google descreve o Gemini Ultra como seu modelo mais capaz, superando “os resultados atuais de última geração em 30 dos 32 benchmarks acadêmicos amplamente utilizados em pesquisas de modelos de linguagem grande (LLM). e o desenvolvimento.” Ele foi projetado para tarefas altamente complexas e deve ser lançado após terminar sua fase atual de testes. 

Google afirma que novo modelo de IA Gemini supera ChatGPT na maioria dos testes

O Google revelou um novo modelo de inteligência artificial que afirma superar o ChatGPT na maioria dos testes e exibir “raciocínio avançado” em vários formatos, incluindo a capacidade de visualizar e marcar o dever de casa de física de um aluno.

O modelo, denominado Gemini, é o primeiro a ser anunciado desde a cimeira global de segurança de IA do mês passado, na qual empresas de tecnologia concordaram em colaborar com governos no teste de sistemas avançados antes e depois do seu lançamento. O Google disse que está em discussões com o recém-formado AI Safety Institute do Reino Unido para testar a versão mais poderosa do Gemini, que será lançada no próximo ano.

O Google disse que o Ultra superou os modelos de IA “de última geração”, incluindo o modelo mais poderoso do ChatGPT, GPT-4, em 30 dos 32 testes de benchmark, incluindo raciocínio e compreensão de imagens. O modelo Pro superou o GPT-3.5, a tecnologia que sustenta a versão de acesso gratuito do ChatGPT, em seis dos oito testes.

O modelo vem em três versões e é “multimodal”, o que significa que pode compreender texto, áudio, imagens, vídeo e código de computador simultaneamente.

O Gemini, que será incorporado aos produtos do Google, incluindo seu mecanismo de busca, será lançado inicialmente em mais de 170 países, incluindo os EUA, na quarta-feira, na forma de uma atualização do chatbot do Google, Bard.

No entanto, a atualização do Bard não será lançada no Reino Unido e na Europa, pois o Google busca autorização dos reguladores.

Demis Hassabis, presidente-executivo da DeepMind , a unidade do Google com sede em Londres que desenvolveu o Gemini, disse: “Foi o projeto mais complicado em que já trabalhamos, eu diria o maior empreendimento. Tem sido um esforço enorme.”

Duas versões menores do Gemini, Pro e Nano, serão lançadas na quarta-feira. O modelo Pro poderá ser acessado no chatbot Bard, do Google, e a versão Nano estará em celulares que utilizam o sistema Android, do Google.

A iteração mais poderosa, Ultra, está sendo testada externamente e não será lançada publicamente até o início de 2024, quando também será integrada a uma versão do Bard chamada Bard Advanced.

O Google disse que o Ultra foi o primeiro modelo de IA a superar os especialistas humanos, com uma pontuação de 90%, em um teste multitarefa chamado MMLU, que cobre 57 disciplinas, incluindo matemática, física, direito, medicina e ética. O Ultra agora irá alimentar uma nova ferramenta de escrita de código chamada AlphaCode2, que o Google afirma que poderia superar 85% dos programadores de computadores humanos em nível de competição.

Siga a gente nas redes sociais:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *