GPT 4o: O que realmente evoluiu na plataforma de IA?

Sobre o lançamento do GPT 4o e uma porção de novos demos de cair o queixo

Por: Alex Winetzki *

16 mai 2024 - 06h25

Exibir comentários

Resumo
Vídeo de lançamento da nova versão do GPT mostra tecnologia multimodal que entende entradas de voz, imagem e vídeo e possui latência de 0,25 segundos. GPT 4o é concorrente direto do Co-Pilot da Microsoft.

Assista abaixo o vídeo de lançamento da nova versão do GPT, vale a pena assistir a partir do minuto 10. Sobre todos os outros demos em redes sociais, vai ser um pouco mais do mesmo.

4o significa Omni. O novo modelo é multimodal, como o Gemini do Google e lançamentos recentes de outros concorrentes, o que significa que ele nativamente entende entradas (inputs) de voz, imagem e vídeo, sem precisar de 'conversores'. Estes já existiam, mas exigiam algum trabalho para equilibrar a capacidade de APIs diferentes.

Ele também traz um tempo de reação para voz inédito (chamamos de latência), ao redor de 0,25 segundos, contra 1-2 segundos de qualquer tecnologia que tínhamos anteriormente.

Essa latência é notável porque nesse curto espaço de tempo o modelo precisa entender a voz do interlocutor, processar a intenção, a resposta e sintetizar uma voz simpática. Parece evidente, até pelas palavras da Mia Murati agradecendo a Nvidia, pois havia placas de processamento dedicadas nesse demo e vai ser difícil reproduzir essa mesma velocidade nos modelos comerciais, mas é impressionante ainda assim.

A versão desktop, que consegue 'enxergar' a tela do usuário, é concorrente direto do Co-Pilot da Microsoft. O que evidencia um pouco mais a tensão que neste momento cresce entre as empresas, e parece ter resultados melhores que a versão do sócio gigante, que até agora gerou menos valor do que prometeu.

Mas, de novo, vimos apenas um demo.

Mia Murati no demo co GPT 4o
Foto: Reprodução

Do ponto de vista de core de aplicação, e vi vários gráficos e benchmarks que não interessam neste post, há pouca novidade, o que nos traz a uma outra conclusão interessante.

Chegamos a um platô de diminuição de retorno no que concerne a tecnologia das LLMs, com todas as empresas fazendo melhorias incrementais e buscando novas funcionalidades, mas sem saltos neste momento, mesmo investindo bilhões de dólares (vale ler Gary Marcus sobre isso).

O desafio continua sendo buscar aplicações que funcionem e tragam retornos sobre investimento de verdade, e é nisso que trabalhamos furiosamente por aqui.

E você, o que achou do GPT 4o? Se tiver perguntas ou comentários, adoraria respondê-los.

(*) Alex Winetzki é CEO da Woopi e diretor de P&D do Grupo Stefanini, de soluções digitais.

Homework

GPT 4o: O que realmente evoluiu na plataforma de IA?

Sobre o lançamento do GPT 4o e uma porção de novos demos de cair o queixo

Primeiros formandos em IA do Brasil já saem com salário alto

IA oferece novas oportunidades para o setor de turismo

Como utilizar IA de forma eficaz no RH da sua empresa

Confira também:

Mais lidas

Barroso se cala após Câmara desafiar Ministros e mandar STF suspender ação do golpe

Ex-ator Globo largou igreja após pai se assumir gay: 'Que Deus é esse que fez um inferno pro meu pai?'

Eduardo Bolsonaro, Haddad e Alckmin: Os resultados de pesquisa sobre a disputa ao Senado em SP

Morre influenciador Nazario Gomes, aos 20 anos

Ilze Scamparini se pronuncia após recusar abraço de Bonner: 'Meio chata'

'Troféu Imprensa': Público reclama de novela premiada: 'Armação'

Bill Gates acredita que os pais de 2025 realmente deveriam repensar a forma como estão criando seus filhos

Por que Ilze Scamparini e William Bonner tiveram um 'climão' na cobertura do 'Jornal Nacional' do conclave do substituto do Papa Francisco?

Nem hambúrguer, nem donut: apesar de estadunidense, Papa Leão XIV, sucessor de Francisco, é fã de prato latino MUITO fácil de fazer

Últimas notícias

Recomendado para você