ChatGPT ganha novo 'cérebro' e se aproxima do filme 'Ela'; conheça o GPT-4o

OpenAI torna chatbot mais natural e inteligente com nova atualização

Bruno Romani, Guilherme Guerra e Alice Labate

13 mai 2024 - 13h57

(atualizado às 16h06)

Exibir comentários

A OpenAI revelou nesta segunda-feira, 13, o novo cérebro do ChatGPT: o GPT-4o. Em uma demonstração que aproxima sua ferramenta da inteligência artificial sabe-tudo do filme Ela (Spike Jonze, 2013), a companhia de inteligência artificial ampliou a capacidade de processamento de texto, de compreensão de imagens e de conversas com voz para funcionar, simultaneamente, em tempo real.

Segundo a companhia, o GPT-4o revelado nesta segunda-feira é superior ao atual GPT-4 Turbo. É duas vezes mais rápido no processamento de respostas, é 50% mais barato para desenvolvedores (pois exige menos tokens) e tem capacidade de mensagens cinco vezes maior. Custa US$ 5 a cada 1 milhão de tokens (tokens são pedacinhos de palavras) como dados de entrada (input) e US$ 10 como dados de saída (output). Anteriormente, no GPT-4 Turbo, esses valores eram US$ 10 (input) e US$ 30 (output) a cada milhão de tokens.

Todos os usuários da OpenAI, incluindo não assinantes do plano ChatGPT Plus, poderão acessar gratuitamente a nova IA nas próximas semanas, diz a startup americana.

Especulava-se que a OpenAI poderia apresentar o GPT-5, ou até um site de buscas na internet para competir com o Google. No entanto, as melhorias no GPT-4 prometem elevar o ChatGPT a um novo nível de uso. A executiva Mira Murati, chefe de tecnologia da OpenAI, realizou demonstrações sobre a capacidade de multimodalidade do ChatGPT.

O termo significa que o chatbot é capaz de aceitar comandos por texto, imagem, vídeo ou áudio e, por sua vez, gerar uma resposta em qualquer um desses formatos. É um avanço em relação às IAs atuais, que geralmente recebem comandos por texto e, a partir daí, geram o conteúdo no formato escolhido.

É a primeira vez que a OpenAI lança um modelo de IA que é nativamente multimodal, uma tendência que começa a se consolidar na área - o Gemini, do Google, também é o primeiro modelo multimodal da companhia. É a primeira vez também que uma IA consegue fazer reconhecimento de objetos por imagens em tempo real. Anteriormente, era necessário subir fotos no serviço.

Murati anunciou que o GPT-4o também estará disponível como API, permitindo que desenvolvedores e empresas, sob uma assinatura, consigam "puxar" o ChatGPT para seus serviços e integrar o modelo de inteligência artificial em diferentes produtos. Além disso, a companhia anunciou melhorias para outros 50 idiomas.

Por fim, continuando a expansão do serviço, a OpenAI anunciou um novo aplicativo do ChatGPT para Mac, computador da Apple. A empresa afirma que, com isso, vai ser mais fácil integrar o chatbot a tarefas de produtividade do usuário, graças a um comando de teclado para acionar o robô. Ao final do ano, um app para Windows, da Microsoft, deve ser lançado.

Sam Altman, CEO da OpenAI, comentou as novidades do evento desta segunda-feira no Twitter.

our new model: GPT-4o, is our best model ever. it is smart, it is fast,it is natively multimodal (!), and…
— Sam Altman (@sama) May 13, 2024

A transmissão acontece a um dia de o Google realizar o seu principal evento do ano, o Google I/O, que também deve trazer novidades importantes na área. Especialistas esperam que a companhia demonstre a capacidade da IA Gemini como assistente pessoal, primeira IA do mercado a adotar a multimodalidade.

Golpe para Siri e Alexa

O evento da OpenAI mostrou como funcionam as capacidades de multimodalidade do ChatGPT-4o. O modelo consegue ser um assistente de voz, similar à Alexa (da Amazon) e à Siri (da Apple), e consegue ler imagens do mundo real a partir da câmera de um smartphone, como o Google já implementou no Android. A principal diferença para os rivais é que se trata de um único modelo capaz de realizar isso tudo.

Na demonstração desta segunda-feira, a IA consegue contar histórias com diferentes entonações na voz, como algo emocionado ou totalmente robótico. Além disso, com a câmera do celular, a IA ajuda a resolver equações matemáticas de primeiro grau escritas em uma folha de papel ou, ainda, atuar como um tradutor em tempo real de uma conversa.

Segundo a OpenAI, essas funções vão chegar para os usuários nas próximas semanas.

Reveja a apresentação abaixo.

ChatGPT ganha novo 'cérebro' e se aproxima do filme 'Ela'; conheça o GPT-4o

OpenAI torna chatbot mais natural e inteligente com nova atualização

Boeing pede aos funcionários que se preparem para possível desastre: o potencial cancelamento do foguete SLS da NASA

Um experimento alemão demonstrou que as esferas de concreto são baterias fantásticas agora, a Califórnia está afundando uma de 9 metros no oceano

Houve um tempo em que acreditávamos que os pássaros migravam para a Lua; até que uma flecha lançada na África caiu na Alemanha

Golpe para Siri e Alexa

Confira também:

Mais lidas

"Se o governador quiser, eu coloco ele no carro e vamos visitar as casas entregues", diz Paulo Pimenta

Adeus prancha: este é o exercício de Pilates ideal para tonificar o abdômen depois dos 50

Gloria Perez expõe trauma após briga de atores em novela: 'Se recusaram a fazer amor'

Apontado pela PF como "Careca do INSS", lobista doou R$ 1 à campanha de Bolsonaro em 2022

Baiana viraliza ao explicar parentesco com marido: 'Engravidei do irmão da minha irmã'

Poucos lembram, mas ex-presidente Fernando Collor, hoje preso, foi à Justiça para proibir novela sátira jamais exibida na TV

É uma das melhores séries das últimas décadas, baseada em fatos reais, e está na Netflix

Uma ex-executiva histórica do Google quase apagou o e-mail que a convidava para trabalhar na empresa. Ela abriu por engano e hoje é multimilionária.

Operação com 13 mortos marca nova fase de ações policiais em favelas cariocas

Últimas notícias

Recomendado para você