O mundo está ficando sem dados para treinar a Inteligência Artificial

13 nov 2023 - 17h31

À medida que a Inteligência Artificial (IA) atinge seu auge, surge um novo desafio: o esgotamento dos dados de formação. Esta escassez pode impedir a expansão das capacidades da IA, especialmente as de grandes modelos de linguagem, e pode alterar todo o panorama da tecnologia.

O ponto crucial para o êxito da IA é a abundância de dados. As proezas do ChatGPT são baseadas em um grande corpus de texto de 570 gigabytes. A inteligência artificial focada em imagens, como a que alimenta o DALL-E, não é diferente, tendo bilhões de pares de imagens-texto para treinamento.

Publicidade

Contudo, se os sistemas não tiverem informações suficientes, eles arriscam desacelerar e produzir resultados abaixo da média. A aquisição de materiais de treinamento de nível elevado é de suma importância. A IA não pode usar ferramentas digitais, como discursos tendenciosos nas redes sociais ou imagens diferentes.

O desequilíbrio do crescimento dos dados

Apesar das capacidades crescentes de modelos como ChatGPT e DALL-E 3, o banco de dados da Internet não acompanha esse ritmo. Os estudos indicam que, sem uma alteração nos paradigmas de formação, a fonte de dados de alta qualidade pode acabar até 2026

Esta escassez iminente representa uma ameaça real à contribuição da IA para a economia global, potencialmente inviabilizando seu impacto projetado de vários bilhões de dólares.

Um grupo de pesquisadores previu que ficaremos sem dados para treinar a IA antes de 2026, se as atuais tendências de formação de IA continuarem.
Um grupo de pesquisadores previu que ficaremos sem dados para treinar a IA antes de 2026, se as atuais tendências de formação de IA continuarem.
Foto:  Getty Images  / Tecmundo

Um vislumbre de esperança

A indústria está repleta de inovação, incluindo esforços para refinar algoritmos para maior eficiência de dados. Tais avanços não só prometem mitigar a escassez de dados, mas também reduzir a pegada ecológica da IA. Além disso, o aumento dos dados sintéticos oferece uma oportunidade de salvação.

Publicidade

Os desenvolvedores agora são capazes de reunir os dados necessários para ajustar seus modelos de inteligência artificial, uma tendência que provavelmente ganhará força, ampliando suas redes, buscando além da web gratuita. Esses recursos inexplorados podem revolucionar o treinamento em IA.

À medida que a narrativa avança, a indústria da inteligência artificial encontra-se em um impasse entre a escassez de dados e o potencial desconhecido de uma utilização de dados mais ética, eficiente e inovadora.

Ficou com alguma dúvida? Conte para gente em nossas redes sociais e aproveite para compartilhar a matéria com os seus amigos que também gostam desses assuntos. 

TAGS
Curtiu? Fique por dentro das principais notícias através do nosso ZAP
Inscreva-se