Por Deepa Seetharaman
As empresas que se apressam para desenvolver um sistema de inteligência artificial cada vez mais poderoso estão rapidamente se aproximando de um novo problema: a internet pode ser muito pequena para os seus planos.
Para aprender, os sistemas desenvolvidos pela OpenAI, Google e outros exigem um oceano de informação muito maior. Essa demanda está sobrecarregando a oferta de dados públicos de qualidade disponível on-line, ao mesmo tempo em que alguns proprietários de dados bloqueiam o acesso a empresas de IA.
Executivos e pesquisadores dizem que a necessidade da indústria por dados de alta qualidade pode superar a oferta dentro de dois anos, potencialmente retardando o desenvolvimento da IA.
Empresas de IA estão buscando fontes de informação inexploradas e repensando o modo como treinam esses sistemas. A OpenAI, fabricante do ChatGPT, já pensou em treinar seu próximo modelo, o GPT-5, com transcrições de vídeos públicos do YouTube, segundo pessoas familiarizadas com o assunto.
Leia a matéria completa do The Wall Street Journal aqui