O uso de vídeos do YouTube para treinar o Sora, gerador de texto para vídeo da OpenAI, seria uma infração dos termos de serviço da plataforma, afirmou o CEO do YouTube, Neal Mohan.
Em suas primeiras declarações públicas sobre o assunto, Mohan disse não saber se a OpenAI de fato utilizou vídeos do YouTube para aprimorar sua ferramenta de criação de vídeo alimentada por inteligência artificial. Mas se esse fosse o caso, seria uma “violação clara” dos termos de uso do YouTube, disse ele.
“Do ponto de vista de um criador, quando um criador faz upload de seu trabalho árduo em nossa plataforma, eles têm certas expectativas”, disse Mohan na quinta-feira (4) em uma entrevista com Emily Chang, apresentadora da Bloomberg Originals. “Uma dessas expectativas é que os termos de serviço sejam cumpridos. Não permite que coisas como transcrições ou trechos de vídeo sejam baixados, e isso é uma violação clara de nossos termos de serviço. Essas são as regras da estrada em termos de conteúdo em nossa plataforma.”
LEIA MAIS: O que é inteligência artificial e principais exemplos dessa tecnologia
Houve muito debate público sobre o material que a OpenAI usa para treinar os modelos de IA subjacentes a produtos populares de criação de conteúdo, como o ChatGPT e o DALL-E. Sora e outras ferramentas de IA generativa funcionam absorvendo todo tipo de conteúdo da web e usando esses dados como base a partir da qual as ferramentas podem gerar novo conteúdo, incluindo vídeos, fotos, texto narrativo e muito mais.
À medida que empresas como a OpenAI, o Google e outros correm para desenvolver inteligência artificial mais poderosa, estão buscando o máximo de conteúdo possível para treinar seus modelos de IA para obter resultados de melhor qualidade. O Google e o YouTube são unidades da Alphabet.
A OpenAI, apoiada pela Microsoft, não respondeu imediatamente a um pedido de comentário. A diretora de tecnologia da OpenAI, Mira Murati, disse em uma entrevista ao Wall Street Journal no mês passado que não tinha certeza se Sora foi treinado com vídeos gerados por usuários do YouTube, Facebook e Instagram. O Journal relatou nesta semana que a OpenAI discutiu treinar seu modelo de linguagem de próxima geração, GPT-5, em transcrições de vídeos públicos do YouTube, citando pessoas familiarizadas com o assunto.
LEIA MAIS: Microsoft busca formas de impedir que chatbots sejam enganados
Mohan disse que o Google adere aos contratos individuais do YouTube com os criadores antes de decidir se usa vídeos da plataforma para treinar o próprio modelo de IA poderoso da empresa, o Gemini.
“Vários criadores têm diferentes tipos de contratos de licenciamento em relação ao seu conteúdo em nossa plataforma”, disse Mohan. Embora “alguma parte desse corpus do YouTube possa estar sendo usada” para treinar modelos como o Gemini, o Google e o YouTube garantem que o uso dos vídeos como dados de treinamento para a IA do Google esteja “em conformidade com os termos de serviço ou o contrato que o criador assinou” antecipadamente, disse ele.