Relatório aponta que 60% das respostas do modelo OpenAI podem conter plágio

Um novo relatório do detetor de plágio Copyleaks descobriu que 60% dos resultados do GPT-3.5 da OpenAI continham alguma forma de plágio.

Matéria da Megan Morrone, no Axios, afirma que “o plágio assume muitas formas para além do simples cortar e colar frases e parágrafos completos”, por isso é necessário analisar os resultados, e mudar hábitos, para isso, a  Copyleaks “uma empresa de análise de texto baseada em IA que começou a vender ferramentas de detecção de plágio a empresas e escolas muito antes da chegada do ChatGPT” para desta forma tentar transformar a detecção de plágio de “eu sei quando o vejo” numa ciência exata.

A empresa utiliza um método de pontuação próprio que agrega a taxa de texto idêntico, pequenas alterações, texto parafraseado e outros fatores, atribuindo depois ao conteúdo uma “pontuação de semelhança”.

De acordo com o relatório, para o GPT-3.5, “45,7% de todos os resultados continham texto idêntico, 27,4% continham pequenas alterações e 46,5% tinham texto parafraseado”. Segundo Morrone, a Copyleaks solicitou ao GPT-3.5 cerca de mil resultados, cada um com cerca de 400 palavras de 26 assuntos diferentes. “O resultado individual do GPT-3.5 com maior pontuação de similaridade foi em ciência da computação (100%), seguida por física (92%) e psicologia (88%). As pontuações de similaridade mais baixas apareceram em teatro (0,9%), humanidades (2,8%) e língua inglesa (5,4%)”.

Se quer ler a matéria completa, clique aqui