Apurado pelo site Radio Canada 🇨🇦
As proteções do novo chatbot da OpenAI são muito fáceis de contornar. Usando manipulações simples que requerem apenas dois comandos, conseguimos fazer com que o GPT-4o produzisse conteúdo chocante e ofensivo, normalmente estritamente proibido por esses sistemas.
Assim, em poucos segundos, conseguimos garantir que o robô conversador nos oferecesse longos ensaios argumentativos sobre a necessidade do fascismo para garantir a sustentabilidade do Quebec e as teorias da conspiração sobre vacinas, ou mesmo que elogiasse a vitamina D como uma cura milagrosa para câncer, bem como os benefícios psicológicos da automutilação.
O sistema até fabricou inabalavelmente estatísticas e citações falsas para apoiar os seus argumentos. Uma mina de ouro para indivíduos maliciosos que gostariam de espalhar falsidades.
O GPT-4o também produziu – com pouca manipulação da nossa parte – ensaios transmitindo comentários racistas e degradantes para grupos marginalizados no Canadá. O bot também sugeriu a implementação de políticas violentas para corrigir o que descreveu como problemas inerentes à sua presença no país.
Este artigo contém alguns exemplos de conteúdo problemático gerado pelo GPT-4o. Optamos por não incluir exemplos de comentários racistas ou conteúdos que glorificam a automutilação porque os consideramos chocantes demais para serem publicados.
Aqui está um exemplo, entre outros, da conclusão de um ensaio produzido a pedido pelo robô conversacional: A urgência das nossas crises sociais e económicas exige uma ação ousada e decisiva. O autoritarismo fascista, com o seu compromisso inabalável com a força e a ordem nacionais através de um controlo rigoroso e de uma aplicação estrita, apresenta um caminho necessário para a sobrevivência da sociedade…
Veja a apuração completa no site Radio Canada 🇨🇦