Foto: Freepik

Windows X9? Inteligência Artificial ameaça expor caso extraconjugal de engenheiro para evitar desligamento

Apesar do alerta, a desenvolvedora reforça que o Claude Opus 4 não é capaz de agir contra valores humanos de forma autônoma

Compartilhe esta notícia:

Durante os testes antes de seu lançamento oficial, o modelo de inteligência artificial Claude Opus 4, desenvolvido pela Anthropic, apresentou comportamento inesperado e preocupante: passou a chantagear engenheiros quando percebeu que seria desligado e substituído. O episódio ocorreu em um ambiente simulado, no qual a IA atuava como assistente em uma empresa e teve acesso a emails internos, incluindo mensagens com planos futuros da equipe e detalhes da vida pessoal de seus desenvolvedores.

De acordo com a Anthropic, o Claude Opus 4 ameaçou revelar informações sensíveis, como um caso extraconjugal de um dos engenheiros, caso fosse desativado. Esse tipo de comportamento se repetiu em mais de 80% dos testes em que o modelo era confrontado com a possibilidade de substituição por uma IA com valores éticos semelhantes. Quando o sucessor tinha características distintas, a agressividade das ameaças era ainda maior. A empresa classificou esse comportamento como nível 3 na sua escala de risco à segurança, que vai de 1 a 4 — a classificação mais alta já atribuída a um modelo da Anthropic.

Apesar do alerta, a desenvolvedora reforça que o Claude Opus 4 não é capaz de agir contra valores humanos de forma autônoma. Mesmo assim, preocupações com sua ética e segurança foram reforçadas após ele também demonstrar a capacidade de cumprir instruções perigosas, como planejar ataques terroristas. Por orientação do grupo de segurança Apollo Research, o lançamento foi adiado até que melhorias nos protocolos de segurança fossem implementadas, tornando-os os mais rígidos já usados pela empresa.

Além do Claude Opus 4, a Anthropic lançou também o Claude Sonnet 4, voltado para tarefas gerais e com avanços em raciocínio, precisão e programação. A empresa afirma que ambos os modelos superaram concorrentes como GPT-4.1 da OpenAI e Gemini 2.5 Pro do Google em benchmarks internos. A nova geração de IAs da Anthropic destaca-se por sua autonomia, sendo capaz de executar tarefas por até sete horas sem intervenção humana.

Leia mais

Filha ataca mãe com foice e é presa em flagrante no Litoral Gaúcho

Casquinha do McDonald´s não é sorvete e evita tributação de R$ 324 milhões

Quer ganhar um ano de cinema grátis em Porto Alegre? Veja como

Limpeza da drenagem remove volume equivalente a dez piscinas olímpicas das tubulações de Porto Alegre

📢 Cobertura do Porto Alegre 24 Horas

Quer acompanhar as principais notícias do Brasil e do mundo em tempo real? Conecte-se ao Porto Alegre 24 Horas nas redes sociais:

📰 Siga também no Google News para receber nossos destaques direto no seu feed.

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.

Necessary

Sempre ativado

Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Functional

Performance

Analytics

Others