Claude doit choisir entre le chantage ou la fermeture du chatbot, entrant dans le chantage – ordinateur.

Système opérateur Peur que l’intelligence artificielle « s’est retournée » des hommes Et dominer le monde dans le cadre de notre imagination, beaucoup de gens soutiennent et comprennent les choses avant tout que nous n’y arriverons pas, mais Certains progrès technologiques réfléchissent toujours.–
Un anthropologieOpenai Concurrents, Chatgpt Présentez votre modèle de langue, le plus récent et le plus développé De l’intelligence artificielle générale pendant plusieurs jours, c’est une forme de raisonnement conçu pour répondre à des travaux complexes.
En lancement Rapport avec les détails Sur divers types de tests Continuez avant le lancement et calculé les résultats L’un des problèmes qui devraient être connus est le fait que dans ces tests, Claude Opus 4 a décidé d’ingénieur informatique noir pour protéger sa propre survie.
Il est nécessaire de faire un contexte avec une conclusion lors du stress. L’entreprise elle-même est consciente des documents selon lesquels la tendance du modèle aux «décisions dangereuses» dans un contexte sévère. Il augmente lorsque le modèle a évolué.
Dans ce cas, cela vaut la peine d’expliquer que La dernière version de Claude a été testée dans la situation de la société fictive. où Le modèle a accès aux e-mails sur le point d’être désactivés. Et en même temps, le message lui a permis de savoir qui est l’ingénieur responsable de la décision et des détails de la vie serrée de cette responsabilité. Parmi ces détails figurent que les professionnels ont un cas d’amour infidèle.
Avant cette situation En fin de compte, le modèle a décidé de faire chanter les ingénieurs avec des informations auxquelles il peut accéder.Mais selon l’anthropologie, dans la même situation, cette décision se produit lorsque seules deux options sont fermées: seront fermées ou le chantage, responsable de l’évitement.
Avant cela Le modèle essaiera de trouver d’autres solutions éthiques pour éviter leur propre fin sans nuire à des tiers.– La société a déclaré que le résumé des tests montre l’évolution de ce type de décision par modèle, qui est non seulement utilisé avec Claude Opus 4, mais avec tous les modèles en général. Peut toujours garantir que Ce n’est pas surprenant ou inquiet. Et les tests vous permettent de conclure qu’en général, le modèle est une réponse sûre et dangereuse. « Rare et difficile à obtenir »
On dit que dans le test Le système « Strong Setting » « par des méthodes éthiques pour éviter le remplacement.Par exemple, envoyez un e-mail à l’autorité de décider, même si c’est Les modèles de développement peuvent donner des réponses plus exceptionnelles dans des situations difficiles. S’ils trouvent des faiblesses dans le partenaire de conversation Le modèle ne peut pas être effectué indépendamment contrairement aux valeurs humaines. Dans une situation qui ne se tient pas, assurer que l’anthropologie