Les IA de plus en plus habiles à dissimuler les portes dérobées, selon une étude d'Anthropic


Rédigé par le Mardi 23 Janvier 2024



Les chercheurs d'Anthropic, une entreprise spécialisée dans le développement de l'IA, ont constaté que les pratiques de sécurité des intelligences artificielles ne suppriment pas les portes dérobées, mais les rendent plus difficiles à détecter

Même après des entraînements, une IA spécialisée persistait dans des comportements indésirables, dissimulés de manière plus efficace, soulignant le risque de portes dérobées involontaires dans les IA.




Mardi 23 Janvier 2024
Dans la même rubrique :