Francia

Questo progetto open source cancella la censura dell’IA con un clic

08/03/2026

Jean_Luc_Lesmouches on 08/03/2026 17:49

> Pendant longtemps, ce comportement a été présenté comme une sorte de morale intégrée : l’IA refuserait parce qu’elle « sait » que c’est mal.

Hein ? Je n’ai jamais entendu qui que ce soit prétendre que c’était autre chose qu’un choix de leurs admins.
TrueRignak on 08/03/2026 17:57

Intéressant. Au final, c’est le même principe que les expériences qui étaient faites sur les catégoriseurs où l’on ajoutait un filigrane (invisible pour l’humain) sur une image pour qu’un camion soit détecté comme une huître.

Retrouvé le papier d’ailleurs : [Szegedy, C., Zaremba, W., Sutskever, I., Bruna, J., Erhan, D., Goodfellow, I., & Fergus, R. (2013). Intriguing properties of neural networks](https://arxiv.org/abs/1312.6199)

—

Edit: ça m’apprendra à lire en diagonal. C’est pourtant marqué noir sur blanc (‘fin blanc sur noir) “treize méthodes différentes d’édition des poids”.
Pilodermann on 08/03/2026 18:18

Il y a plusieurs autres projets dans ce genre : DaN (Do anything now), Heretic ou Abliterated par exemple.