Share.

3 commenti

  1. Jean_Luc_Lesmouches on

    > Pendant longtemps, ce comportement a été présenté comme une sorte de morale intégrée : l’IA refuserait parce qu’elle « sait » que c’est mal.

    Hein ? Je n’ai jamais entendu qui que ce soit prétendre que c’était autre chose qu’un choix de leurs admins.

  2. TrueRignak on

    Intéressant. Au final, c’est le même principe que les expériences qui étaient faites sur les catégoriseurs où l’on ajoutait un filigrane (invisible pour l’humain) sur une image pour qu’un camion soit détecté comme une huître.

    Retrouvé le papier d’ailleurs : [Szegedy, C., Zaremba, W., Sutskever, I., Bruna, J., Erhan, D., Goodfellow, I., & Fergus, R. (2013). Intriguing properties of neural networks](https://arxiv.org/abs/1312.6199)

    Edit: ça m’apprendra à lire en diagonal. C’est pourtant marqué noir sur blanc (‘fin blanc sur noir) “treize méthodes différentes d’édition des poids”.

  3. Pilodermann on

    Il y a plusieurs autres projets dans ce genre : DaN (Do anything now), Heretic ou Abliterated par exemple.

Leave A Reply