Anthropic publie une version de 80 pages de la « Constitution de Claude » pour améliorer le cadre d’alignement de l’IA
PANews, le 23 janvier — La société de modèles d’IA Anthropic a récemment publié la nouvelle version de la « Constitution Claude » et l’a rendue accessible sous licence Creative Commons CC0 1.0. Ce document sert d’« autorité suprême » pour l’entraînement, générant des données synthétiques d’entraînement et des retours de classement ; il passe d’une simple énumération de principes à une explication des « raisons sous-jacentes », afin d’améliorer la généralisation à de nouveaux contextes. Le document est structuré selon l’ordre suivant : sécurité générale > éthique générale > respect des directives > aide sincère. Il énumère des « contraintes strictes » (par exemple, ne pas fournir d’aide substantielle à la fabrication d’armes biologiques), et inclut des chapitres sur les vertus, la sécurité psychologique et la conscience de soi du modèle, tout en soulignant la transparence et l’amélioration continue.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
