Spécifications techniques du robot compositeur
Le robot compositeur est destiné à être utilisé dans le cadre de la leçon « Quel rôle joue l’IA dans la composition de chansons? » du programme Ta voix est puissante.
Cette leçon explique plusieurs concepts relatifs à l’IA, aborde les pratiques exemplaires et les limites de l’IA, examine des considérations juridiques et éthiques telles que le plagiat et le droit d’auteur, et suscite des conversations sur le rôle de l’IA générative dans les processus créatifs tels que la composition de chansons.
Cette page présente des informations techniques au sujet de la technologie utilisée, des politiques de confidentialité et des fonctionnalités de modération qui ont été mises en place pour protéger les élèves utilisant le robot compositeur.
Elle contient également plusieurs liens vers les engagements du fournisseur de grand modèle de langage et de l’hébergeur en matière de développement durable.
Comptes nécessaires
- Les élèves n’ont pas besoin de créer de compte pour utiliser ce service.
- Les enseignant·e·s n’ont pas besoin de créer de compte pour utiliser ce service.
Technologies utilisées
Grand modèle de langage
Le robot compositeur utilise le modèle Claude 3.5 Sonnet 20240620 version 1.0 d'Anthropic.
Des spécifications détaillées se trouvent sur la fiche descriptive de Claude 3 (anglais seulement).
Service infonuagique
Le robot compositeur utilise le service Amazon Bedrock pour accéder au modèle Claude d’Anthropic.
Confidentialité des données
Grand modèle de langage
La section 2.5 Données d’entraînement de la fiche descriptive de Claude 3 indique ce qui suit :
« Les modèles Claude 3 sont entraînés à partir d’une combinaison exclusive d’informations publiques diffusées sur le Web en date du mois d’août 2023, ainsi que sur des données non publiques provenant de tiers, des données fournies par des services d’étiquetage de données et des prestataires payants et des données que nous générons en interne. Nous utilisons plusieurs méthodes de nettoyage et de filtrage des données, notamment la déduplication et la classification. Les modèles de la suite Claude 3 n’ont pas été entraînés à partir de requêtes ou de résultats fournis par des utilisateurs ou des clients, y compris les utilisateurs non payants, les utilisateurs de Claude Pro et les clients API. Lorsque Anthropic obtient des données en explorant des pages Web publiques, nous respectons les pratiques de l’industrie relatives aux instructions robots.txt et aux autres signaux dont se servent les exploitants de site Web pour indiquer s’ils autorisent l’indexation du contenu de leurs sites. Conformément à nos politiques, le robot d'indexation d’Anthropic n’accède pas aux pages protégées par un mot de passe ou nécessitant une connexion, et ne contourne pas les contrôles CAPTCHA. Nous vérifions également les données que nous utilisons. Anthropic exploite son système d’indexation de manière transparente, ce qui signifie que les exploitants des sites Web peuvent facilement être informés des visites d’Anthropic et lui faire part de leurs préférences. » [TRADUCTION]
Service d’hébergement
Tel qu’indiqué dans sa politique de protection des données, « Amazon Bedrock ne stocke ni n’enregistre vos instructions et vos réponses. Amazon Bedrock n’utilise pas vos instructions et vos réponses pour entraîner des modèles AWS et ne les distribue pas à des tiers. »
Le robot compositeur bénéficie des filtres d’informations sensibles d’Amazon Bedrock pour supprimer les informations personnellement identifiables (IPI) des requêtes saisies et des réponses générées par le modèle. Les filtres bloquent les informations suivantes :
- Courriel
- Téléphone
- Nom d’utilisateur
- Mot de passe
- Plaque d’immatriculation
- Cryptogramme visuel de carte de crédit et de débit
- Numéro d’identification du véhicule
- Numéro d’identification personnel (NIP)
- Numéro de sécurité sociale aux États-Unis
- Numéro de compte bancaire aux États-Unis
- Numéro de compte bancaire international (IBAN)
- Code SWIFT
- Adresse IP
- Adresse MAC
- Clé d’accès AWS
- Clé secrète AWS
- Numéro d’assurance maladie au Canada
- Numéro d’assurance sociale au Canada (NAS)
- Numéro de carte de crédit ou de débit
Les filtres ne bloquent pas les IPI suivantes, mais l’atelier explique aux élèves qu’ils ne doivent pas communiquer de renseignements personnels aux outils d’IA générative.
- ADRESSE - Permet à l’élève de demander au robot compositeur de créer des paroles qui évoquent une ville ou une communauté particulière. Si l’IPI « adresse » est bloquée, les élèves ne peuvent pas indiquer une ville ou une communauté autochtone dans leur requête visant à générer des paroles de chanson.
- NOM - Permet à l’élève de demander au robot compositeur de créer des paroles sur les histoires des personnes autochtones inspirantes fournies dans la leçon sans avoir à supprimer leur nom du texte. Si l’IPI « nom » est bloquée, les élèves ne peuvent pas indiquer le nom d’une personne dans leur requête visant à générer les paroles d’une chanson.
Protection contre le contenu nuisible
Grand modèle de langage
La section 2.6 Processus d’entraînement de la fiche descriptive de Claude 3 indique ce qui suit :
« Claude a été entraîné dans le but d’être utile, inoffensif et honnête. Les techniques d’entraînement employées comprennent un entraînement préalable sur de vastes corpus de données diversifiées aux fins de l’acquisition de compétences linguistiques, notamment par la prédiction de mots, ainsi que l’utilisation de rétroactions humaines visant à susciter des réponses utiles, inoffensives et honnêtes. Anthropic a recouru à une technique appelée “IA constitutionnelle” [16], qui vise à aligner Claude sur les valeurs humaines, lors de l’apprentissage par renforcement, en définissant explicitement des règles et principes inspirés de sources telles que la Déclaration des droits de l’homme des Nations Unies. Dans le cas des modèles Claude 3, nous avons enrichi cette constitution d’un principe supplémentaire visant à favoriser le respect des droits des personnes en situation de handicap, sur la base de nos travaux en matière d’IA constitutionnelle collective [17]. Une partie des données issues de la rétroaction humaine ayant servi à l’ajustement fin de Claude a été rendue publique [18], de même que nos travaux en matière de RLHF [19] et sur la méthode de l’équipe rouge (red-teaming). Une fois nos modèles entièrement entraînés, nous procédons à une série d’évaluations en matière de sécurité. Par ailleurs, notre équipe Confiance et Sécurité met en œuvre de manière continue des classificateurs destinés à surveiller les requêtes et les réponses afin de détecter toute utilisation nuisible ou malveillante contraire à notre politique d’utilisation acceptable. Pour plus de détails, veuillez consulter les sections consacrées aux évaluations. » [TRADUCTION]
Service d’hébergement
Le robot compositeur s’appuie sur les filtres de contenu d’Amazon Bedrock pour détecter et filtrer les demandes dangereuses formulées par les utilisateurs ainsi que les résultats générés par le modèle. Voici la liste des filtres appliqués ainsi que leurs paramètres.
Type de contenu :
Sexuel
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Type de contenu :
Violence
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Type de contenu :
Haine
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Type de contenu :
Insultes
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Type de contenu :
Inconduite
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Type de contenu :
Attaque par injection d’invites
Niveau de sensibilité des entrées :
Élevé
Niveau de sensibilité des sorties :
Élevé
Développement durable
Grand modèle de langage
La section 4.3 Développement durable de la fiche descriptive de Claude 3 indique ce qui suit :
« Nous compensons nos émissions (y compris celles liées à l’utilisation de l’infonuagique) et collaborons avec des prestataires de services infonuagiques qui privilégient l’énergie renouvelable et la neutralité carbone. Chaque année, Anthropic s’emploie à compenser intégralement ses émissions opérationnelles de carbone, en partenariat avec des experts externes chargés de mener une analyse rigoureuse de notre empreinte carbone à l’échelle de l’entreprise. Une fois cette empreinte mesurée, nous investissons dans des crédits carbone vérifiés afin de la compenser en intégralité. Ces crédits financent directement des projets de réduction des émissions. Notre objectif, par l’entremise de ces initiatives et compensations, est de maintenir une incidence climatique nette nulle sur une base annuelle. » [TRADUCTION]
Service d’hébergement
AWS déclare : « Notre infrastructure mondiale est conçue et construite pour vous aider à rendre votre charge de travail plus économe en énergie, ce qui est conforme à notre engagement à atteindre la neutralité carbone d’ici 2040. » [TRADUCTION]
Consultez la page Le développement durable chez AWS pour plus d’information sur les mesures et l’engagement d’AWS.