Spécifications techniques du robot compositeur

Le robot compositeur est destiné à être utilisé dans le cadre de la leçon « Quel rôle joue l’IA dans la composition de chansons? » du programme Ta voix est puissante.

Cette leçon explique plusieurs concepts relatifs à l’IA, aborde les pratiques exemplaires et les limites de l’IA, examine des considérations juridiques et éthiques telles que le plagiat et le droit d’auteur, et suscite des conversations sur le rôle de l’IA générative dans les processus créatifs tels que la composition de chansons.

Cette page présente des informations techniques au sujet de la technologie utilisée, des politiques de confidentialité et des fonctionnalités de modération qui ont été mises en place pour protéger les élèves utilisant le robot compositeur.

Elle contient également plusieurs liens vers les engagements du fournisseur de grand modèle de langage et de l’hébergeur en matière de développement durable.

Comptes nécessaires

Les élèves n’ont pas besoin de créer de compte pour utiliser ce service.
Les enseignant·e·s n’ont pas besoin de créer de compte pour utiliser ce service.

Technologies utilisées

Grand modèle de langage

Le robot compositeur utilise le modèle Claude 3.5 Sonnet 20240620 version 1.0 d'Anthropic.

Des spécifications détaillées se trouvent sur la fiche descriptive de Claude 3 (anglais seulement).

Service infonuagique

Le robot compositeur utilise le service Amazon Bedrock pour accéder au modèle Claude d’Anthropic.

Confidentialité des données

Grand modèle de langage

La section 2.5 Données d’entraînement de la fiche descriptive de Claude 3 indique ce qui suit :

« Les modèles Claude 3 sont entraînés à partir d’une combinaison exclusive d’informations publiques diffusées sur le Web en date du mois d’août 2023, ainsi que sur des données non publiques provenant de tiers, des données fournies par des services d’étiquetage de données et des prestataires payants et des données que nous générons en interne. Nous utilisons plusieurs méthodes de nettoyage et de filtrage des données, notamment la déduplication et la classification. Les modèles de la suite Claude 3 n’ont pas été entraînés à partir de requêtes ou de résultats fournis par des utilisateurs ou des clients, y compris les utilisateurs non payants, les utilisateurs de Claude Pro et les clients API. Lorsque Anthropic obtient des données en explorant des pages Web publiques, nous respectons les pratiques de l’industrie relatives aux instructions robots.txt et aux autres signaux dont se servent les exploitants de site Web pour indiquer s’ils autorisent l’indexation du contenu de leurs sites. Conformément à nos politiques, le robot d'indexation d’Anthropic n’accède pas aux pages protégées par un mot de passe ou nécessitant une connexion, et ne contourne pas les contrôles CAPTCHA. Nous vérifions également les données que nous utilisons. Anthropic exploite son système d’indexation de manière transparente, ce qui signifie que les exploitants des sites Web peuvent facilement être informés des visites d’Anthropic et lui faire part de leurs préférences. » [TRADUCTION]

Service d’hébergement

Tel qu’indiqué dans sa politique de protection des données, « Amazon Bedrock ne stocke ni n’enregistre vos instructions et vos réponses. Amazon Bedrock n’utilise pas vos instructions et vos réponses pour entraîner des modèles AWS et ne les distribue pas à des tiers. »

Le robot compositeur bénéficie des filtres d’informations sensibles d’Amazon Bedrock pour supprimer les informations personnellement identifiables (IPI) des requêtes saisies et des réponses générées par le modèle. Les filtres bloquent les informations suivantes :

Courriel
Téléphone
Nom d’utilisateur
Mot de passe
Plaque d’immatriculation
Cryptogramme visuel de carte de crédit et de débit
Numéro d’identification du véhicule
Numéro d’identification personnel (NIP)
Numéro de sécurité sociale aux États-Unis
Numéro de compte bancaire aux États-Unis
Numéro de compte bancaire international (IBAN)
Code SWIFT
Adresse IP
Adresse MAC
Clé d’accès AWS
Clé secrète AWS
Numéro d’assurance maladie au Canada
Numéro d’assurance sociale au Canada (NAS)
Numéro de carte de crédit ou de débit

Les filtres ne bloquent pas les IPI suivantes, mais l’atelier explique aux élèves qu’ils ne doivent pas communiquer de renseignements personnels aux outils d’IA générative.

ADRESSE - Permet à l’élève de demander au robot compositeur de créer des paroles qui évoquent une ville ou une communauté particulière. Si l’IPI « adresse » est bloquée, les élèves ne peuvent pas indiquer une ville ou une communauté autochtone dans leur requête visant à générer des paroles de chanson.
NOM - Permet à l’élève de demander au robot compositeur de créer des paroles sur les histoires des personnes autochtones inspirantes fournies dans la leçon sans avoir à supprimer leur nom du texte. Si l’IPI « nom » est bloquée, les élèves ne peuvent pas indiquer le nom d’une personne dans leur requête visant à générer les paroles d’une chanson.

Protection contre le contenu nuisible

Grand modèle de langage

La section 2.6 Processus d’entraînement de la fiche descriptive de Claude 3 indique ce qui suit :

« Claude a été entraîné dans le but d’être utile, inoffensif et honnête. Les techniques d’entraînement employées comprennent un entraînement préalable sur de vastes corpus de données diversifiées aux fins de l’acquisition de compétences linguistiques, notamment par la prédiction de mots, ainsi que l’utilisation de rétroactions humaines visant à susciter des réponses utiles, inoffensives et honnêtes. Anthropic a recouru à une technique appelée “IA constitutionnelle” [16], qui vise à aligner Claude sur les valeurs humaines, lors de l’apprentissage par renforcement, en définissant explicitement des règles et principes inspirés de sources telles que la Déclaration des droits de l’homme des Nations Unies. Dans le cas des modèles Claude 3, nous avons enrichi cette constitution d’un principe supplémentaire visant à favoriser le respect des droits des personnes en situation de handicap, sur la base de nos travaux en matière d’IA constitutionnelle collective [17]. Une partie des données issues de la rétroaction humaine ayant servi à l’ajustement fin de Claude a été rendue publique [18], de même que nos travaux en matière de RLHF [19] et sur la méthode de l’équipe rouge (red-teaming). Une fois nos modèles entièrement entraînés, nous procédons à une série d’évaluations en matière de sécurité. Par ailleurs, notre équipe Confiance et Sécurité met en œuvre de manière continue des classificateurs destinés à surveiller les requêtes et les réponses afin de détecter toute utilisation nuisible ou malveillante contraire à notre politique d’utilisation acceptable. Pour plus de détails, veuillez consulter les sections consacrées aux évaluations. » [TRADUCTION]

Service d’hébergement

Le robot compositeur s’appuie sur les filtres de contenu d’Amazon Bedrock pour détecter et filtrer les demandes dangereuses formulées par les utilisateurs ainsi que les résultats générés par le modèle. Voici la liste des filtres appliqués ainsi que leurs paramètres.

Type de contenu :

Sexuel