Crédit Agricole Magazine n°181
Tendances
ChatGPT. Au printemps, on ne parlait que de lui. Qu’il répondait à toutes nos questions en un temps record, qu’il écrivait très bien, qu’il nous remplacerait au bureau, qu’il hallucinait, qu’il était formidable… Aldrick Zappellini, directeur data groupe et chief data officer groupe, nous explique en quoi consiste cette intelligence artificielle spécialisée dans la génération de texte, créée par la société OpenAI, et comment le groupe l’étudie.
ChatGPT Une exploration pragmatique
par exemple. La 3 e version (2020) a constitué une véritable percée. Entraîné sur 175 milliards de paramètres, GPT-3 a fait beaucoup de bruit en raison de la qualité du texte généré et des déceptions dues à des prédictions fausses, des réponses absurdes, offensantes ou véhiculant des préjugés. Pour y remédier, OpenAI a optimisé son modèle grâce à des feedbacks humains récompensant les réponses correctes et pénalisant les autres. Cette technique améliore par itération la qualité des réponses et la capacité de l’IA à gérer de nouvelles situations lors de l’échange avec un humain. L’intelligence artificielle apprend une langue en s’entraînant à prédire le prochain mot d’une phrase. La répétition de cet exercice sur plus de 300 milliards de mots lui fait acquérir des capacités à interpréter et à générer du langage. GPT-4, officialisé le 14 mars 2023, est un modèle multimodal, à savoir qu’il gère aussi bien le texte que les images et les vidéos ; il a nettement amélioré la cohérence de ses réponses sans toutefois être parfait, loin de là. Les limites et les risques ChatGPT connaît bien des limites: des erreurs non maîtrisables telles les hallucinations (1) , une base de connaissance figée et biaisée, des performances variables selon la langue… À celles-ci s’ajoutent des risques
ChatGPT (Generative Pre-trained Transformer) est capable de produire de manière autonome du texte difficilement distinguable de celui écrit par un être humain. La génération de texte, discipline relativement ancienne de l’intelligence artificielle, connaît une dynamique d’innovation sans précédent depuis 2022. En effet, à côté d’OpenAI, créateur de ChatGPT, diverses entreprises (Google, Meta, Amazon…) développent chacune leurs grands modèles de langage (Large Language Model, LLM), entraînés avec toujours plus de données, et rendus plus simples d’utilisation grâce à des interfaces intuitives telles que les chatbots. Des «LLM» open source, c’est-à-dire librement accessibles et utilisables, sont apparus ou redevenus d’actualité. De 1950 à 2023 Dans les années cinquante, des chercheurs se sont intéressés à la création de programmes capables de produire du texte réaliste de manière autonome. L'apprentissage automatique (machine learning) combiné à l'utilisation massive de données a récemment rendu possible le développement de modèles performants. Les premiers fondements marquants en génération de texte ont été GPT-1 (2018) et GPT-2 (2019), développés par OpenAI. Ils sont aujourd’hui utilisés pour la traduction et le résumé automatiques
GPT-4 est unmodèle multimodal, à savoir qu’il gère aussi bien le texte que les images et les vidéos.
non négligeables: la divulgation de données confidentielles de l’entreprise, le non-respect du RGPD et des droits
d’auteur par OpenAI, le risque de réputation lié aux pratiques
de sous-traitance, l’opacité des travaux au moment où le Parlement européen vote l’AI Act, l’empreinte carbone élevée… nous sommes encore bien loin d’une technologie de confiance et responsable! La stratégie du Crédit Agricole Au vu de l’engouement créé par ChatGPT, un groupe de travail multi entités, animé par le DataLab groupe, a étudié la technologie et émis des recommandations pour favoriser son adoptionmaîtrisée au Crédit Agricole. Une stratégie groupe a été validée au printemps dernier et s’appuie sur les piliers suivants :
18
Crédit Agricole Magazine n°181
Made with FlippingBook - Online catalogs