Les apports de l’intelligence artificielle générative
à la Francophonie scientifique
par Nadia Antonin
intelligence artificielle IA langue française
Alors que l’avancée rapide de l’intelligence artificielle (IA) générative suscite à la fois de l’enthousiasme et des inquiétudes, il est désormais admis qu’elle ouvre des possibilités d’innovation dans différents secteurs. Que peut-elle apporter à la Francophonie scientifique ?
Comment peut-elle aider au développement de la réflexion scientifique en français et à sa diffusion dans un monde scientifique largement dominé par l’anglais ?
Pour Cédric Villani (lauréat de la médaille Fields en 2010), "le seul domaine scientifique qui résiste un tant soit peu à l’anglophonie, c’est la mathématique. Pourquoi le français en mathématique ? C’est en grande partie un héritage de Bourbaki, Grothendieck et leurs confrères, défendu par une communauté mathématique fière qui vit l’anglophonie comme une invasion".
1) Les évènements récents relatifs à la Francophonie scientifique et à l’IA générative
1.1) Colloque des 25 et 26 juin 2024 intitulé "Francophonie scientifique et Intelligence artificielle générative (IAG) : vers un développement mutuel"
En partenariat avec l’Agence Universitaire de la Francophonie (AUF) et l’Université de Science et technologie Politechnica Bucarest (UNSTPB) en Roumanie, le Réseau de Recherche Francophone en Intelligence artificielle (RéFIA) a tenu son premier colloque international les 25 et 26 juin 2024 à l’UNSTPB. Des spécialistes et des enseignants chercheurs en IA venus d’une vingtaine de pays ont échangé au cours du thème "Francophonie scientifique et Intelligence artificielle générative (IAG) : vers un développement mutuel". Ce colloque avait pour objectif d’identifier comment la Francophonie scientifique pourrait intégrer les dynamiques innovantes offertes par l’intelligence artificielle générative.
1.2) Les 4èmes Assises internationales de la Francophonie scientifique
Les 4èmes Assises internationales de la Francophonie scientifique ont eu lieu du 16 au 18 octobre 2024 à Toulouse. Réunissant quelque 250 enseignants-chercheurs et experts, les Assises s’articulaient autour de cinq ateliers thématiques dont celui intitulé "Transformation numérique et explosion de l’IA générative". Elles avaient pour objectif d’aboutir à des recommandations pratiques et à des solutions destinées aux acteurs de la Francophonie scientifique.
S’agissant de l’atelier "Transformation numérique et explosion de l’IA générative", quelques recommandations majeures ont été formulées :
1) développer une gouvernance éthique et une stratégie claire pour l’usage de l’IA dans l’enseignement supérieur ;
2) former les enseignants et étudiants aux compétences numériques et à l’esprit critique vis-à-vis des outils d’IA générative pour favoriser une utilisation responsable et éclairée ;
3) faciliter l’accès à l’éducation par le numérique en élargissant les formations à distance et en mutualisant les ressources entre les membres du réseau pour renforcer l’employabilité et l’innovation pédagogique.
2) Analyse conceptuelle
2.1) L’intelligence artificielle générative (IAG)
Il n’existe pas de définition unique et universelle de la notion d’intelligence artificielle (IA), qui est née au milieu des années 1950. L’IA trouve son origine dans les réflexions du mathématicien Alan Turing. Selon le Parlement européen, l’IA représente "tout outil utilisé par une machine afin de reproduire des comportements liés aux humains, tels que le raisonnement, la planification et la créativité".
Contrairement à l’IA traditionnelle qui cherche à comprendre et à reproduire l’intelligence humaine, l’intelligence artificielle générative se concentre sur la création de contenus originaux, que ce soit du texte, de l’image, de la musique ou d’autres types de données, à partir de modèles d’apprentissage profond, c’est-à-dire des algorithmes qui simulent les processus d’apprentissage et de prise de décision du cerveau humain. L’arrivée de ChatGPT a mis en avant cette nouvelle technologie. La capacité de production de l’IA générative constitue un tournant majeur de l’IA.
2.2) La Francophonie scientifique
"L’activité́ de recherche n’échappe pas au conditionnement culturel. La science s’inscrit dans l’histoire et dans la culture de ceux qui la font, donc aussi dans leur langue"
Bakara Touré (ancien président de Bakara Touré de l’AUPELF/UREF)
Les premières mentions de la Francophonie scientifique sont apparues en 1989. L’Agence universitaire propose la définition suivante : "La Francophonie scientifique s’attache à développer et à valoriser toutes les sciences en langue française. Elle rassemble l’ensemble des représentants clés du secteur de l’éducation, de l’enseignement supérieur, de la recherche et de la formation professionnelle dans l’espace francophone". Celle-ci ne se limite pas à une simple utilisation de la langue française dans la science. Elle représente également un vecteur de diversité culturelle et d’échanges dans la production et la diffusion des savoirs scientifiques.
3) L’IA générative jour un rôle grandissant dans la Francophonie scientifique
Les principaux apports de l’IA générative à la Francophonie scientifique sont les suivants :
3.1) Production scientifique et accessibilité des corpus scientifiques en français
- Traduction automatique neuronale (NMT/Neural Machine Translation) :Grâce à ce nouveau moteur de traduction, les chercheurs francophones peuvent publier leurs travaux en français. Celui-ci utilise l’intelligence artificielle et l’apprentissage profond pour obtenir des traductions plus précises. Contrairement à la traduction automatique basée sur des statistiques et sur des règles, le moteur neuronal modélise l’ensemble du processus de traduction automatique à travers un réseau neuronal artificiel unique. Ainsi, les réseaux neuronaux et autres formes d’apprentissage automatique (machine learning) ont amélioré les systèmes de traduction, permettant des interprétations plus naturelles et plus exactes.
- Vulgarisation des théories scientifiques: l’IA générative va permettre de réduire le fossé entre la recherche et le grand public en transformant des textes complexes en résumés compréhensibles et faciliter ainsi la diffusion de connaissances scientifiques auprès des communautés francophones.
- Création de contenus éducatifs et scientifiques en français : le modèle d’IA générative (comme ChatGPT ou des modèles spécifiquement francophones tel que HuggingChat) est capable de produire des articles , des résumés de recherches, des supports pédagogiques en français, qui enrichissent les bases de données scientifiques en français. Ces productions de contenus vont faciliter les recherches et les analyses futures pour la communauté scientifique francophone.
- Promotion de la diversité culturelle et linguistique dans la recherche scientifique : en favorisant la production de contenus scientifiques en français, l’IA générative contribue à contrer l’hégémonie de l’anglais dans la recherche. Il faut effectivement agir pour renforcer la présence du français dans l’intelligence artificielle car cette dernière constitue un levier puissant pour accroître la visibilité des communautés scientifiques francophones.
En développant des modèles d’IA multilingues, la francophonie peut jouer un rôle clé dans la recherche de l’éthique de l’IA, notamment pour réduire les biais linguistiques et culturels.
3.2) Les biais linguistiques et culturels
Abordant la question de l’éthique de l’intelligence artificielle lors du premier colloque du Réseau de Recherche Francophone en Intelligence artificielle évoqué précédemment dans le paragraphe introductif, le Professeur Lazare Poamé, titulaire de la chaire UNESCO de Bioéthique, a relevé les problèmes éthiques tels que les biais algorithmiques, la confidentialité des données et la déresponsabilisation humaine face aux décisions des machines. Il a souligné notamment le risque lié à la promotion d’un "fast-food intellectuel" et la difficulté de protéger l’intégrité des systèmes d’évaluation académique à l’ère de la profusion de nouveaux outils tels que ChatGPT.
- Les biais linguistiques : une nouvelle méthode d’évaluation par des chercheurs espagnols du centre de recherche en technologie du langage de l’université du Pays Basque montre que les IA multilingues donnent de meilleures réponses quand la question est traduite en anglais. Ils expliquent que "les modèles sont bien plus performants en moyenne quand ils répondent en anglais, sur tous les types d’exercices …". Ils rajoutent : "les modèles multilingues ne peuvent pas donner tout leur potentiel quand on les sollicite dans une autre langue que l’anglais". La prééminence de contenus en anglais dans les données d’entraînement crée des biais dans les performances pour les autres langues, y compris le français. Cela pose un défi pour garantir la précision et la pertinence des réponses en français.
- Le risque d’uniformisation de la culture scientifique moins perceptible mais significatif. L’intelligence artificielle générative peut avoir un impact sur la culture scientifique en uniformisant les expressions et les termes techniques. La Francophonie scientifique doit veiller à ce que la richesse terminologique française soit respectée et qu’elle ne perde pas de sa richesse.
- Les questions de souveraineté numérique. Le déploiement des systèmes d’intelligence artificielle dans des secteurs sensibles comme la recherche pose des questions de souveraineté. La souveraineté des données et la souveraineté technologique sont les deux piliers de la souveraineté numérique que nous pouvons définir comme la capacité d’une organisation à contrôler son environnement numérique (données, applications, logiciels, systèmes et matériels). La centralisation des technologies de l’intelligence artificielle dans les pays anglo-saxons altère notre souveraineté et la sécurité de nos données. En traitant des biais linguistiques, nous avons vu, qu’à l’heure actuelle, les modèles d’intelligence artificielle sont moins performants en français qu’en anglais, ayant principalement été entraînés sur des corpus anglais. Le développement de l’IA générative propre aux spécificités francophones pourrait offrir une alternative intéressante.
La présence du français sur la toile est en recul face à la prolifération des contenus en anglais. L’intelligence artificielle, bien que capable de comprendre plusieurs langues, a souvent du mal à s’adapter aux spécificités culturelles et linguistiques des autres langues, dont le français.
La francophonie doit se focaliser sur une intelligence éthique et responsable. Par ailleurs, un développement des réseaux de recherche en IA générative entre pays francophones afin de mutualiser les ressources et les connaissances pourrait accroître l’impact international de la recherche en langue française.