News - 11.03.2025

Maledh Marrakchi - L'IA générative souveraine: Un enjeu stratégique

Maledh Marrakchi - L'IA générative souveraine: Un enjeu stratégique

Par Maledh Marrakchi - Dans un monde où l'intelligence artificielle (IA) devient un pilier central du développement économique, technologique, social et militaire, la question de la souveraineté numérique se pose avec acuité. Parmi les différents types d'IA, les IA génératives constituent une rupture, car elles ont la capacité de générer de façon automatique du contenu sous différentes formes. Les grands modèles de langage (LLM : Large Language Models) occupent une place de choix, parmi ces IA génératives, en raison de leur capacité à générer du contenu et particulièrement du texte, et converser avec les utilisateurs en langage naturel de façon très similaire à celle d’un humain, ce qui les rend essentiels pour diverses applications industrielles et gouvernementales. Les modèles linguistiques massifs comme ChatGPT ou Gemini sont des exemples notables de cette technologie. Cependant, ces modèles sont souvent développés par des entreprises occidentales et peuvent ne pas répondre parfaitement aux besoins culturels et linguistiques spécifiques des autres régions.

Depuis quelques mois, se multiplient les annonces à propos de nouvelles IA génératives multimodales capables de générer, de façon native, du contenu sous différentes formes: texte, voix, image, vidéos, du code informatique.

Pour un pays, disposer d'une IA générative « souveraine » offre de nombreux avantages stratégiques, mais implique également des défis majeurs. Cet article explore ces enjeux et met en lumière les initiatives de quelques pays ayant décidé de développer leur propre modèle LLM (IA générative).

Pourquoi un pays devrait-il disposer de son propre LLM ?

Les LLM comme ChatGPT ou DeepSeek sont des IA entraînées sur de vastes ensembles de données. Ils s'appuient sur l'apprentissage automatique (Machine Learning, ML) et plus spécifiquement sur un type d’architecture à base de réseau neuronal dénommé «modèle transformateur». Un LLM, nourri avec suffisamment de données, est capable de reconnaître et d'interpréter le langage humain ou d'autres types de données complexes. De nombreux LLM sont entraînés à l'aide de données recueillies sur Internet, soit des milliers ou des millions de gigaoctets de texte. Toutefois, la qualité des données d’apprentissage a une incidence sur la qualité de l'apprentissage du langage naturel par les LLM. Après une étape de pré-entraînement, les LLMs passent par une étape d'affinage (fine tuning) pour renforcer la qualité de l'entraînement. Leurs résultats sont affinés avec précision (ou à l'aide de prompts plus précis) en fonction de la tâche particulière que le programmeur souhaite leur confier, comme l'interprétation de questions et la génération de réponses, ou la traduction d'un texte d'une langue vers une autre, etc.

L'adoption d'un LLM «souverain», c’est-à-dire développé et contrôlé localement, sécurisé et adapté aux spécificités locales, présente plusieurs avantages pour un pays, parmi lesquels:

• Souveraineté et sécurité des données: l'utilisation de LLM étrangers expose les pays à des risques de fuite ou de captation de données sensibles. Un modèle IA développé localement garantit que les données stratégiques (gouvernement, industrie, militaire, santé, éducation …) restent sous contrôle national, limitant ainsi la dépendance envers des acteurs privés ou étrangers. Les LLM souverains permettent d'éviter les vulnérabilités liées aux outils étrangers et d'assurer la sécurité nationale. Le LLM souverain est la pierre angulaire pour l’automatisation des services gouvernementaux, l’amélioration des services rendus au citoyen, et la réduction de la charge de travail des services publics.

• Indépendance technologique: les grandes puissances technologiques (USA, Chine) détiennent aujourd'hui l'essentiel des LLM, ce qui place les autres pays en situation de dépendance. Un LLM souverain permettrait à un pays de définir ses propres priorités, sans subir les restrictions de pays tiers (embargo technologique, filtrage de contenu, censure, etc. tels que vécus avec certains réseaux sociaux).

• Adaptation aux spécificités nationales: un modèle IA générative propre à un pays peut être entraîné sur des données locales et en accord avec les spécificités culturelles, linguistiques et économiques nationales, évitant ainsi les biais culturels provenant d’autres régions. Des modèles locaux peuvent être adaptés pour soutenir le système éducatif national en intégrant des contenus pédagogiques spécifiques au contexte culturel du pays.

De plus, les transformations en cours posent la problématique de la continuité de la présence de certaines cultures et langues dans le monde du numérique et en particulier à travers l’IA générative. La suprématie numérique et en IA de certains pays et/ou entreprises privées constitue un réel danger pour la diversité culturelle.

• Avantages économiques et compétitivité: les pays investissant dans l'IA souveraine peuvent favoriser l'émergence d'un écosystème technologique local, stimulant ainsi l'emploi et l'innovation. Les développements en cours d’application de l’IA basées sur les Agents IA dans différents domaines s’appuient majoritairement sur un interfaçage avec un LLM, ce qui rend encore plus stratégique l’existence d’un LLM souverain.

Les expériences de certains pays pour un LLM souverain

Face à la suprématie des USA et de la Chine dans le domaine de l’IA et de l’IA générative en particulier, à travers des acteurs privés ou en partenariat public-privé, plusieurs pays ont fait le choix stratégique de se doter de leur propre LLM souverain.

Ainsi par exemple, la France a misé sur le développement d'une infrastructure 100% française pour promouvoir son autonomie technologique. Des entreprises comme Mistral AI travaillent sur des modèles linguistiques adaptés au français, visant à réduire la dépendance aux technologies étrangères tout en respectant la protection des données personnelles. L'intégration des grands modèles de langage (LLM) souverains dans les systèmes gouvernementaux et éducatifs est un sujet en pleine évolution. La France a initié le projet LUCIE, un LLM open source en différentes langues européennes, destiné essentiellement au monde de l’éducation. Il est en phase finale d’ouverture à l’accès au grand public. D’autres annonces d’investissements importants en IA ont été faites lors du dernier Sommet IA tenu à Paris en février dernier.

L'Inde a engagé 1,2 milliard de dollars pour développer ses capacités en matière d'intelligence artificielle autonome, soulignant son engagement vers une indépendance technologique accrue.

Singapour a adopté une approche hybride en utilisant l'open source et en collaborant avec des institutions locales et internationales pour développer son propre LLM.

Les pays du Golfe ont massivement investi dans l'IA pour se positionner comme leaders technologiques, notamment en s'appuyant sur des infrastructures cloud et des LLM propres. Les EAU disposent du LLM «Falcon» développé par la Technology Innovation Institute (TII) des Émirats, selon une approche open source qui rivalise avec ceux des géants technologiques comme Meta et Google. Falcon inclut différentes versions telles que Falcon 40b et Falcon 180b.

L’Arabie Saoudite a mis en place son propre LLM «Mulhem», à travers une entreprise saoudienne Watad, spécialisée dans la technologie IA, entraîné exclusivement sur des jeux de données saoudiens. Ce modèle bilingue arabe-anglais utilise 90 milliards de tokens chacun pour chaque langue.

Le Qatar a, quant à lui, initié le projet «Fanar» spécifiquement conçu pour promouvoir et soutenir la langue arabe dans les technologies d'IA, ce qui le différencie des projets plus larges centrés sur l'anglais ou d'autres langues dominantes. Il comporte des modèles capables de traiter efficacement l'arabe littéraire ainsi que ses divers dialectes. Le projet vise à intégrer les valeurs culturelles arabes et à améliorer l'éducation en utilisant des contenus adaptés au contexte local. Cela permet une meilleure personnalisation de l'apprentissage pour les apprenants arabophones. Voulu comme projet régional, il encourage la coopération entre différents pays arabes pour partager ressources et expertise, renforçant ainsi leur position collective dans le domaine mondial de l'IA. Contrairement aux solutions globales génériques, «Fanar» est conçu pour répondre aux besoins spécifiques du monde arabe, y compris ceux liés à la gouvernance numérique locale. «Fanar» adopte une approche panarabe visant à unifier les efforts régionaux autour de la promotion linguistique et culturelle.

Certaines autres expériences comme celle de la Suède n'ont pas pu aboutir; car cette dernière a rencontré des difficultés lorsqu'elle a tenté de développer son propre LLM en raison du manque de données locales disponibles en suédois par rapport à celles disponibles en anglais. Cela illustre bien les défis liés à l'accès aux données locales nécessaires pour entraîner efficacement un modèle souverain.

Les défis de la mise en place d'un LLM souverain

Le recours à un LLM souverain pose beaucoup de défis dont principalement:

• Coûts élevés: L'entraînement d'un modèle IA nécessite des ressources informatiques massives et une expertise pointue, ce qui peut représenter un frein pour certains pays. Pour contourner ce type de difficultés, certains pays choisissent d'utiliser ou développer des LLM open source. Cette approche présente plusieurs avantages, notamment des coûts réduits (utiliser des modèles open source comme Llama (Meta) ou Mistral ou Fanar ou Falcon permet d'éviter les frais de développement intégral d'un LLM), plus de transparence et de contrôle (contrairement aux modèles fermés, l'open source permet d'auditer le code et de l'adapter aux besoins spécifiques), une collaboration internationale (les pays peuvent mutualiser leurs efforts pour développer des IA communes),

• Disponibilité des données et infrastructures: la constitution de bases de données locales de haute qualité et la mise en place d'infrastructures d'hébergement sécurisées sont des prérequis fondamentaux pour ce type de projet,

• Formation des talents: tout pays se lançant dans un tel projet doit investir massivement dans la formation de spécialistes en IA pour développer et maintenir son propre LLM.

Développer un LLM souverain est une stratégie cruciale pour les nations souhaitant garantir leur indépendance technologique. Si les coûts et les défis sont réels, des solutions open source permettent d'atténuer ces difficultés. En s'engageant dans cette voie, les pays peuvent renforcer leur économie, leur sécurité et leur compétitivité sur la scène internationale. Les développements des Agents IA considérés comme la future tendance incontournable s’appuient sur les LLM et en font un préalable stratégique pour un pays. La sauvegarde de l’identité culturelle d’un peuple et de la souveraineté d’un pays passe désormais par l’IA générative et l’IA souveraine.

Maledh Marrakchi



 

Vous aimez cet article ? partagez-le avec vos amis ! Abonnez-vous
commenter cet article
0 Commentaires
X

Fly-out sidebar

This is an optional, fully widgetized sidebar. Show your latest posts, comments, etc. As is the rest of the menu, the sidebar too is fully color customizable.