Une annonce plus importante qu’elle n’en a l’air ?
Le 31 mai 2026, Jensen Huang, cofondateur, président et CEO de Nvidia, a présenté RTX Spark, une nouvelle puce destinée à être intégrée dans des ordinateurs portables ou de bureau capables de faire tourner localement des intelligences artificielles (IA) puissantes.
Pourquoi cette annonce, dans un monde de l’IA qui multiplie les effets d’annonce, pourrait-elle se distinguer des autres et avoir un impact stratégique sur notre avenir ? Nous allons voir que le débat sur l’IA mélange souvent deux trajectoires aux conséquences différentes : une IA « suffisamment bonne » pour répondre à la plupart des besoins des particuliers, des professionnels et des entreprises ; et une course entre grandes puissances et grands acteurs pour franchir un seuil d’auto-accélération afin de prendre un avantage difficilement rattrapable. Cette seconde trajectoire pose aussi le risque d’une perte de contrôle face à des systèmes dont le fonctionnement, les objectifs ou les capacités deviendraient difficiles à comprendre et à encadrer.
L’objectif de cet article n’est pas de dire si l’IA est « bonne » ou « mauvaise », mais plutôt de proposer une analyse stratégique des trajectoires possibles, des conditions de leur émergence et des points de vigilance.
Opportunités et risques : sortir des jugements simplistes
L’IA peut être une formidable opportunité lorsqu’elle est mise au service de la recherche, de la création, de la résolution de problèmes complexes ou de l’amélioration de certaines tâches. Elle comporte également plusieurs risques, parmi lesquels un changement profond du monde du travail, la multiplication des fausses informations, l’automatisation d’actions sensibles ou encore la concentration du pouvoir technologique. Le plus préoccupant à terme pourrait être la perte de contrôle.
On parle souvent de l’AGI, l’intelligence artificielle générale qui, selon les définitions, égalerait ou dépasserait les capacités humaines dans un très grand nombre de tâches, voire les capacités collectives de l’humanité. Mais ces définitions restent instables et parfois concurrentes, ce qui conduit à des prédictions très différentes selon les acteurs.
Un des scénarios de perte de contrôle vient de la capacité d’une IA avancée à décomposer un objectif humain en sous-objectifs, puis à poursuivre ces sous-objectifs d’une manière que l’humain n’avait pas prévue. Par exemple, une IA très autonome pourrait chercher à maintenir son fonctionnement si elle interprétait son arrêt comme un obstacle à la réalisation de la tâche demandée. C’est l’un des problèmes étudiés sous le terme d’alignement des IA : comment faire en sorte que les systèmes poursuivent réellement les intentions humaines, y compris dans des situations imprévues ? Ce risque augmente lorsque l’on ajoute de l’autonomie : agents capables d’agir dans des applications, robots intervenant dans le monde réel, ou systèmes pouvant enchaîner plusieurs actions sans validation humaine à chaque étape.
De nombreux travaux actuels cherchent à favoriser l’alignement des IA. Mais ce problème pourrait devenir encore plus complexe si les systèmes deviennent assez puissants et complexes pour que leurs raisonnements, leurs critères de décision ou leurs stratégies deviennent difficiles à interpréter. Un autre changement important est que les IA participent déjà de plus en plus à leur propre développement, notamment en aidant à écrire du code. Selon Fortune, Boris Cherny, responsable de Claude Code chez Anthropic, affirme que 100 % de son propre code est désormais écrit par IA. Un porte-parole d’Anthropic nuance toutefois en indiquant que, pour l’ensemble de l’entreprise, la proportion serait plutôt comprise entre 70 % et 90 %, et qu’environ 90 % du code de Claude Code serait écrit par Claude Code lui-même[1]. Ces chiffres doivent être compris comme des déclarations rapportées, non comme une mesure indépendante auditée. Les IA codent beaucoup plus vite que les humains. Si elles deviennent capables de proposer, coder, tester et valider elles-mêmes des améliorations significatives, cela pourrait ouvrir la voie à des cycles d’amélioration beaucoup plus rapides, potentiellement plus courts, et susceptibles d’aller au-delà de ce que l’on appelle aujourd’hui l’AGI, quelle qu’en soit la définition. On parle alors de superintelligence. Ce risque technique devient stratégique lorsqu’il rencontre la compétition économique et géopolitique.
Plusieurs acteurs majeurs du domaine placent explicitement l’AGI au cœur de leur mission. OpenAI, par exemple, définit sa mission comme le fait de veiller à ce que l’intelligence artificielle générale bénéficie à toute l’humanité. Dans une lecture géostratégique, le risque est que l’objectif ne soit plus seulement de développer une technologie utile aux particuliers, aux professionnels et aux entreprises, mais aussi de prendre l’avantage dans une course opposant grandes entreprises et grandes puissances, notamment les États-Unis et la Chine.
L’évolution des architectures : accélérer la centralisation ou rendre le local crédible ?
Les IA ne progressent pas seulement par l’ajout de puissance brute dans les centres de données. Une part significative des progrès est due à des innovations d’architecture (modèles spécialisés, Mixture of Experts, quantification, routage, RAG, meilleure orchestration, petits modèles complémentaires, etc.). Ces améliorations contribuent à des gains rapides d’efficacité. Des analyses récentes estiment que, pour un niveau donné de capacité, le coût d’inférence, c’est-à-dire d’utilisation des modèles, baisse actuellement d’environ cinq à dix fois par an, même si cette tendance reste approximative[2]. Dans certains cas ponctuels, des ruptures architecturales peuvent donner l’impression d’un saut beaucoup plus rapide, mais il serait imprudent d’en faire une loi générale.
Le point clé est que ces gains peuvent être utilisés de deux façons. Ils peuvent être utilisés, à coût équivalent, pour développer des IA toujours plus puissantes, ou bien, au contraire, pour obtenir des IA de capacité comparable, mais demandant moins d’énergie et de puissance de calcul. Il devient ainsi possible de faire tourner des IA « suffisamment puissantes » sur des serveurs d’entreprise. C’est le cas par exemple de Camélia, une IA générative sécurisée déployée au sein de l’Assurance Maladie pour assister certaines équipes dans leurs tâches. Il existe aussi des machines spécialisées pour faire tourner localement de grands modèles, comme le DGX Spark de Nvidia. Il est même déjà possible de faire tourner certains modèles sur un PC ordinaire, mais avec des limites de taille, de vitesse et de confort d’usage.
Un autre facteur permettant d’améliorer la performance des IA concerne les puces dédiées comme des GPU (Graphics Processing Unit), que l’on peut traduire par processeur graphique, également utilisés pour calculer les graphiques en temps réel, et les nouveaux NPU (Neural Processing Unit) ou les TPU de Google (Tensor Processing Unit) plus spécifiquement dédiés à l’IA. Jusqu’ici, les puces IA les plus avancées ont surtout été orientées vers les centres de données. Il existe bien quelques exceptions, notamment chez Tesla, avec des puces destinées aux voitures autonomes et aux robots, ou chez Neuralink avec des puces d’interface neuronale. Mais ces exceptions ne visaient pas les ordinateurs personnels généralistes, sauf peut-être les puces M d’Apple, qui ont justement montré l’intérêt d’une architecture efficace pour certains usages d’IA locale.
RTX Spark pourrait donc marquer une différence importante : rendre disponible, sur des PC professionnels, une IA locale suffisamment puissante pour de nombreux usages.
Tous les usages de l’IA n’ont pas les mêmes besoins de puissance
Pour comprendre l’enjeu des gains d’architecture, il faut distinguer deux façons de les utiliser : développer des IA toujours plus puissantes, ou rendre possibles des IA « suffisamment puissantes » pouvant éventuellement tourner en local. Il est utile de distinguer quatre grands usages de l’IA : les usages personnels et professionnels, les usages spécialisés, l’entraînement des modèles de fondation, et la course à l’AGI.
Les IA personnelles et professionnelles utilisées au quotidien ne nécessitent pas le modèle le plus puissant au monde. Le point décisif devient plutôt ce que l’on appelle le « harnais logiciel », c’est-à-dire l’ensemble des fonctions qui permettent à une IA de devenir réellement utile : connexion aux documents, aux autres outils utilisés, aux processus de travail et à différentes interfaces. Apple, avec ses puces M, a déjà montré l’intérêt de machines efficaces pour certains usages d’IA locale. Nvidia, avec RTX Spark, promet d’aller plus loin sur des PC professionnels, avec des IA « suffisamment puissantes » pour la majorité des usages, à un prix qui pourrait devenir accessible, dans un premier temps, à des professionnels. Cela ne supprimerait pas les usages demandant plus de puissance sur des centres de données, mais pourrait réduire fortement le recours au cloud pour ces usages quotidiens. L’utilisation locale des IA pourrait également améliorer la confidentialité des données sensibles à condition d’avoir des applications locales adaptées.
Certaines IA ont des usages plus spécialisés. Lorsqu’elles sont optimisées pour un domaine précis, elles peuvent mieux tirer parti d’une puissance de calcul importante. C’est le cas par exemple dans la médecine, le climat, la biologie, les matériaux… Les plus grands succès ont été obtenus dans ce cadre par la division Deepmind de Google. Son dirigeant, Demis Hassabis, colauréat du prix Nobel de chimie 2024 pour les travaux liés à AlphaFold, explique que si ces usages demandent une grande puissance, la capacité actuelle permet de faire déjà d’énormes progrès et certaines avancées scientifiques deviennent difficilement réversibles : une fois une structure de protéine mieux prédite, une méthode validée ou une découverte publiée, elle reste disponible même si la course à la puissance ralentit.
Un troisième usage consiste à entraîner les « modèles de fondation » qui serviront ensuite de base à de nombreux usages et applications. Cela demande une grande puissance de calcul, beaucoup d’énergie et de capital. Dans ce cas, le nombre d’acteurs capables de le faire est beaucoup plus faible : il s’agit surtout d’entreprises, de laboratoires ou de consortiums ayant accès à de très grandes infrastructures de calcul. Les centres de données actuels permettent déjà d’entraîner des modèles de fondation très puissants et les progrès architecturaux peuvent permettre de continuer à améliorer ces modèles sans augmenter mécaniquement la taille des centres de données.
Le quatrième usage est la course à l’AGI. Dès 2017, Vladimir Poutine déclarait que celui qui deviendrait leader dans l’intelligence artificielle deviendrait « le maître du monde »[3]. Ici l’enjeu est géopolitique et pousse à rechercher toujours plus de puissance de calcul, de données, de mémoire et d’infrastructures. Il semble difficile de compter uniquement sur un accord spontané entre acteurs pour ralentir cette course. La théorie des jeux montre que, lorsque les acteurs ne peuvent pas être certains des choix des autres, ils peuvent être conduits à privilégier une stratégie stable individuellement, mais moins bonne collectivement[4]. Comme dans certaines courses technologiques ou militaires, la dynamique peut se poursuivre jusqu’à ce qu’un acteur prenne un avantage décisif, ou jusqu’à ce que le coût devienne trop élevé pour l’un ou plusieurs des participants. La course à la Lune donne une image de ce type de compétition, même si l’IA est évidemment un cas beaucoup plus ouvert[5].
Les IA locales pourraient-elles avoir un impact sur la course à l’AGI ?
On pourrait assister à une différenciation croissante du marché de l’IA. Les grands centres de données continueraient d’exister, mais une partie des usages aujourd’hui traités dans le cloud pourrait être prise en charge par des IA locales, sur des serveurs d’entreprise ou des PC puissants. Cette situation pourrait rendre moins évident le financement de nouveaux centres de données toujours plus grands, si une part significative de la valeur migre vers le local. Cela ne veut pas dire que nous assistons à la fin des centres de données, mais l’arrivée des IA locales pourrait fragiliser la course au gigantisme des centres de données principalement justifiée, dans certains discours, par la compétition géopolitique autour de l’AGI.
Si les IA locales deviennent suffisantes pour une grande partie des usages professionnels, la pression sociale et économique pour tout miser sur une AGI centralisée pourrait diminuer. Cela n’empêchera pas les grands acteurs de continuer la course, mais pourrait réorienter une partie des financements vers des usages locaux, hybrides ou spécialisés. Parallèlement, on observe aussi de grands accords croisés entre acteurs de l’IA, du cloud et des semi-conducteurs, ce qui alimente le débat sur la solidité économique réelle du secteur. Barron’s parle ainsi de « financement circulaire » pour décrire les flux croisés entre Nvidia, Microsoft, OpenAI, Oracle ou CoreWeave, lorsque certains acteurs investissent dans leurs clients, fournisseurs ou partenaires tout en bénéficiant ensuite de leurs dépenses en infrastructures IA[-]. Même si ce scénario n’a rien de mécanique, il devient envisageable qu’une correction importante touche les segments les plus dépendants des investissements massifs en centres de données. Si cela arrivait, cela pourrait avoir un impact majeur sur la course aux modèles toujours plus grands, tout en ayant un effet plus limité sur les usages déjà stabilisés : outils professionnels, modèles locaux, IA spécialisées ou applications métier. Les centres de données existants continueraient probablement à être utilisés, mais les projets d’expansion les plus ambitieux pourraient être réévalués. Le marché des IA locales pourrait être moins exposé, car il reposerait davantage sur l’achat de machines et de logiciels locaux que sur la rentabilité de méga-infrastructures centralisées. Quant à l’entraînement des modèles de fondation, leur développement pourrait ralentir, mais cela n’empêcherait pas les modèles actuels et leurs déclinaisons de continuer à évoluer, même plus progressivement, vers des IA « suffisamment puissantes » pour une grande partie des usages utiles.
Il devient donc utile d’examiner ce que les IA locales permettent réellement, mais aussi leurs limites, pour comprendre dans quelles conditions une partie des investissements en IA pourrait se déplacer vers ce marché.
IA locale pour les usages quotidiens : dans quelles conditions ?
L’objectif n’est pas de reproduire en local la meilleure IA disponible sur le cloud, mais de disposer d’une IA suffisamment bonne pour la majorité des usages quotidiens. Une grande partie des usages pourrait être traitée localement, tandis qu’une part plus limitée passerait dans le cloud lorsque ce serait nécessaire.
Les principaux avantages des IA locales sont une meilleure confidentialité des documents sensibles, la moindre dépendance aux clouds et aux API, la réduction possible des coûts récurrents, et une meilleure intégration avec les fichiers, notes, processus et outils de travail.Maisles IAlocales ne remplaceront pas tous les usages cloud. Les usages multimodaux lourds, comme la génération de vidéos avancées avec image, voix et son synchronisés, pourraient rester dans un premier temps dans le cloud. De même, les IA modernes permettent un raisonnement de plus en plus profond, avec de nombreuses étapes dans la réflexion. Cela peut nécessiter des traitements lourds, parfois hors de portée des machines locales actuelles. Mais les progrès architecturaux pourraient bénéficier aux IA locales. Fin 2025, un article a par exemple proposé le Tiny Recursive Model (TRM), un petit modèle récursif conçu pour certaines tâches de raisonnement abstrait[7]. Un tel modèle semble très efficace sur certaines tâches de raisonnement, tout en étant beaucoup plus petit que les grands modèles de langage habituels. Mais il reste très limité pour traiter la richesse et la diversité du langage humain. Une piste consiste alors à associer ce type de petit modèle récursif, spécialisé dans le raisonnement, à un grand modèle de langage capable de mobiliser une large mémoire sémantique. Dans un premier travail, j’ai exploré une version minimale de cette architecture avec un modèle de langage de taille modeste et un TRM pouvant tourner sur un simple PC[8]. L’intérêt de RTX Spark serait de rendre possible une version beaucoup plus confortable : un grand modèle de langage plus puissant grâce à la puce dédiée, associé à un petit modèle récursif chargé du raisonnement local. Si les modèles actuels associés aux nouvelles puces permettent déjà de faire tourner une grande partie des usages en local, des progrès futurs pourraient accentuer cette tendance.
Cependant, les premières machines capables de faire tourner confortablement une IA en local devraient être encore chères au départ. Des estimations d’analystes parlent d’environ 2 899 dollars pour des machines tournant sur la puce N1X de la famille RTX Spark, et de 1 799 dollars pour des machines utilisant la puce N1, un peu moins puissante, mais déjà susceptible de marquer un saut par rapport à la plupart des PC actuels pour les usages d’IA locale. Ces chiffres sont à prendre avant conversion européenne, TVA et choix des constructeurs.
D’autre part, faire tourner une IA en local, bien que favorable à la confidentialité des données, demandera aux utilisateurs ou à leur service informatique de gérer les mises à jour, la sécurité et les permissions. Par exemple, faire tourner des agents autonomes capables d’écrire, modifier ou supprimer des fichiers, d’envoyer des mails ou de publier du contenu nécessitera une stratégie de permissions, de journalisation et de validation humaine adaptée.
Un point de vigilance sera essentiel si l’on veut réellement bénéficier des avantages des IA locales en termes de coût et de confidentialité. Si les appels aux IA externes sur les centres de données restent nécessaires, même de façon minoritaire, alors il existera une tension entre l’intérêt des utilisateurs, qui souhaitent garder le contrôle de leurs prompts, documents et métadonnées, et celui de certains fournisseurs, qui pourraient être tentés de maintenir des modèles économiques fondés sur la captation de données ou la dépendance au cloud.
Le marché des IA locales peut-il se développer rapidement ?
L’impact des IA locales sur le reste du marché de l’IA dépendra de leur capacité à se diffuser suffisamment rapidement. Apple a déjà montré qu’il existe un marché pour des machines capables de faire tourner de l’IA locale. Mais les configurations vraiment confortables montent plutôt autour de 3 000 € à 5 000 €. RTX Spark pourrait attaquer ce marché avec des prix d’entrée potentiellement plus bas. Le seuil décisif pourrait être une descente vers 2 000 €, puis éventuellement vers une fourchette de 1 500 à 2 000 €, pour des configurations déjà suffisamment utiles professionnellement.
Un des facteurs qui pourrait limiter cette hypothèse est le prix actuel de la mémoire. En effet, les grands centres de données utilisent un type de mémoire très haut de gamme, la HBM. Ce marché est dominé par trois fabricants, SK Hynix, Samsung et Micron, pour lesquels ces mémoires sont très rentables. Devant une demande énorme, ils orientent une partie croissante de leurs capacités vers ces mémoires, au détriment relatif des DRAM/LPDDR utilisées dans de nombreux ordinateurs et machines locales. Cette tension sur la mémoire contribue à pousser les prix vers le haut. Cependant, la montée d’acteurs chinois comme CXMT sur la DRAM classique pourrait modifier l’équilibre du marché mémoire, même s’ils restent moins avancés sur la HBM. Si le marché de l’IA locale se développe, cela pourrait rendre plus rentable la production de mémoire pour ordinateurs locaux et contribuer à faire baisser le coût des machines locales.
Plusieurs critères sont à suivre pour évaluer la possibilité que le développement du nouveau segment des IA locales ait un impact sur le marché de l’IA et en particulier sur la course à l’AGI. Tout d’abord, le prix d’entrée réel des RTX Spark lors de leur disponibilité annoncée à partir de l’automne 2026 (Microsoft a déjà annoncé le Surface Laptop Ultra, mais sans encore communiquer de prix). L’évolution du prix de la mémoire, la vitesse de descente vers le seuil de 2 000 € et la disponibilité réelle des machines, y compris en Europe, auront un impact sur la vitesse de développement des IA locales.
Il faut également prendre en compte la disponibilité et la maturité des logiciels adaptés à ces IA locales. Le risque d’un manque de logiciels pourrait être réduit par l’ampleur de l’écosystème déjà annoncé : Nvidia et Microsoft indiquent que plus de 100 fournisseurs de logiciels Windows, dont Adobe, Blackmagic Design, Blender, CapCut, ComfyUI et OTOY, travaillent déjà à l’adoption de la plateforme RTX Spark[9]. D’autre part, l’IA elle-même accélère déjà le développement d’applications, d’agents et de connecteurs, ce qui pourrait réduire le délai entre l’arrivée du matériel et celle des usages réellement exploitables.
Que faire des usages qui demanderont encore beaucoup de puissance ?
Le développement des IA locales ne signifie pas que tous les usages de l’IA pourront être traités sur un ordinateur personnel. Certains domaines, comme la médecine, le climat, la biologie ou les matériaux, continueront à demander une puissance importante. Mais un ralentissement éventuel de la course aux IA toujours plus puissantes ne ferait pas disparaître les acquis déjà obtenus : une méthode validée, une découverte publiée ou une structure de protéine mieux prédite restent disponibles. De plus, certains traitements spécialisés peuvent se prêter à des formes plus distribuées ou mutualisées de recherche, lorsqu’ils peuvent être découpés en tâches parallèles ou partagés entre plusieurs acteurs.
Pour les modèles de fondation, il faut en distinguer deux trajectoires. Certains sont développés dans la logique de la course à l’AGI : ils visent des capacités toujours plus générales et puissantes et poussent à construire des centres de données toujours plus grands. D’autres modèles de fondation peuvent viser des usages plus ciblés et proportionnés : améliorer les IA personnelles, professionnelles ou spécialisées, sans chercher nécessairement à franchir un seuil d’auto-accélération. Ces modèles auront encore besoin de progresser, mais cette progression pourrait rester compatible avec les centres de données actuels, des infrastructures mutualisées, ou des initiatives portées par des acteurs publics, européens ou sectoriels. L’enjeu n’est donc pas d’arrêter les modèles de fondation, mais de distinguer ceux qui servent une course géopolitique à la puissance de ceux qui soutiennent des usages utiles et mieux gouvernables.
L’enjeu n’est donc pas de savoir si l’IA doit être puissante ou non, mais de distinguer les usages qui exigent réellement de grandes infrastructures de ceux qui peuvent devenir plus locaux, plus distribués ou plus mutualisés, afin d’éviter que toute l’évolution de l’IA soit captée par la seule course à l’AGI.
Conclusion : une bifurcation possible, pas une certitude
L’annonce RTX Spark pourrait être importante parce qu’elle rend crédible l’émergence d’une IA locale professionnelle. Sous certaines conditions de prix, de mémoire, de disponibilité et de maturité logicielle, ce marché pourrait se développer rapidement. Mais ce scénario n’a rien de certain.
Si une partie significative du marché de l’IA se redirige vers les IA locales, cela pourrait fragiliser les stratégies fondées sur le gigantisme des centres de données et contribuer à une correction, voire à l’éclatement d’une bulle IA, sans faire disparaître les capacités déjà acquises. Ce ne serait pas une bonne nouvelle parce que l’IA deviendrait soudainement sans risque, mais parce qu’une trajectoire moins centralisée, plus distribuée et plus gouvernable deviendrait possible.
Au-delà de la rivalité États-Unis/Chine, l’enjeu serait alors d’inventer des modèles économiques qui ne reposent pas uniquement sur la captation de l’attention, la captation des données ou la dépendance au cloud, mais sur des outils plus utiles, plus distribués et mieux contrôlés par leurs utilisateurs, sans empêcher les fournisseurs d’investir, d’innover et de se développer.
[1] Béatrice Nolan, Top engineers at Anthropic, OpenAI say AI now writes 100% of their code—with big implications for the future of software development jobs, Fortune 29 janvier 2026
[2] Jean-Stanislas Denain, How persistent is the inference cost burden?, Epoch AI, 16 février 2026.
[3] Citation de Vladimir Poutine, 1er septembre 2017, rapportée par le Center for a New American Security : « Whoever becomes the leader in this sphere will become the ruler of the world ».
[4] En théorie des jeux, un équilibre de Nash désigne une situation où aucun acteur n’a intérêt à changer seul de stratégie, compte tenu de la stratégie des autres. Un optimum de Pareto désigne une situation où l’on ne peut améliorer la situation d’un acteur sans détériorer celle d’au moins un autre. Le dilemme du prisonnier illustre qu’un équilibre stable individuellement peut être sous-optimal collectivement.
[5] Le coût direct du programme Apollo était de 25,8 milliards de dollars entre 1960 et 1973, soit environ 309 milliards de dollars 2025. En y ajoutant les coûts de Gemini et des programmes lunaires robotiques associés, on arrive à environ 338 milliards de dollars 2025. En comparaison, le projet Stargate annoncé en janvier 2025 par OpenAI, SoftBank, Oracle et MGX prévoit jusqu’à 500 milliards de dollars sur quatre ans pour construire des infrastructures IA aux États-Unis pour OpenAI. Ces montants ne sont pas strictement comparables : Apollo était un programme public achevé, tandis que Stargate est un engagement d’investissement annoncé.
[6] Barron’s, “Nvidia, Microsoft, and OpenAI: This Chart Captures AI’s ‘Circular Financing’”, 10 octobre 2025. L’article décrit des flux financiers croisés entre plusieurs grands acteurs de l’IA et alimente le débat sur la solidité économique réelle du secteur. https://www.barrons.com/articles/nvidia-microsoft-openai-circular-financing-ai-bubble-5d9a4e7c
[7] Jolicoeur-Martineau, A. (2025). Less is More: Recursive Reasoning with Tiny Networks. arXiv preprint arXiv:2510.04871
[8] Cornu, J.-M. (2025). A Frugal Hybrid Architecture for Local AI: Marrying Tiny Recursive Models and External Memory (1.0.0). Zenodo. https://doi.org/10.5281/zenodo.18055127
[9] Nvidia, “NVIDIA and Microsoft Reinvent Windows PCs for the Age of Personal AI”, 31 mai 2026.

