L’IA moderne est arrivée
À quelques mois de l’IPO d’Anthropic, éditeur de Claude, The Economist consacre un long article aux tendances actuelles en matière d’intelligence artificielle, en évoquant un des aspects les plus intrigants de ce domaine : contrairement à d’autres logiciels qui restent des outils figés dans le temps, l’IA moderne s’améliore elle-même. Enfin, s’améliore elle-même, s’est un peu vite dit. Disons plutôt que désormais, on utilise les IA pour améliorer leur propre code.
En soi, qu’une entreprise utilise ses propres logiciels, cela m’a toujours semblé la moindre des choses, quand cela est possible, et cela a déjà existé dans d’autres domaines. J’imagine mal Microsoft ne pas utiliser la suite Office en interne ou les outils de développements conçus par ses équipes pour développer ses propres outils. Je me souviens qu’un des professeurs, durant mes études en DEA d’Intelligence artificielle, avait consacré son cours à l’écriture d’un interpréteur Lisp … en Lisp. Et j’ai eu le plaisir de mettre en oeuvre cette approche même chez Dassault Systèmes, en utilisant SmarTeam comme outil de suivi de projet et de facturation par les équipes commerciales, même si malheureusement un diktat interne a empêché de rendre public cet usage via la communication interne…
Mais ici, il s’agit de tout autre chose. L’outil sert à développer l’outil lui-même, comme dans les Pirkei Avot, וְאַף צְבַת בִּצְבַת עֲשׂוּיָה, même la première tenaille a été forgée à l’aide d’une tenaille. Ici, l’IA – Claude Code – sert à façonner les nouvelles versions de Claude. Anthropic prétend que 80% du code interne serait produit par Claude lui-même. Il y a quelque chose de vertigineux dans cette approche, comme cette séquence ou le Terminator est capable de se réparer lui-même… Bien sûr, l’humain intervient encore, probablement en pilotage ou pour orienter des décisions d’architecture, de périmètre fonctionnel ou de plan de développement. Mais pour ce qui est de produire du code, comme je l’expérimente au quotidien, on peut très bien s’appuyer sur ce que savent faire les IA – tout en contrôlant qu’elles ne font pas de bêtise – alors pourquoi s’en priver ?
L’article ne s’arrête pas là, et évoque même des optimisations introduites par les IA elles-mêmes. The Economist évoque en particulier des évolutions chez Google introduites par Gemini, permettant d’optimiser la consommation d’énergie des data centers ou d’accélérer les phases d’entraînement.
Pourtant, il y a une limite à cette approche qui peut vite devenir effrayante. Qu’adviendra-t-il de ces outils lorsqu’on ne passera plus par un contrôle humain pour les faire évoluer ? Que décidera une IA à laquelle on demandera – ou à laquelle on n’aura peut-être même pas demandé – de s’auto-améliorer ? Un peu flippant, non ?

Andrej Karpathy, ancien d’OpenAI passé par Tesla, se sert de l’IA pour réduire la taille des modèles dont il se sert, passant de plusieurs heures de calcul à moins d’une heure. Au-delà de l’économie – à la fois en etrmes d’énergie et de moyens financiers – il y a là aussi quelque chose de passionnant. L’optimisation des logiciels a toujours été un des sujets parmi les plus intéressants mais aussi parmi les plus difficiles. Aux débuts de l’ère de l’informatique, nous, les développeurs, disposions de peu de mémoire disponible (mon premier programme BASIC tenait dans 3Ko…) et de processeurs relativement lents. Il fallait penser optimisation à chaque instant, tant au niveau des algorithmes – merci Donald Knuth – que des structures permettant de représenter les données manipulées (petit clin d’oeil à mes anciens collègues qui ont participé à la migration de CATIA V4 à la V5…). Avec la loi de Moore, l’explosion de la puissance des ordinateurs et de la taille des mémoires, une nouvelle génération d’informaticiens s’est développée : moins économe, elle avait tendance à user et abuser du copier/coller (l’outil idéal permettant la génération spontanée de bugs), ou de gaspiller inutilement la mémoire disponible. Je me souviens d’en avoir croisé à Suresnes – alors qu’on disposait pourtant, au sein de l’entreprise, d’architectes talentueux et peu dispendieux.
Ce retour à une informatique qu’on pourrait presque qualifier de frugale, si ce n’était pas un peu exagéré pour parler de LLM qu’on utilise pour tout et n’importe quoi, a quelque chose à la fois de rassurant et d’effrayant. Rassurant parce qu’on revient à une approche économe et parcimonieuse, noble et vertueuse à tout point de vue. Effrayante, parce qu’elle aboutira à des systèmes de petite taille, qu’on pourra peut-être un jour embarquer sur une simple puce. On passera peut-être des LLM aux micro-LLM ou aux nano-LLM… Vous imaginez la puissance d’un ChatGPT ou d’un Claude dans un petit carré de silicone pas plus grand qu’une carte SIM, fourré dans un appareil ménager ou un robot ?
L’espèce humaine va au devant d’un monde qu’on peine à imaginer. Et pourtant, il faut à tout prix passer du temps, justement, à imaginer ce que ces nouvelles tendances vont permettre de produire. À nos risques et périls.
Hervé Kabla, CTO de Cymon, ancien patron d’agence de comm’, consultant très digital et cofondateur de la série des livres expliqués à mon boss.
Crédits photo : Yann Gourvennec












