Les services d’IA ne cessent de m’étonner. Pour avoir vécu la bulle Internet de 2001-2002, je ne peux qu’être attentif au parfum actuel qui se dégage de ce marché. Parfum d’autant plus vif et tenace qu’il semble être largement multiplié par des investissements colossaux. En ce moment, on sent que le marché de l’IA commence à s’effriter. La rentabilité des investissements devient longue et assez délicate. Et c’est pour cela que cette histoire est savoureuse.
Imaginez-vous commerçant ou fournisseur de service en train de faire votre « Business Plan » et de le présenter à la banque pour trouver les fonds nécessaires pour vous établir. Il est prévu quelques années difficiles au début, on ne trouve pas forcément sa clientèle immédiatement et il faut faire ses preuves. Mais, au bout de quelques trimestres ou années, on estime pouvoir dégager des bénéfices et donc rembourser la banque correctement sur un plan étalé sur quelques temps. On tend son dossier au banquier, il dit « non » et ensuite on hypothèque sa baraque pour se jeter à l’eau. Ou on retourne à son poste salarié en mâchouillant ses illusions perdues.

Maintenant, imaginez vous être, je ne sais pas, développeur d’applications. Et vous proposeriez un business plan ou vous vendriez des forfaits de prestation de service à 250$ à diverses sociétés. En gros, vous leur apportez de l’aide en ligne en les corrigeant ou en réalisant leur code. Seulement voilà, vous êtes malin et vous vous dites qu’au lieu de répondre vous-même, vous allez faire appel à des développeurs indépendants au travers d’une plateforme commune. Le client pose sa question, un développeur répond. Tout le monde est content. Il y a pourtant un petit hic dans votre business plan. Votre banquier est en train de le lire quand vous le voyez soulever un sourcil interrogateur. Il pose son doigt sur votre tableau présentant vos recettes et pointe un léger détail. La courbe des bénéfices s’enfonce irrémédiablement vers des pertes et à une vitesse vertigineuse.
Parce que le coût du salaire versé à vos développeurs pour assurer la tâche d’aide à ces entreprises est évalué à 15 000$. Ce qui pose un petit problème avec une perte nette de 14 750$ par abonnement vendu. Après que vous vous soyez baissé pour éviter le fauteuil, pourtant vraiment très lourd, que votre banquier vient d’envoyer voler dans la pièce, vous prenez vos affaires et vous partez rapidement.

Tes calculs sont pas bon KevIA
C’est du moins ce que l’on serait tenté de penser dans une économie logique. Mais, comme pour la bulle internet des années 2000, avec l’IA nous ne sommes pas dans une économie logique. La société Augment Code propose peu ou prou cela, une aide au développement. Mieux, elle n’a pas besoin de développeurs à payer pour aider les boites. Non, elle fait appel à une IA qui rend ce service pour elle. Seulement voilà, Augment Code n’a pas de gros serveurs pour ses calculs, elle sous traite cette partie à Anthropic pour exploiter son IA Sonnet 4.5. C’est cette autre société qui héberge l’IA pour éviter les frais inhérents à ce genre d’investissement.

Et Augment Code propose un forfait de 250$ pour un mois d’accès à son IA. Ce forfait baptisé « 250$ Max » permet ensuite de poser toutes les questions ou de demander le traitement de n’importe quelle tâche à leur IA. Vous voyez le problème ? Augment Code propose d’un côté un service avec un prix fixe et attractif et de l’autre se fournit chez un autre prestataire qui va lui facturer les services à la tâche et non pas au forfait. La société indique devoir changer son « business model » parce que, par exemple, un de ses clients au forfait de 250$ a réussi l’exploit de poser 335 requêtes par heure, 24h/24 pendant 30 jours. Un total qui a fini par couter 15 000$ à Augment Code. Une perte sèche de 14 750$ sur le mois, exactement comme dans l’exemple de notre banquier à la chaise volante.
On imagine bien qu’aucun humain ne peut réussir à poser 355 questions par heure, soit près de 6 questions par minute, 24H/24 et 7J/7. Ce qu’a fait le client d’Augment Code est simplement d’optimiser au mieux son forfait. Il lui a probablement suffi de son côté de coder une solution pour collecter toutes les questions et demandes d’aide de ses propres codeurs. Solution logicielle qui va les stocker dans une pile de travail avant de les soumettre petit à petit à l’IA. Les résultats collectés étant ensuite renvoyés localement aux différents développeurs au fur et à mesure des réponses de l’IA. Simple et très efficace puisque, au lieu de prendre plusieurs abonnements à 250$, la boite peut épauler des dizaines de salariés avec un seul forfait.

Les Vases Communicants de Géraldine Py & Roberto Verde
Augment Code a donc décidé de changer son modèle. Oubliant les plans « All Inclusive » pour des solutions par « jetons » où on paiera en fonction de sa consommation. On achètera un nombre de jetons que l’on dépensera ensuite au fur et à mesure de son utilisation. Ainsi les 255 600 questions posées jour et nuit sur un simple abonnement à 250$ se transformeront en un tarif logiquement au-dessus des 15 000$ du simple coût de traitement facturé par la société qui exécute cette IA. Il faut en effet payer les salariés d’Augment Code et quelques autres détails de charge, de marketing et de dettes…
Reste à savoir si la société va conserver sa clientèle. Si énormément de sociétés de développement ont dû trouver absolument fantastique cette opportunité à 250$, ils ne seront peut-être plus aussi enchantés par le même service proposé beaucoup plus cher. Pour faire passer la pilule, Augment Code va proposer des crédits offerts de transition et explore des moyens de baisser ses coûts en changeant partiellement de fournisseurs avec GPT-5. Elle a également décidé de proposer un système d’évaluation de l’aide demandée. Une tâche simple ne coutera que quelques crédits quand un ordre plus complexe alourdira fortement la note. Cela ne va pas rendre le suivi des coûts de développement facile pour les prestataires qui se servent du service et qui vont devoir refléter à leur tour ces augmentations à leurs clients. Imaginez l’impact pour la société tierce, tout au bout de la chaine, à qui on dit que la facture s’alourdit.
Évidemment, il faudra un certain temps avant qu’Augment Code retrouve un équilibre financier avec ces changements. Éponger les dettes accumulées sera déjà une tâche difficile. Mais le plus drôle dans cette histoire n’est pas vraiment situé à cet étage. Le plus drôle, c’est que ce qui arrive à Augment Code n’est qu’une maquette, un modèle réduit de ce qu’il se passe à l’échelle supérieure. Anthropic et OpenAI sont tout à fait dans le même schéma. Mais à des échelles encore plus monstrueuses encore. Eux aussi ont investi des milliards et des milliards de dollars dans des serveurs pour se développer et pour le moment, les sociétés ne sont pas rentables et brûlent le cash de leurs investisseurs. À un moment, il va bien falloir inverser cette tendance.
On verra bien où tout cela nous mènera. Mais quand je croise cette idée avec celle d’une IA dédiée locale, déposée sur un petit serveur au sein même d’une boite de développement, je n’imagine plus une bulle, mais une vraie soirée mousse.
| 2,5€ par mois | 5€ par mois | 10€ par mois | Le montant de votre choix |






Ah, c’est comme le fameux « Forfait Millénium » de Bouygues Télécom sur le plan économique.
Bravo pour ce billet très lucide Pierre.
On voit en effet tout un tas de services exploitant l’IA revoir leur modèle d’affaire en profondeur… Fini les offres miracles proposant un tas de prestations pour rien ou presque rien.
C’est drôle ce matin, je regardai justement comment se faire un server domestique dédié à l’IA, pour m’aider a coder, simplement parce que si je n’est aucun mal a payer un abonnement pour un blog ou un média d’actualité (😉), cela me gène pour l’utilisation d’un logiciel propriétaire, IA ou autre, on devient dépendant et les prix exploseront forcément, comme pour la drogue 😅
Personne n’a envisagé que la société client qui envoie 355 requêtes à l’heure revendait elle-même le même service à des tiers, d’où sa prolixité ? Bon, on est d’accord, ça ne change rien au problème.
@IvanP.: Ah ah c’est vrai, un mec en solo qui crée juste une page et qui revend 50 licences a 150€ pour 250€ max à d’autres sociétés :D.
@IvanP.: Hahaha on se rapproche de plus en plus d’un buziness de traffic de stupéfiants en effet
« Après que vous vous soyez baissé pour éviter le fauteuil, pourtant vraiment très lourd, que votre banquier vient d’envoyer voler dans la pièce »
J’ai explosé de rire en lisant cette phrase :-D
« pour le moment, les sociétés ne sont pas rentables et brûlent le cash de leurs investisseurs. À un moment, il va bien falloir inverser cette tendance. »
Uber a brûlé des dizaines de milliards pendant 15 ans sans que les investisseurs y trouvent à redire. OpenAI et compagnie ont probablement des années devant eux avant que le temps ne tourne à l’orage
@mareek: Oui, mais Uber ce sont des petits joueurs. Ils n’ont levé « que » 13.2 milliards de $. https://tracxn.com/d/companies/uber/__wAOgbkstxol2NgmW5SFgVp8zBi7klH1GO5ziIlSERR4/funding-and-investors#funding-rounds
OpenAI c’est 57.9 milliards : https://tracxn.com/d/companies/openai/__kElhSG7uVGeFk1i71Co9-nwFtmtyMVT7f-YHMn4TFBg/funding-and-investors
Et ils veulent 1 trillion de $ sur 5 ans : https://www.ft.com/content/a169703c-c4df-46d6-a2d3-4184c74bbaf7
:D
De plus pour Uber les clients s’il devaient tomber ne feraient pas grand bruit, ils sont déjà au plus bas.
Si des grandes entreprises ont viré leurs employés pour les remplacer par des IA bancales, quand les fournisseurs de ces dernières demanderont à être payé au vrai tarif (comme dans le scenario de Pierre) alors tout l’édifice s’effondrera et ces entreprises devront embaucher de nouveau avec toute les dépenses inhérente que les actionnaires verront d’un mauvais œil.
Cette bulle pourrait être réellement catastrophique pour ceux qui se sont retrouvés trop dépendants.
Suffit de voir le chaos de AWS dernièrement, tous les œufs dans le même panier.
Le coup du client qui consomme trop de requêtes, il y a plusieurs explications possibles. En effet, le mec revend son accès à plusieurs personnes, ou bien il le partage avec tout son bureau. C’est tout à fait crédible, et bien des petits mains ont essayés, et doivent continuer.
Aussi, depuis que les IA génératives permettent une « réflexion profonde » (je déteste le terme « réflexion » car il ne traduit aucunement la réalité, mais passons), et depuis qu’elles s’intègrent avec des environnements de développement qu’elles peuvent en partie piloter (par ex lancer une compilation de code, ou lancer des tests), il est possible de consommer énormément de tokens (donc des crédit) en une seule requête.
D’ailleurs, les grands fournisseurs d’IA génératives mettent en garde leurs clients sur le sujet.
Pour donner une idée, j’ai pu consommer 1/3 des crédits mensuels de l’IA Junie de JetBrains (gros éditeur de logiciels de développement) en une seule requête. Je voulais prototyper une appli Android avec 3~4 écrans, rien de bien compliqué : un écran d’accueil pour se créer un compte (local donc très simple) ou s’identifier, un second écran qui te demande de saisir une date, un troisième qui affiche un calendrier avec le mois en cours calé sur la date saisie, et un quatrième écran pour exporter ton login, mot de passe et date saisie vers un fichier texte.
Tout ça en une seule requête, avec la réflexion profonde activée (sinon ça produit vraiment n’imp). J’étais sur l’abonnement « Pro » à 100€/an (je l’ai gratos, mais c’est une autre histoire). Ca a tourné pendant 3 heures, ça a fait plein d’allers-retours entre l’IA et mon environnement de dev, et j’ai vu mon crédit fondre petit à petit.
Je me suis retrouvé avec une app qui se lance, mais très boguée (ça plante pas, mais ça ne fait pas ce que j’avais demandé), et le code généré est extrêmement verbeux et dupliqué, et ne parlons pas de l’aspect sécurité.
Donc, ici, deux choses ont surconsommé du crédit : la réflexion profonde qui rend chaque requête coûteuse, et le fait que l’agent IA soit partiellement autonome, donc qu’il relance des requêtes par lui-même. Pour vous donner une idée : il fait un premier jet de code, il compile ou teste et voit que ça ne marche pas, il refait une requête qui examine ce qui s’est produit, et on reboucle comme ça pendant pas mal de temps (1h dans mon cas).
J’ai tenté le même scénario avec les grandes IA concurrentes, menant toutes au même constat. C’est mauvais, et le crédit fond comme neige au soleil.
Juste pour info, j’ai aussi voulu tester le « vibe-coding », et j’ai cramé 100% de mon crédit (l’offre Pro de JetBrains) en 4 après-midis. Tout ça pour produire du mauvais code, lequel a finit à la poubelle. Et pourtant je ne demandais pas la lune. Les offres gratos des concurrents n’ont pas tenu la journée.
Enfin bref, c’est bien parce que le crédit part vite, et donc qu’il ne faut pas grand chose pour bcp solliciter les fournisseurs d’IA, qu’ils ont introduit des systèmes de quotas. Sont pas fous, et ça limite la casse, quand bien même ils continuent de perdre de l’argent.
Alors voir un petit acteur, visiblement pas très malin, se dire qu’il pourrait faire du pognon en faisant sauter les quotas, ça m’a fait exploser de rire. Sûrement un Enzo ou Mathéo tatoué/percé, ancien recruteur IT du digital disruptif qui s’est imaginé être un génie.
On en voit tous les jours sur les sites dédiés aux freelances. On voit des boites, que j’imagine montées par des commerciaux sans aucune compétence techniques, demander des devis pour des solutions impossibles à mettre en œuvre. Du Google maps mais bcp moins cher, des IA magiques…
Donc voilà. Comme bcp, j’ai hâte de voir la bulle éclater. A vrai dire, je pense qu’il y a plusieurs bulles de l’IA. Une grosse bulle par grand acteur (comme OpenAI), et plein de petites bulles qui s’entassent dessus, comme les petits acteurs/profiteurs qu’on vient de voir.
Ces petits acteurs, ils ne cessent de naître puis d’éclater.
Ce qui m’interroge, c’est de voir ce qu’il va se passer quand une des grosses bulles va péter. Par ex si OpenAI n’a plus d’investisseurs (et ça finira par arriver), que se passera t-il ? Les clients et, globalement, l’opinion publique se détournera t-elle des IA génératives ? Un concurrent (Amazon, Alphabet, MS, Musk…) rachètera t-il les actifs d’OpenAI, ceci pour le voir lui-même péter plus tard parce que toujours pas rentable ? Ou bien autre chose. Bien malin est celui qui saura dire ce qui nous attend demain.
*edit: 1h, pas 3. (je l’ai retenté 3x1h) la fatigue. Une fonction de correction serait super cool ;-)
C’est le même principe qu’à pei près toutes les offres illimitées.
Ça fait des décennies que chaque opérateur télécom vend une bande passante qu’il n’a pas: si chaque abonné utilisait ne serait ce que 20% de la capacité de sa ligne au même moment, le réseau tomberait.
Bref, rien de bien inhabituel ; encore moins spécifique au domaine de l’IA. Ici la seule différence est que ce fournisseur en particulier ait totalement omis de mettre en place des gardes fous pour anticiper les usages ‘unfair’.
@nouknouk: A quelques différences près
-> Si les opérateurs ont leur réseau qui tombe, ben il tombe. La belle affaire. Il remonte ensuite, pas de soucis. Ils n’ont rien perdu, un petit SMS d’excuse plus tard ou une rallonge de Go offerts aux clients (qu’ils n’utiliseront jamais) et le tour est joué. En attendant, on se rend compte que dans 99% des cas le réseau « tient ». Et tout le monde est content puisque cela permet de bénéficier d’un meilleur tarif.
-> Dans notre cas, l’abus du service n’empêche rien. En fait, il n’y a même pas d’abus, juste des gens qui n’ont pas vu venir le problème. Résultat ben la boite est largement déficitaire.
= d’un côté l’offre mutualisée fonctionne, de l’autre, elle ne fonctionne pas.
-> La vente de services d’IA à cela en plus qu’elle permet un traitement déployé et distribuable. Si tu fais un service identique avec un conseil « humain », il est impossible de contourner ce simple garde-fou. L’humain qui répond et qui aide les codeurs va s’apercevoir que ce n’est pas la même personne qui le contacte. Il va aussi limiter par défaut l’impact des questions. Même si on lui envoie 255 600 questions par mois, nuit et jour et même le dimanche, il ne répondra pas a plus de quelques unes par jour. Parce qu’il est… humain. Par contre il pourra tirer la sonnette d’alarme en précisant à ses employeurs que la société XXXX accapare tout son temps et donc que ce n’est pas rentable de la faire payer que 250$ par mois.
Autant de détails que l’IA ne permet pas et qui offrent la possibilité d’en user et d’en abuser comme c’est le cas ici.
Enfin, l’infrastructure n’est pas la même. Si un opérateur a besoin de rajouter une antenne ou un système de traitement pour couvrir une zone dense, il peut le faire et ce sera en général rentabilisé d’une manière ou d’une autre. Pour un évènement comme les JO cela a été fait par exemple. Et même si ce n’est pas rentable, c’est un investissement publicitaire. Si ton voisin de stade est chez Marron avec du réseau et que toi tu es chez Bouing sans réseau, tu te dis que finalement, tu vas ptet changer.
Au sujet de l’IA les sommes colossales annoncées supposent un retour sur investissement compliqué. Comment éponger 1 trillion de dollars pour OpenAI ? Cela suppose des abonnements à combien ?
1 trillion c’est 1 million de millions de millions. Cela veut dire qu’il faut qu’un million d’entreprises louent les services d’OpenAI pendant 1 million de mois à 1 million de dollars chaque mois. (ou tout autre mélange de chiffres) pour que les investissement soient juste remboursés. Sans compter la maintenance, les salaires, la facture énergétique et tout le reste. C’est sans commune mesure avec un système d’opérateurs qui investissent de manière colossale, mais avec un retour sur investissement qui s’anticipe dans des temps vraiment beaucoup plus courts. Investissements qui ont également une vie plus longue.
Et tout cela avec le risque énorme de voir un nouvel acteur débarquer sans prévenir. Livrant un produit comme DeepSeek ou un industriel qui sortirait une nouvelle puce plus efficace, plus rapide et moins gourmande dans 6 mois ou un an. Si demain la chine voulait déstabiliser le PIB américain, elle pourrait. En proposant un DeepSeek-lite super efficace qui s’executerait sur une puce ARM pour un prix abordable. Si cela suffisait à la majorité des usages sur lesquels comptent les grandes boites qui investissent dans l’IA pour multiplier leur clientèle ? Qui choisirait de payer 1000$ par mois et qui choisirait de se payer la machine IA d’un seul coup pour avoir un truc local au même titre qu’un NAS ou une imprimante ?
Et si en 2026 un constructeur sort une puce 2x plus efficace, est-ce que les investissements des années précédentes seront rentabilisables ? Et si en 2028 on recommence ? L’aventure de cette start-up nous montre qu’il y a ici de petits dominos qui risquent de se casser la figure. Parce que ces si sont des risques réels dès aujourd’hui.
C’est l’actualité du jour 😀
https://www.latribune.fr/article/banques-finance/industrie-financiere/49255981113273/faible-rentabilite-valorisations-record-le-spectre-d-une-bulle-comme-en-2000-plane-sur-l-ia
JCCHAP
@Pierre Lecourt: Encore merci pour la pertinence de ton analyse Pierre… Cependant, 1 trillion c’est pas plutôt mille milliards ?? (ou 1 millier de milliers de millions). Note que ça changerait rien à ta démonstration, on est dans la folie la plus pure…
La bulle internet des années 2000.
Sacré souvenir de startup dans tous les sens, mais aussi de vieux routiers de la créations d’entreprises, qui créaient une multitude de sites web avec services, tous plus ou moins bidons, en espérant choper le jackpot via la revente avec énorme plus value à une grosse boite. Certains ont réussi (un truc comme le leneuf.xxx par exemple, avec le nom de domaine récupéré par une très grosse boite permettant au créateur du site de devenir rentier à tout juste 30 ans), d’autres ont failli à quelques semaines près (comics quelque chose, un site de news sur les BD, le rachat a capoté suite au démarrage de l’explosion de la bulle internet (*)), et d’autres qui ont failli boire le bouillon avec plusieurs millions d€ de pertes.
(*) j’avais livré un tas de matos Apple, avec financement inclus, et le liquidateur nous a proposé le matos en paiement de la facture, plutôt qu’au banquier … il me reste quelques pièces à la maison, dont un tapis de souris avec la coccinelle de Gotlib. Dommage, parce que même si c’était pour profiter de la bulle du web, c’était une vraie boite avec des journalistes, du contenu …
Concernant l’IA, je ne suis pas spécialement utilisateur, mais à chaque fois que j’essaie d’obtenir des infos plus pertinentes et poussées qu’avec un moteur de recherche, c’est pas mal, mais pas top non plus, parfois même assez léger quand à la réalité de ce qui est répondu. Heureusement, il est possible de demander les sources de la réponse.
Et sur certaines vidéos YT réalisées par IA, on est quand même plus proche d’un reportage de journal TV, que d’une réalisation fouillée telle qu’il est parfois possible d’en trouver sur une chaine comme Arte.
Pour le développement, je ne sais pas, je ne pratique plus depuis des dizaines d’années et n’a aucune envie de m’y remettre.
@Emmanuel: Pour le développement, je suis un ignare et je dois dire (et ça me fait mal de le dire) que cela m’a bien accompagné.
J’ai pu développé un plugins audio plutôt « chiadé », même si cela demande encore beaucoup de d’optimisation, j’ai eu le droit à pas mal de pédagogie tout le long du processus et un résultat vraiment pas mal à la vue des grosses difficultés de ce type de plugins.
l’IA peut-être aussi bénéfique que catastrophique, et connaissant l’habitude de l’humain de créer des trucs géniaux pour en faire de la merde, au final, y’a pas que la bulle qui va éclater…
@Pierre Lecourt: aux US, un trillion, c’est mille milliards*; pour nous c’est un million au cube, comme cité dans votre billet (voir )
pas que ça change grand chose au raisonnement, mais autant éviter de se faire (encore plus) enfumer par les US…
* c’est le montant attendu de la fortune d’Elon Musk, à moyen terme ()
L’économie anglo-saxonne et, plus particulièrement, américaine, ne fonctionne pas ainsi : on ne regarde pas derrière mais devant en mettant d’abord l’argent sur la table pour en être et en réfléchissant ensuite.
La perspective de rendements est plus attractive que la perspective de pertes.
La plupart des américains vivent à crédit en jonglant avec 5 cartes … de crédit justement.
Aucune grosse entreprise « IA » n’est, aujourd’hui, bénéficiaire et elles sont malgré tout valorisées des centaines de milliards (de dollars).
Si ça se casse la gueule les vautours dépèceront la bête : avoir misé 100 millions pour récupérer 200 c’est bien, non ?
Cette industrie, comme bien d’autres avant elle, surfe ainsi sur la vague du buzz. En permanence.
Avoir des centaines de millions dehors n’effraie personne … tant que la machine tourne.
Db