Qu'est-ce que le « tokenmaxxing » et pourquoi cette tendance s'estompe-t-elle ?

Le « tokenmaxxing » vise à maximiser l'usage de l'IA sans souci du coût. Avec des entreprises comme Uber épuisant leur budget annuel en quelques mois, les coûts élevés ont forcé un passage de l'expansion aveugle à une évaluation prudente de la valeur réelle.

Pourquoi les entreprises peinent-elles à quantifier le retour sur investissement de l'IA ?

La plupart manquent de modèles reliant l'usage de l'IA aux KPI métier. Une gestion imprécise empêche de distinguer les usages à haute valeur du gaspillage, transformant l'IA en gouffre budgétaire et créant un dilemme majeur de quantification du ROI.

Quelles sont les tendances clés pour la stratégie IA future des entreprises ?

L'industrie entre dans une phase de précision, avec des comités de gouvernance IA et une allocation des coûts. Des modèles spécialisés plus petits remplaceront les modèles généraux pour réduire les coûts, ciblant uniquement les scénarios prouvant des gains d'efficacité.

Tiffany Luck de NEA : les entreprises en sont encore à mesurer le ROI de l'IA

Au début de cette année, le "tokenmaxxing" — la pratique consistant à pousser l'utilisation de l'IA au maximum sans se soucier du coût — était la tendance la plus en vogue à Silicon Valley. Les PDG encourageaient leurs employés à utiliser l'IA de manière aussi agressive que possible. Puis la facture est arrivée. Selon des informations rapportées, Uber aurait dépassé l'intégralité de son budget annuel dédié à l'IA en quelques mois seulement. Certaines entreprises ont commencé à réduire leurs licences Claude sur certains services, et les équipes d'achat réévaluent leurs dépenses IA. Tiffany Luck, associée chez NEA, souligne que si l'adoption d'outils d'IA continue d'augmenter, la plupart des entreprises peinent encore à mesurer le retour réel sur leurs investissements en IA, signe d'un passage de la fièvre du déploiement à une évaluation plus mesurée de la valeur.

Contexte

Au début de cette année, la scène technologique de Silicon Valley était dominée par une tendance à la fois humoristique et révélatrice : le « tokenmaxxing ». Ce terme désigne la pratique consistant à maximiser la consommation de jetons d'IA sans égard pour les coûts associés, poussée par la volonté d'extraire un maximum de valeur des modèles génératifs. À cette époque, les dirigeants de grandes entreprises technologiques encourageaient activement leurs employés à intégrer des outils d'intelligence artificielle dans leurs flux de travail de manière aussi agressive que possible. La logique sous-jacente était que le volume pur d'utilisation finirait par générer des dividendes technologiques, conduisant à une augmentation des taux d'adoption qui a dépassé les plans financiers initiaux.

Cependant, l'enthousiasme initial s'est rapidement refroidi à mesure que les réalités financières de l'intégration de l'IA devenaient de plus en plus claires. Des rapports médiatiques, tels que ceux de TechCrunch, soulignent un tournant significatif dans les dépenses d'IA des entreprises. Uber, le géant mondial du transport, aurait épuisé l'intégralité de son budget annuel dédié à l'IA en quelques mois seulement. Cet incident illustre de manière frappante la rapidité avec laquelle les coûts peuvent s'emballer lorsque l'utilisation n'est pas strictement surveillée ou plafonnée. Il est devenu le symbole du défi plus large de l'industrie, où l'hypothèse selon laquelle les coûts de l'IA resteraient gérables ou prévisibles s'est révélée fausse dans de nombreux cas d'utilisation à fort volume.

En réponse à ces coûts croissants, les entreprises commencent à mettre en œuvre des stratégies de contraction. Certaines organisations ont commencé à réduire les licences pour des modèles avancés comme Claude au sein de certaines unités commerciales, signalant un éloignement de l'accès universel vers une utilisation plus sélective. Les équipes d'achat ne signent plus simplement des contrats pluriannuels pour un calcul illimité ; elles réévaluent activement chaque dollar dépensé pour l'infrastructure d'IA. Ce changement marque une rupture avec la phase antérieure d'expérimentation sans restriction. L'industrie passe d'une période d'expansion agressive à une période de discipline fiscale, où l'accent se déplace de la quantité d'IA utilisée vers son efficacité d'utilisation.

Analyse approfondie

Le phénomène du « tokenmaxxing » peut être compris comme une forme d'anxiété défensive et d'essais et erreurs exploratoires face à l'incertitude technologique. Au début de l'essor de l'IA générative, de nombreuses entreprises souffraient d'une peur de manquer quelque chose (FOMO), craignant qu'une adoption incomplète de l'IA ne les place en position d'infériorité concurrentielle. Par conséquent, les équipes de gestion ont adopté une stratégie consistant à encourager une utilisation à haute fréquence dans toute l'organisation afin d'accumuler rapidement des données, d'affiner les flux de travail et de tester les limites de la technologie. Cette approche reposait sur la croyance que l'adoption généralisée était une condition préalable à l'innovation. Cependant, cette stratégie a négligé la structure complexe des coûts des grands modèles de langage, qui présente des effets d'échelle significatifs et des caractéristiques non linéaires. À mesure que le volume des demandes simultanées augmentait, les coûts d'inférence n'augmentaient pas de manière linéaire, mais souvent de façon exponentielle, en particulier lors du passage de tâches simples de type requête-réponse à des opérations plus complexes. L'explosion des coûts est particulièrement aiguë lorsque les entreprises passent d'applications de base à des tâches exigeantes telles que la génération de code, l'analyse de longs documents ou le raisonnement multi-étapes. Ces tâches complexes nécessitent considérablement plus de jetons par interaction, entraînant des niveaux de consommation bien supérieurs aux estimations initiales.

De plus, de nombreuses organisations manquaient de mécanismes de surveillance des coûts granulaires pendant la phase de déploiement. Sans la capacité de distinguer les interactions à haute valeur des utilisations inefficaces ou redondantes, les entreprises se sont retrouvées incapables de contrôler la perte. L'IA, initialement conçue comme un outil d'efficacité, s'est transformée en un trou noir drainant les budgets. Le manque de visibilité sur les prompts ou les flux de travail spécifiques générant de la valeur, par opposition à ceux qui consommaient simplement des ressources, a laissé les équipes financières et opérationnelles surprises par les factures finales. Tiffany Luck, associée chez NEA, souligne que le cœur du « dilemme de la quantification » actuel réside dans l'absence de modèles d'évaluation robustes. La plupart des entreprises n'ont pas encore établi de cadre reliant étroitement les données d'utilisation de l'IA aux indicateurs clés de performance (KPI) commerciaux, tels que les taux de soumission de code, les temps de résolution du service client ou l'efficacité de la production de contenu. Sans une définition claire du retour sur investissement (ROI), il est impossible pour les entreprises de déterminer quelles interactions IA génèrent une valeur commerciale réelle et lesquelles ne sont qu'un gaspillage de ressources. Ce manque de capacité de mesure est le principal obstacle à la rationalisation des dépenses d'IA. Jusqu'à ce que les organisations puissent corréler la consommation de jetons avec des améliorations tangibles de la production, elles continueront de lutter contre les dépassements de budget et une allocation ineffective du capital.

Impact sur l'industrie

Ce passage d'une adoption sans frein à une évaluation consciente des coûts a des implications profondes sur le paysage concurrentiel et les parties prenantes concernées. Pour les fournisseurs de services cloud et les vendeurs de grands modèles, le récit de la simple « croissance de l'utilisation » ne suffit plus à justifier des valorisations élevées. Le marché se concentre de plus en plus sur les capacités réelles de conversion commerciale des services d'IA. Les crises budgétaires rencontrées par des entreprises comme Uber envoient un signal clair au marché : l'intelligence artificielle n'est pas un bien public à coûts marginaux négligeables, mais une infrastructure commerciale nécessitant un contrôle strict des coûts. Cette pression force les fournisseurs d'IA à évoluer dans leurs modèles commerciaux.

Ils ne peuvent plus se fier uniquement à la vente de puissance de calcul ; ils doivent pivoter vers la vente de solutions offrant de meilleurs rapports qualité-prix, une efficacité d'inférence optimisée ou même des structures de tarification basées sur les résultats. Pour les petites et moyennes entreprises, cette tendance présente à la fois des défis significatifs et de nouvelles opportunités. D'une part, les petites entreprises peuvent faire face à des pressions de coûts unitaires plus élevées en raison de leur manque d'économies d'échelle par rapport aux géants technologiques. Elles peuvent avoir du mal à négocier des tarifs avantageux ou à absorber les pics de coûts imprévus. D'autre part, cet environnement crée une opportunité pour les organisations qui peuvent établir des cadres de gouvernance de l'IA sophistiqués dès le début. Les entreprises qui parviennent à identifier avec précision les scénarios d'application à fort retour sur investissement et à mettre en œuvre des contrôles de coûts stricts construiront des barrières d'efficacité significatives contre leurs concurrents. La capacité à utiliser l'IA de manière rentable, plutôt que simplement extensive, devient un différenciateur clé sur le marché. De plus, ce changement catalyse la croissance d'un nouveau segment de marché axé sur l'optimisation des coûts de l'IA, souvent appelé FinOps for AI. Une variété de nouveaux outils émergent pour aider les entreprises à gérer la consommation de jetons, à optimiser l'efficacité des prompts et à surveiller les comportements d'utilisation anormaux. Ces outils fournissent la visibilité et les mécanismes de contrôle nécessaires qui manquaient lors de l'explosion initiale. En offrant des informations granulaires sur la manière dont les ressources d'IA sont utilisées, ces plateformes permettent aux équipes financières et informatiques de faire respecter les budgets et d'identifier le gaspillage. L'essor de cet écosystème indique une maturation de l'industrie, où l'accent se déplace du simple déploiement vers une gestion durable.

Perspectives

À l'avenir, les stratégies d'IA des entreprises devraient entrer dans une phase de « culture minutieuse ». Nous prévoyons qu'un nombre croissant de sociétés établiront des comités dédiés à la gouvernance de l'IA, chargés de définir les politiques d'utilisation interne, les mécanismes de partage des coûts et les normes d'évaluation des performances. Cette institutionnalisation de la gestion de l'IA sera cruciale pour maintenir le contrôle des dépenses et garantir que les investissements s'alignent sur les objectifs commerciaux plus larges. L'ère de l'adoption ad hoc laisse place à une gouvernance structurée, où chaque initiative d'IA est soumise à un examen rigoureux de son rapport coût-avantage. Ce changement aidera les organisations à passer d'un état de gestion réactive du budget à une planification stratégique proactive.

D'un point de vue technologique, la tendance devrait favoriser les modèles plus petits et spécialisés par rapport aux grands modèles de langage à usage général dans des domaines verticaux spécifiques. Ces modèles de niche peuvent offrir des coûts inférieurs et une précision plus élevée pour des tâches ciblées, les rendant plus viables économiquement pour les opérations de routine. Les entreprises adopteront de plus en plus une approche hybride, utilisant de grands modèles pour le raisonnement complexe et des modèles plus petits et moins chers pour les tâches à fort volume et à faible complexité. Cette stratification de l'utilisation des modèles permettra aux entreprises d'optimiser leurs dépenses en jetons en associant la capacité du modèle à la complexité de la tâche. De plus, l'acquisition d'IA passera d'une stratégie de « déploiement global » à une approche de « frappe de précision ». Les entreprises seront plus disposées à payer pour des solutions d'IA qui peuvent démontrer directement des gains d'efficacité ou une croissance des revenus dans des cas d'utilisation spécifiques, plutôt que de payer pour un accès large et non mesuré. Un signal clé à surveiller est l'émergence d'organisations qui parviennent à intégrer les coûts de l'IA dans leurs indicateurs opérationnels réguliers. Celles qui réussiront la transition de la « phase d'exploration » à une « phase de rentabilité à grande échelle » domineront probablement le prochain tour de marché. Pour les investisseurs et les observateurs de l'industrie, l'accent doit passer des taux d'adoption aux avantages économiques réels générés par les investissements en IA. La course ne concerne plus celui qui peut utiliser le plus d'IA, mais celui qui peut l'utiliser de la manière la plus rentable. Ce sera une bataille prolongée de capacité de mise en œuvre technologique et de sagesse commerciale, où les vainqueurs seront ceux qui parviendront à équilibrer innovation et responsabilité fiscale. L'industrie mûrit, et l'époque des dépenses imprudentes est révolue ; l'ère des investissements mesurés et axés sur la valeur a commencé.

Sources

TechCrunch AI