Carnet web de Laurent Gloaguen

/ Mot du jour : tokenmaxxing

Selon des informations du Financial Times (à lire sur Ars Technica), les employés d’Amazon ont commencé à pratiquer le “tokenmaxxing” : une méthode qui consiste à gonfler délibérément les statistiques d’utilisation de l’IA pour satisfaire aux objectifs internes.

Cette triche découle d’une directive imposant aux développeurs d’utiliser des outils d’IA dans leur travail. Pour surveiller cette adoption, l’entreprise établit des classements internes basés sur le nombre de tokens (unités de données traitées par les modèles) consommés.

Pour grimper dans ces classements, les salariés utilisent MeshClaw, une plateforme agentique interne. Conçue pour automatiser des tâches répétitives (tri de courriels, gestion de Slack), certains s’en servent plutôt pour générer de l’activité superflue. Ils sont incités à privilégier le volume de tokens plutôt que la productivité réelle en raison d’une politique stupide. La pratique existerait aussi chez Meta (je ne vous vois pas surpris…).

Sur Reddit, des employés discutent des trucs pour détourner les outils sur des travaux inutiles.

Q: What’s the fastest way to burn Kiro credits? Need to bump my usage to stay off the report, what’s the fastest way to burn a lot of credits?

A: Use Kiro to write an app that uses Kiro to burn credits.

A: You know they can see your prompts as well, right? Why don’t you do something useful but very inefficient: download all my emails and slacks per day, then create a manual graph knowledge base.

A: There are a ton of agent orchestration tools available internally. Get one setup on your cloud desktop and give it a very ambitious project to lead. Have it write up detailed documents for the whole thing and scope out tasks with acceptance criteria. Then have your tool delegate to other agents to complete the work autonomously. That you’ll have to baby-sit it a bit but that will spend a lot of tokens quickly.

A: MeshClaw—set it up with a handful of jobs. Many examples on wiki. These can be incredibly helpful with integrations to email, slack, CRs, internal websites and stuff.

Outre l’aspect culture d’entreprise questionnable, des critiques soulignent que le “tokenmaxxing” crée une fausse impression de demande, risquant de tromper les investisseurs sur l’utilité réelle des milliards investis dans l’IA. Des inquiétudes liées à la sécurité sont également soulevées concernant les accès étendus de MeshClaw. Sans parler des impacts environnementaux…

Mesurer la productivité des développeurs n’est pas tâche facile, alors quand il y la moindre métrique de disponible, même idiote, les gestionnaires se précipitent dessus. Et ce n’est pas nouveau.

(Extrait de Triumph of the Nerds?, PBS, 1996.)

Steve Ballmer: In IBM there’s a religion in software that says you have to count K-LOCs, and a K-LOC is a thousand lines of code. How big a project is it? Oh, it’s sort of a 10K-LOC project. This is a 20K-LOCer. And this is 5OK-LOCs. And IBM wanted to sort of make it the religion about how we got paid. How much money we made off OS 2, how much they did. How many K-LOCs did you do? And we kept trying to convince them—hey, if we have—a developer’s got a good idea and he can get something done in 4K-LOCs instead of 20K-LOCs, should we make less money? Because he’s made something smaller and faster, less KLOC. K-LOCs, K-LOCs, that’s the methodology. Ugh, anyway, that always makes my back just crinkle up at the thought of the whole thing.

Nous vivons une époque formidable.

Discussion

/ stefd

Ce monde marche sur la tête. Ça fait 20 ans au moins que j’entends que quand un indicateur devient un objectif, c’est mort. Ça se confirme une fois encore.

Laisser un commentaire