vendredi, mars 13, 2026

How to save on your AI costs and divide them by 200 ?

There are so many LLMs available that many of you prefer using the most powerful model from the leader (OpenAI) without questioning whether it’s necessary. This is a very expensive mistake: using OpenAI’s O1 model when the Qwen 235B model would suffice can multiply your costs by 200! It’s a bit like using only Ferrari cars in your company fleet instead of adjusting the specs and cost to meet your needs.

The chart below compares today’s top LLMs (those with an intelligence index above 50% of the best one) in terms of both intelligence and costs. The green curve is the « best choice curve » – it is where you will always achieve the lowest cost for a given level of intelligence, while the red curve shows where the costs are highest. Of course the « intelligence index » can be challenged depending on the use case. But paying 200x the cost is not a great strategy.

Thanks to Gilles Babinet for the dataset and the comment regarding EU models (which are no more on the « best choice curve »).

#MLOPS

À propos

Dédié à l'analyse des questions économiques, sociales et environnementales de long terme, L'Observatoire du Long Terme se fixe pour objectif de donner davantage de visibilité à ces enjeux dans le débat public. Dans ce contexte, il donne la parole à des contributeurs variés, avec pour seul critère le caractère étayé des arguments présentés.

L'Observatoire est indépendant, ne reçoit aucune aide financière et repose sur le volontariat de ses contributeurs, de son bureau, présidé par Vincent Champain et Bruno Fuchs.

Sur le même sujet

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Du même auteur

Pouvoir d’achat, confort du logement, santé, services publics, retraite : la vérité du décrochage, la réalité des solutions pour l’inverser.

Difficulté à finir le mois, perte de pouvoir d'achat, logement, transports, santé, services publics, retraite ... - la France ne s'est bloquée d'un coup....

Le grand décrochage : débloquer la productivité pour sauver le modèle français.

Pourquoi et comment débloquer notre productivité pour sauver le modèle français. Le livre est disponible ici en téléchargement et peut être commandé au format...

Bientôt disponible : le Grand Décrochage

Pourquoi et comment débloquer note productivité pour sauver le français. Cet ouvrage analyse la productivité sous tous ses angles. Conçu pour être à la fois...

Le « SaaSpocalypse » : quand l’IA supprime les rentes plutôt que les emplois

Publié le 13 février dans Les Echos. À la fin des années 90, l’entreprise Salesforce lançait un slogan provocateur : la fin du logiciel. Grâce...