Editorial · agents tools

Un mauvais vocabulaire te coûte deux contrats agents au lieu d'un

Comment « harness », « scaffold » et « runtime » signifient des choses différentes selon les vendeurs — et pourquoi cette ambiguïté atterrit dans ton budget.

May 27, 2026· 6 min read· Domani AI

Un nouveau glossaire Hugging Face sur la terminologie des agents IA est sorti discrètement la semaine dernière. Il est plus utile comme filtre d'achat que comme tutoriel. Si ton équipe ne s'accorde pas sur la couche qu'un vendeur propose réellement, tu vas acheter de l'infrastructure en double — et c'est probablement déjà le cas. C'est dans l'écart de vocabulaire entre « harness », « scaffold » et « runtime » que se cachent les dépenses redondantes.

Comment l'industrie redéfinit l'infrastructure des agents

Le glossaire des agents Hugging Face trace des distinctions nettes entre des termes que l'industrie utilisait jusqu'ici de façon interchangeable. Un harness est une enveloppe de test et d'évaluation — il fait tourner ton agent sur des scénarios et mesure son comportement. Un scaffold est la couche structurelle qui séquence les étapes de l'agent, gère les appels d'outils et contrôle le flux d'exécution. Un runtime est l'environnement d'exécution : gestion de la mémoire, concurrence, persistance de l'état. Ce sont trois problèmes distincts, trois catégories de vendeurs distinctes, et trois décisions build-vs-buy distinctes.

La confusion n'est pas accidentelle. La plupart des vendeurs qui proposent des « plateformes agents » regroupent deux ou trois de ces couches sans les nommer séparément. Un vendeur qui présente une « plateforme d'orchestration d'agents » te vend peut-être un scaffold, un runtime, ou les deux — et son deck commercial ne fera pas la distinction de lui-même. La même amalgame apparaît dans les projets open source : des frameworks comme LangGraph, AutoGen et CrewAI mettent chacun l'accent sur des couches différentes, ce qui explique pourquoi les équipes qui en adoptent deux découvrent un chevauchement important seulement une fois l'intégration lancée.

Le glossaire clarifie aussi deux termes adjacents : le tool use (le mécanisme par lequel un agent appelle des APIs ou des fonctions externes) et la agent memory (contexte court terme versus récupération long terme). Ce sont des capacités, pas des couches — elles vivent dans le scaffold ou le runtime selon l'implémentation. Les traiter comme des couches conduit à une troisième catégorie d'achats redondants : acquérir une « solution mémoire » auprès d'un vendeur alors que ton scaffold en embarque déjà une.

Pourquoi cela change le calcul sur la possession d'agents pour une équipe de 50 à 500 ETP

À ta taille d'entreprise, tu ne construis pas tout from scratch et tu n'achètes pas une suite enterprise monolithique. Tu assembles. La ligne build-vs-buy n'est pas une seule décision — c'est trois décisions prises à trois couches différentes, avec des profils de risque différents.

La couche harness est presque toujours une décision d'achat ou d'open source. Les frameworks d'évaluation sont de l'infrastructure banalisée ; construire le sien est rarement justifié, sauf si ton domaine impose des contraintes de conformité que les outils standard ne peuvent pas satisfaire. La couche runtime est à enjeux élevés : les défaillances de gestion d'état, de persistance et de concurrence apparaissent en production, pas en démo. C'est là que la plupart des équipes sous-estiment le coût de construction. Le scaffold, en revanche, c'est là que vit ta logique métier — le séquençage des étapes qui reflète comment ton processus fonctionne réellement. Cette logique vaut souvent la peine d'être maîtrisée, même quand le runtime qui la supporte ne l'est pas.

La conséquence pratique : quand un vendeur propose de « gérer ton infrastructure agents », la bonne question n'est pas « combien ça coûte » mais « lesquelles des trois couches cela couvre-t-il, et que dit le contrat sur les autres ? » Les équipes qui sautent cette question achètent un scaffold au vendeur A, découvrent qu'elles ont encore besoin d'un runtime, l'achètent au vendeur B, et constatent six mois plus tard que le scaffold du vendeur A embarque un runtime qui entre désormais en conflit. Nous avons vu ce scénario se répéter sur plusieurs missions clients. Le vocabulaire, c'est la diligence raisonnable.

Parler à Domani AI pour construire ça →

Ce qu'un CTO fait cette semaine pour arrêter d'acheter de l'infrastructure deux fois

Lance un audit interne de 90 minutes avant ton prochain appel vendeur. L'objectif : une page de cartographie des couches. Qu'est-ce que tu possèdes ou opères actuellement au niveau harness, scaffold et runtime ? La plupart des équipes découvrent qu'elles ont une couverture partielle sur deux couches et rien sur la troisième. C'est ce manque que ton prochain appel vendeur doit adresser — précisément et uniquement ce manque.

Ensuite, applique cet arbre de décision à chaque proposition vendeur dans ton pipeline :

Le vendeur indique-t-il clairement quelle(s) couche(s) son produit couvre ? Si non, exige-le par écrit avant le prochain appel.
As-tu déjà une couverture partielle sur une couche qu'il vend ? Si oui, demande un contrat délimité qui exclut ce que tu possèdes déjà.
Le scaffold du vendeur est-il prescriptif sur le runtime ? Si oui, c'est un risque de lock-in. Obtiens les conditions de découplage dans le contrat ou intègre le coût de migration dans ton calcul.
Ta logique métier centrale est-elle embarquée dans le scaffold ? Si oui, maîtrise cette couche. Contracte le harness et le runtime.
C'est avant tout un besoin de test et d'évaluation ? Alors tu as besoin d'un harness, pas d'une plateforme — et tu peux probablement le satisfaire avec un outil open source en moins de 2 semaines.

Si tu es en pleine évaluation avec un vendeur d'agents et que tu n'as pas encore cartographié son produit sur ces trois couches, mets la conversation commerciale en pause et fais la cartographie d'abord. Une heure d'alignement interne évite 6 mois de re-architecture.

Ce que ça coûte — et ce que ça économise

L'exercice de cartographie coûte environ 4 heures du temps d'un ingénieur senior et 90 minutes du tien. Si tu fais appel à un auditeur externe en architecture, compte une demi-journée de temps facturable. C'est le coût total si tu le fais avant de signer. Si tu le fais après, le coût, c'est le contrat en double, le travail d'intégration pour réconcilier deux runtimes, et le temps d'ingénierie perdu dans une migration que tu aurais pu éviter — typiquement 3 à 8 semaines de capacité d'une petite équipe, d'après ce que nous observons dans nos missions post-mortem.

L'économie ne se limite pas à l'argent. C'est de l'optionalité. Les équipes qui maîtrisent leur couche scaffold et contractent tout le reste conservent la capacité de changer de vendeur de runtime quand les prix évoluent ou qu'une meilleure option émerge. Les équipes qui achètent une plateforme groupée sans comprendre les couches tendent à découvrir qu'elles ne possèdent rien de séparable — et renégocient depuis une position faible. Sur un marché où les prix de l'infrastructure agents restent volatils et où la consolidation des vendeurs est en cours, cette optionalité a une valeur qui se cumule.

Parler à Domani AI pour construire ça →

Source: https://huggingface.co/blog/agent-glossary

Vous avez un projet similaire en tête ? → Démarrons la conversation

Start the conversation →

← Back to Insights