LLM

Les conditions préalables à l'amélioration de la précision des LLM multi-agents

Les conditions préalables à l'amélioration de la précision des LLM multi-agents

Lancer plusieurs agents rend-il plus précis ? À moitié vrai. Des modèles entraînés sur les mêmes données se trompent aux mêmes endroits. Le multi-agent ne fonctionne qu'à deux conditions : concevoir l'indépendance des erreurs, ou, dans un domaine vérifiable, dresser un verifier en dehors du LLM.

Le code a cliquet qui retourne IFEval a son avantage

Le code a cliquet qui retourne IFEval a son avantage

Le biais de flagornerie des LLM n'est pas un defaut mais un atout. En combinant la capacite de suivi d'instructions mesuree par IFEval avec un retour deterministe, meme un modele local de 4.5B produit une boucle de convergence generant du code correct.

Le biais de flagornerie de l'IA est une feature commerciale

Le biais de flagornerie de l'IA est une feature commerciale

Le biais de flagornerie des LLM n'est pas un bug. C'est une inévitabilité mathématique du RLHF et une fonctionnalité commerciale que les big tech n'ont aucun intérêt à corriger. Voici pourquoi LLM-as-Judge est structurellement impossible.

Pourquoi les agents de code fonctionnent et pourquoi ils s'effondrent

Pourquoi les agents de code fonctionnent et pourquoi ils s'effondrent

Le même modèle hallucine dans le chat web mais livre une fonctionnalité de 200 lignes dans un agent de code. Pas parce que le modèle a changé — parce que la topologie a changé. La génération peut être probabiliste. La vérification doit être déterministe.

La topologie du feedback prime sur le QI du modèle

La topologie du feedback prime sur le QI du modèle

Le même modèle s'arrête à 40 ou complète les 527. La différence n'est pas le modèle — c'est la structure de feedback. La performance du LLM dépend bien plus de la rapidité et du déterminisme de la boucle de feedback que du modèle lui-même.

tsma -- La ligne de defense contre les regressions du code legacy

tsma -- La ligne de defense contre les regressions du code legacy

Un outil CLI qui indexe toutes les fonctions, detecte la presence de tests, mesure le coverage et fournit un feedback precis a l'agent LLM. Une seule commande pour construire une ligne de defense contre les regressions dans le code legacy.

Les contraintes sont des contrats

Les contraintes sont des contrats

Sans promesse, c'est le chaos ; trop de promesses, c'est l'oppression. La contrainte raisonnée trouve le ratio idéal. Le principe de l'état de droit s'applique de façon identique au code et à la connaissance.

filefunc — un fichier, un concept

filefunc — un fichier, un concept

L'unité de navigation d'un agent de code IA, c'est le fichier. filefunc est une convention de structure et un outil CLI qui impose un seul concept par fichier dans les projets Go.