LLM

Las precondiciones para mejorar la precisión de los multiagentes LLM
¿Más agentes significa más precisión? Solo la mitad es cierto. Los modelos entrenados con los mismos datos se equivocan en los mismos lugares. Los multiagentes funcionan bajo dos condiciones: diseñar la independencia de errores, o levantar un verifier fuera del LLM en un dominio verificable.

Código trinquete que aprovecha IFEval
El sesgo de adulación de los LLM no es un defecto, es un activo. Al combinar la capacidad de seguir instrucciones que mide IFEval con retroalimentación determinista, incluso un modelo local de 4.5B genera un bucle de convergencia que produce código correcto.

El sesgo de adulación de la IA es una funcionalidad comercial
El sesgo de adulación de los LLM no es un bug. Es una inevitabilidad matemática del RLHF y una funcionalidad comercial que las big tech no tienen incentivo para corregir. Por esto LLM-as-Judge es estructuralmente imposible.

Por qué los agentes de código funcionan y por qué colapsan
El mismo modelo alucina en el chat web pero entrega una función de 200 líneas en un agente de código. No porque el modelo cambió — porque la topología cambió. La generación puede ser probabilística. La verificación debe ser determinista.

La topología del feedback importa más que el IQ del modelo
El mismo modelo se detiene en 40 o completa los 527. La diferencia no es el modelo, sino la estructura de retroalimentación. El rendimiento del LLM depende mucho más de lo rápido y determinista que sea el bucle de retroalimentación que del modelo en sí.

tsma -- Linea de defensa contra regresiones en codigo legado
Una herramienta CLI que indexa todas las funciones, detecta la existencia de pruebas, mide la cobertura y proporciona retroalimentacion precisa a agentes LLM. Un solo comando construye una linea de defensa contra regresiones en codigo legado.

Las restricciones son contratos
Sin promesas hay caos; con demasiadas promesas hay opresión. Las restricciones razonables forman la proporción áurea. El principio del estado de derecho se aplica igual al código y al conocimiento.

filefunc — Un archivo, un concepto
La unidad de navegacion de un agente de codigo IA es el archivo. filefunc es una convencion de estructura de codigo Go y herramienta CLI que impone un concepto por archivo.