LLM

As Precondições para Aumentar a Precisão de Múltiplos Agentes de LLM

As Precondições para Aumentar a Precisão de Múltiplos Agentes de LLM

Rodar vários agentes torna o resultado mais preciso? Só metade está certa. Modelos treinados com os mesmos dados erram nos mesmos lugares. As condições para que múltiplos agentes funcionem são duas — projetar independência de erros, ou erguer um verifier fora do LLM em domínios verificáveis.

Codigo catraca que explora o IFEval

Codigo catraca que explora o IFEval

O vies de bajulacao dos LLMs nao e um defeito, e um ativo. Ao combinar a capacidade de seguir instrucoes medida pelo IFEval com feedback deterministico, ate um modelo local de 4.5B produz um loop de convergencia que gera codigo correto.

O viés de bajulação da IA é uma feature de negócio

O viés de bajulação da IA é uma feature de negócio

O viés de bajulação dos LLMs não é um bug. É uma inevitabilidade matemática do RLHF e uma feature comercial que as big tech não têm incentivo para corrigir. Por isso LLM-as-Judge é estruturalmente impossível.

Por que agentes de codificação funcionam — e por que quebram

Por que agentes de codificação funcionam — e por que quebram

O mesmo modelo alucina no chat web mas entrega uma funcionalidade de 200 linhas num agente de codificação. Não porque o modelo mudou — porque a topologia mudou. Geração pode ser probabilística. Verificação deve ser determinística.

Topologia de Feedback Importa Mais que o QI do Modelo

Topologia de Feedback Importa Mais que o QI do Modelo

O mesmo modelo para em 40 ou completa todos os 527. A diferença não é o modelo — é a estrutura de feedback. O desempenho do LLM depende muito mais de quão rápido e determinístico é o loop de feedback do que do modelo em si.

tsma -- Linha de defesa contra regressoes em codigo legado

tsma -- Linha de defesa contra regressoes em codigo legado

Uma ferramenta CLI que indexa todas as funcoes, detecta a existencia de testes, mede a cobertura e fornece feedback preciso a agentes LLM. Um unico comando constroi uma linha de defesa contra regressoes em codigo legado.

Restrições são contratos

Restrições são contratos

Sem promessas, há caos; promessas em excesso são opressão. Restrições racionais formam a proporção áurea. O princípio do estado de direito aplica-se igualmente ao código e ao conhecimento.

filefunc — um arquivo, um conceito

filefunc — um arquivo, um conceito

A unidade de navegação de um agente de código com IA é o arquivo. filefunc é uma convenção de estrutura de código Go e ferramenta CLI que força um conceito por arquivo.