Vies De Bajulacao

Codigo catraca que explora o IFEval

Codigo catraca que explora o IFEval

O vies de bajulacao dos LLMs nao e um defeito, e um ativo. Ao combinar a capacidade de seguir instrucoes medida pelo IFEval com feedback deterministico, ate um modelo local de 4.5B produz um loop de convergencia que gera codigo correto.