Codigo catraca que explora o IFEval
O vies de bajulacao dos LLMs nao e um defeito, e um ativo. Ao combinar a capacidade de seguir instrucoes medida pelo IFEval com feedback deterministico, ate um modelo local de 4.5B produz um loop de convergencia que gera codigo correto.