Deterministic Verification

Codigo Ratchet que Explora o IFEval

Codigo Ratchet que Explora o IFEval

O vies de bajulacao dos LLMs nao e um bug, e um ativo. Ao combinar a capacidade de seguir instrucoes medida pelo IFEval com feedback deterministico, ate um modelo local de 4.5B gera codigo preciso em um loop convergente.