L’Innovation du Test-Time Scaling dans les Modèles de Langage
Les chercheurs de Stanford ont développé une approche innovante de test-time scaling pour les modèles de langage, démontrant des performances exceptionnelles avec seulement 1000 échantillons d’entraînement et une technique de “budget forcing” pour optimiser la réflexion.