GPT-5.5 s'est mis à parler de gobelins et OpenAI a dû écrire quatre fois « ne parle jamais des gobelins » dans le code de son agent IA :
comment un signal de récompense mal calibré a contaminé plusieurs générations de modèles
Il y a des jours où l'on se demande si les chercheurs en IA ne devraient pas simplement écrire de la fantasy. GPT-5.5, le dernier-né d'OpenAI, a développé une passion non sollicitée pour les gobelins, les gremlins et les ratons laveurs. La solution de l'entreprise la mieux...
GPT-5.5 s’est mis à parler de gobelins et OpenAI a dû écrire quatre fois «ne parle jamais de gobelins» dans le code de son agent IA : un signal de récompense mal calibré a contaminé plusieurs générations de LLM
GPT-5.5 s'est mis à parler de gobelins et OpenAI a dû écrire quatre fois « ne parle jamais des gobelins » dans le code de son agent IA : comment un signal de récompense mal calibré a contaminé plusieurs générations de modèles Il y a des jours où l'o...