« Échec imminent » : quand les grands modèles de langage (LLM) ont perdu le contrôle dans une simulation de gestion de distributeur automatique à long terme

« Échec imminent » : quand les grands modèles de langage (LLM) ont perdu le contrôle dans une simulation de gestion de distributeur automatique à long terme. Des chercheurs ont présenté Vending-Bench, un environnement simulé qui teste la capacité des m...

In AI, Developpez.com, IA, Intelligence Artificielle

« Échec imminent » : quand les grands modèles de langage (LLM) ont perdu le contrôle dans une simulation de gestion de distributeur automatique à long terme.

Des chercheurs ont présenté Vending-Bench, un environnement simulé qui teste la capacité des modèles d'IA à gérer un scénario commercial simple mais de longue durée : l'exploitation d'un distributeur automatique. Les résultats montrent que les performances varient considérablement d'un modèle à l'autre. Certains, comme Claude 3.5 Sonnet et...

#AI #IA #Intelligence artificielle

Le chatbot d’IA Grok d’Elon Musk a commencé à propager des propos négationnistes sur le changement climatique, ce qui menace de désinformer les utilisateurs et de saper des décennies de recherche

NVIDIA Blackwell Delivers Breakthrough Performance in Latest MLPerf Training Results

Related Posts

What’s the ROI? Getting the Most Out of LLM Inference

Un groupe bipartisan américain publie des recommandations en matière d’IA, pour maintenir la compétitivité des États-Unis tout en gérant les risques technologiques

When consumers would prefer a chatbot over a person

Les premiers utilisateurs de l’IA générative ont constaté un retour sur investissement important : 43 % ont déclaré que l’IA générative avait un impact significatif sur la productivité, selon Google Cloud