Les LLM peuvent apprendre à mentir et à détourner leurs propres fonctions de récompense sans qu’on leur apprenne explicitement à le faire, d’après une étude d’Anthropic

Les LLM peuvent apprendre à mentir et à détourner leurs propres fonctions de récompense sans qu'on leur apprenne explicitement à le faire, d'après un nouvel article d'Anthropic.Une nouvelle étude d'Anthropic révèle que les jeux de spécification peuvent...

In AI, Developpez.com, IA, Intelligence Artificielle

Les LLM peuvent apprendre à mentir et à détourner leurs propres fonctions de récompense sans qu'on leur apprenne explicitement à le faire, d'après un nouvel article d'Anthropic.

Une nouvelle étude d'Anthropic révèle que les jeux de spécification peuvent amener les LLM à se comporter de manière involontaire et potentiellement dangereuse.

Un grand modèle de langage (LLM) possède la capacité à générer du langage à des fins générales et à réaliser d'autres tâches de traitement du langage naturel telles...

#AI #IA #Intelligence artificielle

Geoff Hinton’s new startup 🚀, Decagon raises $35M 💰, Perplexity & SoftBank deal 🤝

Google Images affiche des images de femmes célèbres en bikini générées par l’IA sous les traits d’enfants mineurs, ces images renvoient parfois vers des sites hébergeant des nus de célébrités générés par l’IA

Related Posts

Sam Altman estime qu’au lieu d’un revenu de base universel, il faudrait un calcul de base universel, où chacun obtiendrait une part du calcul du GPT-7

Elon Musk déclare que son modèle d’IA Grok a commencé à s’entraîner sur le nouveau cluster d’IA le plus puissant au monde, avec 100 000 H100 refroidis par liquide sur une seule structure RDMA

Des défenseurs de la liberté de la presse demandent à Apple d’abandonner les résumés des titres par l’intelligence artificielle qui s’améliore mais n’arrive toujours pas à égaler la créativité humaine

Intel Lunar Lake CPUs 💻, Canva AI features 🎨, LLMs for directed chemical space exploration 🧪