Le nouveau jailbreak des LLM exploite leurs capacités d’évaluation pour les contourner, les chercheurs de Palo Alto exploitent l’échelle de Likert pour contourner les LLM

Le nouveau jailbreak des LLM exploite leurs capacités d'évaluation pour les contourner, les chercheurs de Palo Alto exploitent l'échelle de Likert pour contourner les LLMLe phénomène des jailbreaks des grands modèles de langage (LLM) illustre les défi...

Le nouveau jailbreak des LLM exploite leurs capacités d'évaluation pour les contourner,
les chercheurs de Palo Alto exploitent l'échelle de Likert pour contourner les LLM

Le phénomène des jailbreaks des grands modèles de langage (LLM) illustre les défis croissants liés à la gestion des systèmes d'intelligence artificielle, en particulier lorsqu'ils sont confrontés à des tentatives d'exploitation. L'une des méthodes récentes, baptisée « Bad Likert Judge », a mis en lumière une approche sophistiquée...