Skip to the content

Open IA

AI News

  • Microsoft IA
  • Google IA
  • NVIDIA IA
  • Openai IA
  • MIT IA
  • TLDR.TECH
  • ScienceDaily IA
  • SiècleDigital IA
  • Developpez.com
  • BonPrompt.com
  • Toute l’IA
  • A propos
  • Microsoft IA
  • Google IA
  • NVIDIA IA
  • Openai IA
  • MIT IA
  • TLDR.TECH
  • ScienceDaily IA
  • SiècleDigital IA
  • Developpez.com
  • BonPrompt.com
  • Toute l’IA
  • A propos
  • Search

Category

Research

  • Deep double descent

    10 Juin
  • Procgen Benchmark

    10 Juin
  • GPT-2: 1.5B release

    10 Juin
  • Solving Rubik’s Cube with a robot hand

    10 Juin
  • Emergent tool use from multi-agent interaction

    10 Juin
  • GPT-2: 6-month follow-up

    10 Juin
  • MuseNet

    10 Juin
  • Generative modeling with sparse transformers

    10 Juin
  • OpenAI Five defeats Dota 2 world champions

    10 Juin
  • Implicit generation and generalization methods for energy-based models

    10 Juin
  • Neural MMO: A massively multiagent game environment

    10 Juin
  • Better language models and their implications

    10 Juin
  • Computational limitations in robust classification and win-win results

    10 Juin
  • How AI training scales

    10 Juin
  • Quantifying generalization in reinforcement learning

    10 Juin
  • Spinning Up in Deep RL

    10 Juin
  • Learning concepts with energy functions

    10 Juin
  • Plan online, learn offline: Efficient learning and exploration via model-based control

    10 Juin
  • Reinforcement learning with prediction-based rewards

    10 Juin
  • FFJORD: Free-form continuous dynamics for scalable reversible generative models

    10 Juin
  • The International 2018: Results

    10 Juin
  • Large-scale study of curiosity-driven learning

    10 Juin
  • OpenAI Five Benchmark: Results

    10 Juin
  • Learning dexterity

    10 Juin
  • Variational option discovery algorithms

    10 Juin
  • Glow: Better reversible generative models

    10 Juin
  • Learning Montezuma’s Revenge from a single demonstration

    10 Juin
  • OpenAI Five

    10 Juin
  • Retro Contest: Results

    10 Juin
  • Learning policy representations in multiagent systems

    10 Juin
  • GamePad: A learning environment for theorem proving

    10 Juin
  • Gym Retro

    10 Juin
  • AI and compute

    10 Juin
  • Evolved Policy Gradients

    10 Juin
  • Gotta Learn Fast: A new benchmark for generalization in RL

    10 Juin
  • Retro Contest

    10 Juin
  • Variance reduction for policy gradient with action-dependent factorized baselines

    10 Juin
  • Improving GANs using optimal transport

    10 Juin
  • On first-order meta-learning algorithms

    10 Juin
  • Reptile: A scalable meta-learning algorithm

    10 Juin
  • Some considerations on learning to explore via meta-reinforcement learning

    10 Juin
  • Multi-Goal Reinforcement Learning: Challenging robotics environments and request for research

    10 Juin
  • Ingredients for robotics research

    10 Juin
  • Interpretable machine learning through teaching

    10 Juin
  • Discovering types for entity disambiguation

    10 Juin
  • Requests for Research 2.0

    10 Juin
  • Scaling Kubernetes to 2,500 nodes

    10 Juin
  • Block-sparse GPU kernels

    10 Juin
  • Learning sparse neural networks through L₀ regularization

    10 Juin
  • Interpretable and pedagogical examples

    10 Juin
  • Learning a hierarchy

    10 Juin
  • Generalizing from simulation

    10 Juin
  • Sim-to-real transfer of robotic control with dynamics randomization

    10 Juin
  • Asymmetric actor critic for image-based robot learning

    10 Juin
  • Domain randomization and generative models for robotic grasping

    10 Juin
  • Meta-learning for wrestling

    10 Juin
  • Competitive self-play

    10 Juin
  • Nonlinear computation in deep linear networks

    10 Juin
  • Learning to model other minds

    10 Juin
  • Learning with opponent-learning awareness

    10 Juin
  • OpenAI Baselines: ACKTR & A2C

    10 Juin
  • More on Dota 2

    10 Juin
  • Dota 2

    10 Juin
  • Gathering human feedback

    10 Juin
  • Better exploration with parameter noise

    10 Juin
  • Proximal Policy Optimization

    10 Juin
  • Robust adversarial inputs

    10 Juin
  • Hindsight Experience Replay

    10 Juin
  • Teacher–student curriculum learning

    10 Juin
  • Faster physics in Python

    10 Juin
  • Learning to cooperate, compete, and communicate

    10 Juin
  • UCB exploration via Q-ensembles

    10 Juin
  • OpenAI Baselines: DQN

    10 Juin
  • Robots that learn

    10 Juin
  • Roboschool

    10 Juin
  • Equivalence between policy gradients and soft Q-learning

    10 Juin
  • Stochastic Neural Networks for hierarchical reinforcement learning

    10 Juin
  • Unsupervised sentiment neuron

    10 Juin
  • Spam detection in the physical world

    10 Juin
  • Evolution strategies as a scalable alternative to reinforcement learning

    10 Juin
  • One-shot imitation learning

    10 Juin
  • Learning to communicate

    10 Juin
  • Emergence of grounded compositional language in multi-agent populations

    10 Juin
  • Prediction and control with temporal segment models

    10 Juin
  • Third-person imitation learning

    10 Juin
  • PixelCNN++: Improving the PixelCNN with discretized logistic mixture likelihood and other modifications

    10 Juin
  • Universe

    10 Juin
  • #Exploration: A study of count-based exploration for deep reinforcement learning

    10 Juin
  • On the quantitative analysis of decoder-based generative models

    10 Juin
  • A connection between generative adversarial networks, inverse reinforcement learning, and energy-based models

    10 Juin
  • RL²: Fast reinforcement learning via slow reinforcement learning

    10 Juin
  • Variational lossy autoencoder

    10 Juin
  • Extensions and limitations of the neural GPU

    10 Juin
  • Transfer from simulation to real world through learning deep inverse dynamics model

    10 Juin
  • Infrastructure for deep learning

    10 Juin
  • Generative models

    10 Juin
  • OpenAI Gym Beta

    10 Juin
  • Weight normalization: A simple reparameterization to accelerate training of deep neural networks

    10 Juin

Newer

© 2026 Open IA

Design Jean-Louis Maso

Gérer le consentement
Pour offrir les meilleures expériences, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils. Le fait de consentir à ces technologies nous permettra de traiter des données telles que le comportement de navigation ou les ID uniques sur ce site. Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Fonctionnel Toujours activé
L’accès ou le stockage technique est strictement nécessaire dans la finalité d’intérêt légitime de permettre l’utilisation d’un service spécifique explicitement demandé par l’abonné ou l’utilisateur, ou dans le seul but d’effectuer la transmission d’une communication sur un réseau de communications électroniques.
Préférences
L’accès ou le stockage technique est nécessaire dans la finalité d’intérêt légitime de stocker des préférences qui ne sont pas demandées par l’abonné ou l’internaute.
Statistiques
Le stockage ou l’accès technique qui est utilisé exclusivement à des fins statistiques. Le stockage ou l’accès technique qui est utilisé exclusivement dans des finalités statistiques anonymes. En l’absence d’une assignation à comparaître, d’une conformité volontaire de la part de votre fournisseur d’accès à internet ou d’enregistrements supplémentaires provenant d’une tierce partie, les informations stockées ou extraites à cette seule fin ne peuvent généralement pas être utilisées pour vous identifier.
Marketing
L’accès ou le stockage technique est nécessaire pour créer des profils d’internautes afin d’envoyer des publicités, ou pour suivre l’utilisateur sur un site web ou sur plusieurs sites web ayant des finalités marketing similaires.
  • Gérer les options
  • Gérer les services
  • Gérer {vendor_count} fournisseurs
  • En savoir plus sur ces finalités
Voir les préférences
  • {title}
  • {title}
  • {title}