Skip to the content

Open IA

AI News

  • Microsoft IA
  • Google IA
  • NVIDIA IA
  • Openai IA
  • MIT IA
  • TLDR.TECH
  • ScienceDaily IA
  • SiècleDigital IA
  • Developpez.com
  • BonPrompt.com
  • Toute l’IA
  • A propos
  • Microsoft IA
  • Google IA
  • NVIDIA IA
  • Openai IA
  • MIT IA
  • TLDR.TECH
  • ScienceDaily IA
  • SiècleDigital IA
  • Developpez.com
  • BonPrompt.com
  • Toute l’IA
  • A propos
  • Search

Category

Research

  • The International 2018: Results

    28 Fév
  • Large-scale study of curiosity-driven learning

    28 Fév
  • OpenAI Five Benchmark: Results

    28 Fév
  • Learning dexterity

    28 Fév
  • Variational option discovery algorithms

    28 Fév
  • Glow: Better reversible generative models

    28 Fév
  • Learning Montezuma’s Revenge from a single demonstration

    28 Fév
  • OpenAI Five

    28 Fév
  • Retro Contest: Results

    28 Fév
  • Learning policy representations in multiagent systems

    28 Fév
  • GamePad: A learning environment for theorem proving

    28 Fév
  • Gym Retro

    28 Fév
  • AI and compute

    28 Fév
  • Evolved Policy Gradients

    28 Fév
  • Gotta Learn Fast: A new benchmark for generalization in RL

    28 Fév
  • Retro Contest

    28 Fév
  • Variance reduction for policy gradient with action-dependent factorized baselines

    28 Fév
  • Improving GANs using optimal transport

    28 Fév
  • On first-order meta-learning algorithms

    28 Fév
  • Reptile: A scalable meta-learning algorithm

    28 Fév
  • Some considerations on learning to explore via meta-reinforcement learning

    28 Fév
  • Multi-Goal Reinforcement Learning: Challenging robotics environments and request for research

    28 Fév
  • Ingredients for robotics research

    28 Fév
  • Interpretable machine learning through teaching

    28 Fév
  • Interpretable machine learning through teaching

    28 Fév
  • Discovering types for entity disambiguation

    28 Fév
  • Requests for Research 2.0

    28 Fév
  • Scaling Kubernetes to 2,500 nodes

    28 Fév
  • Block-sparse GPU kernels

    28 Fév
  • Learning sparse neural networks through L₀ regularization

    28 Fév
  • Interpretable and pedagogical examples

    28 Fév
  • Learning a hierarchy

    28 Fév
  • Generalizing from simulation

    28 Fév
  • Sim-to-real transfer of robotic control with dynamics randomization

    28 Fév
  • Asymmetric actor critic for image-based robot learning

    28 Fév
  • Domain randomization and generative models for robotic grasping

    28 Fév
  • Meta-learning for wrestling

    28 Fév
  • Competitive self-play

    28 Fév
  • Nonlinear computation in deep linear networks

    28 Fév
  • Learning to model other minds

    28 Fév
  • Learning with opponent-learning awareness

    28 Fév
  • Learning with opponent-learning awareness

    28 Fév
  • OpenAI Baselines: ACKTR & A2C

    28 Fév
  • More on Dota 2

    28 Fév
  • Dota 2

    28 Fév
  • Gathering human feedback

    28 Fév
  • Better exploration with parameter noise

    28 Fév
  • Proximal Policy Optimization

    28 Fév
  • Robust adversarial inputs

    28 Fév
  • Hindsight Experience Replay

    28 Fév
  • Teacher–student curriculum learning

    28 Fév
  • Faster physics in Python

    28 Fév
  • Learning to cooperate, compete, and communicate

    28 Fév
  • UCB exploration via Q-ensembles

    28 Fév
  • OpenAI Baselines: DQN

    28 Fév
  • Robots that learn

    28 Fév
  • Roboschool

    28 Fév
  • Equivalence between policy gradients and soft Q-learning

    28 Fév
  • Stochastic Neural Networks for hierarchical reinforcement learning

    28 Fév
  • Stochastic Neural Networks for hierarchical reinforcement learning

    28 Fév
  • Unsupervised sentiment neuron

    28 Fév
  • Unsupervised sentiment neuron

    28 Fév
  • Spam detection in the physical world

    28 Fév
  • Spam detection in the physical world

    28 Fév
  • Evolution strategies as a scalable alternative to reinforcement learning

    28 Fév
  • One-shot imitation learning

    28 Fév
  • Learning to communicate

    28 Fév
  • Emergence of grounded compositional language in multi-agent populations

    28 Fév
  • Prediction and control with temporal segment models

    28 Fév
  • Third-person imitation learning

    28 Fév
  • PixelCNN++: Improving the PixelCNN with discretized logistic mixture likelihood and other modifications

    28 Fév
  • Universe

    28 Fév
  • #Exploration: A study of count-based exploration for deep reinforcement learning

    28 Fév
  • #Exploration: A study of count-based exploration for deep reinforcement learning

    28 Fév
  • On the quantitative analysis of decoder-based generative models

    28 Fév
  • A connection between generative adversarial networks, inverse reinforcement learning, and energy-based models

    28 Fév
  • RL²: Fast reinforcement learning via slow reinforcement learning

    28 Fév
  • Variational lossy autoencoder

    28 Fév
  • Extensions and limitations of the neural GPU

    28 Fév
  • Transfer from simulation to real world through learning deep inverse dynamics model

    28 Fév
  • Infrastructure for deep learning

    28 Fév
  • Generative models

    28 Fév
  • OpenAI Gym Beta

    28 Fév
  • Weight normalization: A simple reparameterization to accelerate training of deep neural networks

    28 Fév

Newer

© 2026 Open IA

Design Jean-Louis Maso

Gérer le consentement
Pour offrir les meilleures expériences, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils. Le fait de consentir à ces technologies nous permettra de traiter des données telles que le comportement de navigation ou les ID uniques sur ce site. Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Fonctionnel Toujours activé
L’accès ou le stockage technique est strictement nécessaire dans la finalité d’intérêt légitime de permettre l’utilisation d’un service spécifique explicitement demandé par l’abonné ou l’utilisateur, ou dans le seul but d’effectuer la transmission d’une communication sur un réseau de communications électroniques.
Préférences
L’accès ou le stockage technique est nécessaire dans la finalité d’intérêt légitime de stocker des préférences qui ne sont pas demandées par l’abonné ou l’internaute.
Statistiques
Le stockage ou l’accès technique qui est utilisé exclusivement à des fins statistiques. Le stockage ou l’accès technique qui est utilisé exclusivement dans des finalités statistiques anonymes. En l’absence d’une assignation à comparaître, d’une conformité volontaire de la part de votre fournisseur d’accès à internet ou d’enregistrements supplémentaires provenant d’une tierce partie, les informations stockées ou extraites à cette seule fin ne peuvent généralement pas être utilisées pour vous identifier.
Marketing
L’accès ou le stockage technique est nécessaire pour créer des profils d’internautes afin d’envoyer des publicités, ou pour suivre l’utilisateur sur un site web ou sur plusieurs sites web ayant des finalités marketing similaires.
  • Gérer les options
  • Gérer les services
  • Gérer {vendor_count} fournisseurs
  • En savoir plus sur ces finalités
Voir les préférences
  • {title}
  • {title}
  • {title}