Skip to the content

AI News

Microsoft IA
Google IA
NVIDIA IA
Openai IA
MIT IA
TLDR.TECH
ScienceDaily IA
SiècleDigital IA
Developpez.com
BonPrompt.com
Toute l’IA
A propos

Microsoft IA
Google IA
NVIDIA IA
Openai IA
MIT IA
TLDR.TECH
ScienceDaily IA
SiècleDigital IA
Developpez.com
BonPrompt.com
Toute l’IA
A propos
Search

Search for:

Search for:

Category

Research

The International 2018: Results
28 Fév
Large-scale study of curiosity-driven learning
28 Fév
OpenAI Five Benchmark: Results
28 Fév
Learning dexterity
28 Fév
Variational option discovery algorithms
28 Fév
Glow: Better reversible generative models
28 Fév
Learning Montezuma’s Revenge from a single demonstration
28 Fév
OpenAI Five
28 Fév
Retro Contest: Results
28 Fév
Learning policy representations in multiagent systems
28 Fév
GamePad: A learning environment for theorem proving
28 Fév
Gym Retro
28 Fév
AI and compute
28 Fév
Evolved Policy Gradients
28 Fév
Gotta Learn Fast: A new benchmark for generalization in RL
28 Fév
Retro Contest
28 Fév
Variance reduction for policy gradient with action-dependent factorized baselines
28 Fév
Improving GANs using optimal transport
28 Fév
On first-order meta-learning algorithms
28 Fév
Reptile: A scalable meta-learning algorithm
28 Fév
Some considerations on learning to explore via meta-reinforcement learning
28 Fév
Multi-Goal Reinforcement Learning: Challenging robotics environments and request for research
28 Fév
Ingredients for robotics research
28 Fév
Interpretable machine learning through teaching
28 Fév
Interpretable machine learning through teaching
28 Fév
Discovering types for entity disambiguation
28 Fév
Requests for Research 2.0
28 Fév
Scaling Kubernetes to 2,500 nodes
28 Fév
Block-sparse GPU kernels
28 Fév
Learning sparse neural networks through L₀ regularization
28 Fév
Interpretable and pedagogical examples
28 Fév
Learning a hierarchy
28 Fév
Generalizing from simulation
28 Fév
Sim-to-real transfer of robotic control with dynamics randomization
28 Fév
Asymmetric actor critic for image-based robot learning
28 Fév
Domain randomization and generative models for robotic grasping
28 Fév
Meta-learning for wrestling
28 Fév
Competitive self-play
28 Fév
Nonlinear computation in deep linear networks
28 Fév
Learning to model other minds
28 Fév
Learning with opponent-learning awareness
28 Fév
Learning with opponent-learning awareness
28 Fév
OpenAI Baselines: ACKTR & A2C
28 Fév
More on Dota 2
28 Fév
Dota 2
28 Fév
Gathering human feedback
28 Fév
Better exploration with parameter noise
28 Fév
Proximal Policy Optimization
28 Fév
Robust adversarial inputs
28 Fév
Hindsight Experience Replay
28 Fév
Teacher–student curriculum learning
28 Fév
Faster physics in Python
28 Fév
Learning to cooperate, compete, and communicate
28 Fév
UCB exploration via Q-ensembles
28 Fév
OpenAI Baselines: DQN
28 Fév
Robots that learn
28 Fév
Roboschool
28 Fév
Equivalence between policy gradients and soft Q-learning
28 Fév
Stochastic Neural Networks for hierarchical reinforcement learning
28 Fév
Stochastic Neural Networks for hierarchical reinforcement learning
28 Fév
Unsupervised sentiment neuron
28 Fév
Unsupervised sentiment neuron
28 Fév
Spam detection in the physical world
28 Fév
Spam detection in the physical world
28 Fév
Evolution strategies as a scalable alternative to reinforcement learning
28 Fév
One-shot imitation learning
28 Fév
Learning to communicate
28 Fév
Emergence of grounded compositional language in multi-agent populations
28 Fév
Prediction and control with temporal segment models
28 Fév
Third-person imitation learning
28 Fév
PixelCNN++: Improving the PixelCNN with discretized logistic mixture likelihood and other modifications
28 Fév
Universe
28 Fév
#Exploration: A study of count-based exploration for deep reinforcement learning
28 Fév
#Exploration: A study of count-based exploration for deep reinforcement learning
28 Fév
On the quantitative analysis of decoder-based generative models
28 Fév
A connection between generative adversarial networks, inverse reinforcement learning, and energy-based models
28 Fév
RL²: Fast reinforcement learning via slow reinforcement learning
28 Fév
Variational lossy autoencoder
28 Fév
Extensions and limitations of the neural GPU
28 Fév
Transfer from simulation to real world through learning deep inverse dynamics model
28 Fév
Infrastructure for deep learning
28 Fév
Generative models
28 Fév
OpenAI Gym Beta
28 Fév
Weight normalization: A simple reparameterization to accelerate training of deep neural networks
28 Fév

Newer

© 2026 Open IA

Design Jean-Louis Maso

Gérer le consentement

Pour offrir les meilleures expériences, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils. Le fait de consentir à ces technologies nous permettra de traiter des données telles que le comportement de navigation ou les ID uniques sur ce site. Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.

Fonctionnel Fonctionnel Toujours activé

L’accès ou le stockage technique est strictement nécessaire dans la finalité d’intérêt légitime de permettre l’utilisation d’un service spécifique explicitement demandé par l’abonné ou l’utilisateur, ou dans le seul but d’effectuer la transmission d’une communication sur un réseau de communications électroniques.

Préférences Préférences

L’accès ou le stockage technique est nécessaire dans la finalité d’intérêt légitime de stocker des préférences qui ne sont pas demandées par l’abonné ou l’internaute.

Statistiques Statistiques

Le stockage ou l’accès technique qui est utilisé exclusivement à des fins statistiques. Le stockage ou l’accès technique qui est utilisé exclusivement dans des finalités statistiques anonymes. En l’absence d’une assignation à comparaître, d’une conformité volontaire de la part de votre fournisseur d’accès à internet ou d’enregistrements supplémentaires provenant d’une tierce partie, les informations stockées ou extraites à cette seule fin ne peuvent généralement pas être utilisées pour vous identifier.

Marketing Marketing

L’accès ou le stockage technique est nécessaire pour créer des profils d’internautes afin d’envoyer des publicités, ou pour suivre l’utilisateur sur un site web ou sur plusieurs sites web ayant des finalités marketing similaires.

Gérer les options
Gérer les services
Gérer {vendor_count} fournisseurs
En savoir plus sur ces finalités

Voir les préférences

{title}
{title}
{title}