RL²: Fast reinforcement learning via slow reinforcement learning

In Openai IA, Research

Variational lossy autoencoder

A connection between generative adversarial networks, inverse reinforcement learning, and energy-based models