De release van PPO, een nieuwe klasse van reinforcement learning-algoritmen die uitblinken in gesimuleerde robotica-taken: