The Option-Critic Architecture, 2017端到端的学习内部策略和终止条件只需要指定 Option 的数量Policy over options:π Ω π_ΩπΩ​