結果 : python simple reinforcement learning