結果 : value iteration algorithm python code