結果 : optimal state action value function