結果 : deep q learning loss function