結果 : gpt-5 codex vs claude code benchmark