結果 : byte pair encoding tokenization python