結果 : byte pair encoding tokenization algorithm