圧縮のために考えてます。一番出現率が高い文字を一文字にかえ最後に辞書データを作るつもりなので、4文字でも5文字でもいいのですが何が出てくるのかわからない時はどうすればいいのでしょうか