>BERT の multilingual モデルは日本語の扱いには適さないので SentencePiece を使う
> pre-training にはクックパッドの調理手順のテキスト(約1600万文)を使用
> 学習は p3.2xlarge インスタンスで 3.5 日程度学習