NISHIO Hirokazu[日本語][English]

日本語Tokenizerの違いは下流タスク性能に影響を与えるか?

#NLP2023 PDF 形態素解析をした方が性能が良くなる

  • なんとなくそうなんじゃないかと思っていたが確証はなかった
  • しっかり実験して検証している、ありがたい

関連

https://twitter.com/hpp_ricecake/status/1636951339459829761?s=46&t=gkSZtjGEtUZPO0JCzBxCBw


(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]