ヤドカリラボ

ヤドカリのラボです

英文法律関連テキストを対象とした文境界推定の論文を読む

はじめに 法律ドメインに特化した自然言語処理は、ビジネス上重要な位置を占めるにもかかわらず、金融や医療等の他の分野と比べいままであまり重きをおかれることがなかった分野でした。 法律関連のタスクに電子機器が使われる機会は徐々に高まっており、自…

ブートストラッピング法による情報抽出の論文まとめ

はじめに 自然言語処理におけるタスクの一つとして、構造化されていないテキストから情報や知識を自動または半自動で取り出すことを情報抽出といいます。 最近では深層学習系の論文が国際学会ではメジャーですが、訓練・ベンチマークに用いているデータセッ…

正規表現を用いる際のパフォーマンスチェックリスト

Python で正規表現を書いて分析や機械学習のモデル構築、予測に活用する際には、正規表現実行時のパフォーマンスが足かせとなる場合があります。 正規表現の処理に用いられる実行時間がどのくらいになるかはテキストデータの分量や機械学習モデルの精度検証…