2022-01-01から1年間の記事一覧

辞書とルールで固有表現抽出器を作れるライブラリfunerを公開しました

概要 こんにちは@kajyuuenです。 辞書とルールによる固有表現抽出(Named Entity Recognition; NER)を実現するライブラリfunerを作りました。 github.com 辞書とルールによって抽出した固有表現をこんな感じで確認できます。 tokens 東京 出身 の 吉田 は 4…

日本語文書分類・固有表現抽出タスクに対するData Augmentationの性能検証

概要 こんにちは@kajyuuenです。 本記事では日本語データセットに対して、Data Augmentation(データ拡張)を行い、モデルの性能が向上するか検証します。 今回は文書分類と固有表現抽出の2つのタスクに対して、実験を行いました。 その結果、文書分類タスク…

日本語自然言語処理のData Augmentationライブラリdaajaを作りました

概要 こんにちは@kajyuuenです。 日本語自然言語処理のData Augmentationライブラリdaajaを作成しました。 この記事ではdaajaが実装しているData Augmentation手法についての解説とその使い方について紹介します。 ソースコードは以下のリポジトリで公開して…