@techreport{oai:ipsj.ixsq.nii.ac.jp:00218696,
 author = {高萩, 恭介 and 新納, 浩幸 and Kyosuke, Takahagi and Hiroyuki, Shinnou},
 issue = {6},
 month = {Jun},
 note = {教師あり学習に用いる Data Augmentation (DA) とは,ラベル付きデータに対して,ラベルを変えずにデータに何らかの変換を施し,変換後のデータを拡張データとして訓練データに追加する手法である.DA を適用するデータが文である場合,データ変換時に文の意味が変化してしまうと,拡張データがノイズとなる可能性がある.そのため,変換時に文の意味が変わらないようにする必要がある.本研究では,日本語の場合,係り受け関係が崩れていない限り,文節の順序を変更しても文の意味が変化しないことに着目し,文のデータ変換として文節の係り受け関係を考慮した文節のシャッフルを行う DA 手法を提案する.実験では livedoor ニュースコーパスを用いた文書分類タスクを設定し,提案手法の有効性を示した.また文節の係り受け関係を考慮せずに文節のシャッフルを行う場合との比較,訓練データのサイズと提案手法の効果との関係,及び対照学習への利用に関して考察した.},
 title = {日本語文の文節シャッフルによるData Augmentation},
 year = {2022}
}