WEKO3
アイテム
BERTと新聞記事コーパスによる過去のジェンダー規範定量の試み
https://ipsj.ixsq.nii.ac.jp/records/2001895
https://ipsj.ixsq.nii.ac.jp/records/200189570537647-61f4-4be1-a0b4-1a22c23f92a5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2027年5月10日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, CH:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2025-05-10 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | BERTと新聞記事コーパスによる過去のジェンダー規範定量の試み | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Towards Quantifying Historical Gender Norms Using BERT and a Newspaper Corpus | |||||||||
言語 | ||||||||||
言語 | eng | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
Department of Biological Sciences, Graduate School of Science, The University of Tokyo | ||||||||||
著者所属 | ||||||||||
Department of Biological Sciences, Graduate School of Science, The University of Tokyo | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Department of Biological Sciences, Graduate School of Science, The University of Tokyo | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Department of Biological Sciences, Graduate School of Science, The University of Tokyo | ||||||||||
著者名 |
三好,玲人
× 三好,玲人
× 井原,泰雄
|
|||||||||
著者名(英) |
Akito Miyoshi
× Akito Miyoshi
× Yasuo Ihara
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 世論調査等のデータは社会規範の時代変化を分析する上で有用である.しかし,存在するデータは古くても数十年前までのものが多く,また調査された項目の数にも限りがある.一方で自然言語処理の領域では,単語埋め込みや言語モデルが,訓練に用いたコーパスに含まれる社会的バイアスを学習してしまうことが指摘されている.本研究では米国の過去の新聞記事を集めたコーパスを用いてBERTの学習を行い,コーパスに含まれる当時の社会規範,特にジェンダー規範を定量することを目的とする.BERTを用いることで単なるステレオタイプにとどまらない規範を捉えられるのではないかと期待する.これにより,世論調査データの存在しない年代のジェンダー規範や調査対象外の様々なジェンダー規範の通時的挙動の解明を可能にすることを目指す. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Public opinion survey data are useful for analyzing temporal changes in social norms. However, existing data typically cover only the past few decades and include a limited number of survey items. Meanwhile, in the field of natural language processing, it has been pointed out that word embeddings and language models tend to learn the social biases present in the training corpus. This study aims to quantify historical social norms, particularly gender norms, by training BERT on a corpus of historical U.S. newspaper articles. By leveraging BERT, we expect to capture norms that go beyond simple stereotypes. This approach seeks to enable the analysis of gender norms in periods lacking survey data and to uncover the diachronic dynamics of various gender norms that have not been explicitly surveyed. | |||||||||
言語 | en | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN1010060X | |||||||||
書誌情報 |
研究報告人文科学とコンピュータ(CH) 巻 2025-CH-138, 号 8, p. 1-4, 発行日 2025-05-10 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8957 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |