2024-03-30T00:27:04Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000480022024-03-29T05:26:34Z01164:04179:04201:04203
新聞記事からの交通事故事例および事故原因表現の抽出Extraction of Articles concerning Traffic Accident and Expressions concerning Accident Causejpnhttp://id.nii.ac.jp/1001/00048002/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48002&item_no=1&attribute_id=1&file_no=1Copyright (c) 2005 by the Information Processing Society of Japan豊橋技術科学大学知識情報工学系豊橋技術科学大学知識情報工学系豊橋技術科学大学知識情報工学系 豊橋技術科学大学インテリジェントセンシングシステムリサーチセンター酒井, 浩之梅村, 祥之増山, 繁新聞記事から交通事故事例の記事を抽出し,さらに,その中から事故原因を表す表現(例えば,「ハンドル操作を誤った」)を自動的に抽出する手法を提案する.本手法では,まず,Support Vector Machine(SVM)を用いて新開記事コーパスから交通事故事例の記事を抽出する.そして,抽出された交通事故事例の記事から事故原因を表す表現を抽出する.具体的には,事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え,種表現に係っている事故原因表現を自動的に取得する.そして,取得したいくつかの事故原因表現から自動的に種表現を取得し,さらに,取得した種表現から再び事故原因表現を取得する.このプロセスを繰り返すことで,事故原因表現,および,その種表現を取得していく.本手法を評価したところ,交通事故事例抽出は精度82.0%,再現率84.3%であった.また,事故原因表現,および,種表現を共に含んでいる文を原因文と定義し,その抽出精度,再現率を求めたところ,精度が77.7%,再現率が39・8%であった.We propose a method for extracting articles concerning traffic accident and expressions concerning accident cause (e.g., "mishandling of the steering wheel control") from a. newspaper corpus. Our method extracts articles concerning traffic accident from a newspaper corpus by using SVMs, and extracts expressions concerning accident cause from the extracted articles. Here, we define an expression modified by expressions concerning accident cause as "a seed expression". Our method acquires expressions concerning accident cause from an initial seed expression provided manually. Moreover, our method acquires seed expressions from the expressions concerning accident cause and acquires new expressions concerning accident cause from the acquired seed expressions. By iterating these processes, expressions concerning accident cause and seed expressions are acquired. Experimental results showed that our method of extraction of articles concerning traffic accident from a newspaper corpus attained 82.0% precision and 84.3% recall. Here, we define a sentence containing both an expression concerning accident cause and a seed expression as a cause sentence and the precision and the recall of extraction of cause sentences attained 77.7% and 39.8% respectively.AN10115061情報処理学会研究報告自然言語処理(NL)200594(2005-NL-169)85922005-09-302009-06-30