@techreport{oai:ipsj.ixsq.nii.ac.jp:00048817,
 author = {相良, かおる and 渡邊, 勝正 and Kaoru, Sagara and Katsumasa, Watanabe},
 issue = {99(1998-NL-128)},
 month = {Nov},
 note = {本稿では、英文契約書に使われる単語の類似度を求める手法について提案する。本手法は、単語の共起頻度に基づく統計的手法の一種であり、内積を用いて類似度を定義している。本手法の特徴は、英文契約書の書式集の条文から、名詞ど動詞、動詞と名詞、形容詞と名詞、前置詞と名詞というように統語構造を意識した2つ組を求め、その2つ組間の関連度をベクトルの要素としている点にある。本手法により、英文契約書の書式集(162 298語)に含まれる名詞898種からなる209 274組のペアについて類似度を求め、数量化IV類によるクラス分けにより、81個のクラスの類概念データを作成した。なお、本研究は、英文契約書の内容抽出のための準備研究である。, This paper proposes an approach for similarity measurement of words that are used in a collection of English contracts. This approach is a statistics-based computation of word similarity by a vector consisting of co-occurrence statistics. Using a vector consisting of the correlation between two-tuple of terms on the basis of syntactic behavior (such as the ordered pair verb, noun) is a feature of this approach. We made similarity data of 209,274 pairs from 898 nouns in the collection of English contracts, and made 81 classes from these similarity data with a multi-dimensional scaling. This work becomes a preparatory work for the information extraction from an English contract.},
 title = {英文契約書における内容の抽出 -シソーラス作成のための統計情報を用いた類似度計算-},
 year = {1998}
}