@techreport{oai:ipsj.ixsq.nii.ac.jp:00055158, author = {齊藤正高 and Masataka, Saito}, issue = {73(2002-CH-055)}, month = {Jul}, note = {現在、ウェブ上では様々な漢文の本文データが使用に供されている。これらのデータベースでは、一つ或いは多数の本文データを同一のキーワードで検索できる。しかし、ある漢文テキストに別のテキストがどのような形で引用されているのかを自動抽出する研究は少ない。本発表では、可変長の句を持つ散文を取り上げ、明末の方以智『東西均』開章のテキストから、『論語』の引用や言い換えの表現を自動抽出した例を報告する。この作業の中で解決すべき問題、異体字問題・不要語問題・一致部分の分類の問題を、漢文の特性から述べる。, These days there are several text data of Chinese classics on the web, and we can retrieve these data bases by keyword. On the other hand, it is rare case to study extraction of paraphrases from Chinese Classics. My study is an attempt on extract  paraphrases from prose text data of Ancient Chinese. I extracted paraphrases of the Confucian Analects(論語) from Tung hsi chun (東西均) bookI written by Fang I-chih (方以智) ,a Scholar lived in China in the late Ming period. I will report some problems about unification of variants of Han characters, stop words, and term weighting.}, title = {漢文典故表現の抽出について}, year = {2002} }