| Item type |
Trans(1) |
| 公開日 |
2015-03-30 |
| タイトル |
|
|
タイトル |
活字データの分類を用いた進化計算による近代書籍からのルビ除去 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Ruby Removal Filters by Genetic Programming Using the Classification of Printing Type Data for Early-modern Japanese Printed Books |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[事例紹介論文] 近代書籍,自動テキスト化,ルビ除去,遺伝的プログラミング,クラスタリング |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| 著者所属 |
|
|
|
奈良女子大学 |
| 著者所属 |
|
|
|
奈良女子大学 |
| 著者所属 |
|
|
|
奈良女子大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Women's University |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Women's University |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Women's University |
| 著者名 |
粟津, 妙華
高田, 雅美
城, 和貴
|
| 著者名(英) |
Taeka, Awazu
Masami, Takata
Kazuki, Joe
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとしてWeb上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキスト化が望まれている.その際,問題となっているのがヒストグラム法では除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,その提案した手法は書籍に付加された版者や時代などの外部情報を利用しなければならず,近代デジタルライブラリのすべての外部情報を利用することはきわめて困難である.そこで本論文では,対象とする書籍画像から直接得られるデータをもとに,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In the web site of National Diet Library, the digital library from the Meiji era is open to the public. Since the early-modern Japanese printed books are given as image data, namely, full-text search is not available, automatic conversion to the text is needed. There is a major obstacle to the text conversion because of ruby, which is found in early-modern printed books. Ruby cannot be removed by the existing and traditional histogram method. Therefore, we have proposed a ruby removal method for early-modern printed books. Since the proposed method is based on the external information added to the books, the feasibility is very low. In this paper, we propose a new method to remove the ruby automatically from early-modern Japanese printed books by generating ruby removal formula by Genetic Programming using the training data based on the book images. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464803 |
| 書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM)
巻 8,
号 1,
p. 72-79,
発行日 2015-03-30
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7780 |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |