<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-16T00:46:19Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00069896">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00069896</identifier>
        <datestamp>2025-01-21T23:43:33Z</datestamp>
        <setSpec>1164:4179:6002:6132</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与</dc:title>
          <dc:title>Named Entity Classification Based on Substring Patterns and Co-occurrence Information</dc:title>
          <dc:creator>小林, のぞみ</dc:creator>
          <dc:creator>松尾, 義博</dc:creator>
          <dc:creator>菊井, 玄一郎</dc:creator>
          <dc:creator>Nozomi, Kobayashi</dc:creator>
          <dc:creator>Yoshihiro, Matsuo</dc:creator>
          <dc:creator>Gen'ichiro, Kikui</dc:creator>
          <dc:subject>単語共起</dc:subject>
          <dc:description>本稿では，固有表現を従来のIREX定義よりも詳細に分類するタスクについて検討する．与えられた固有表現をあらかじめ設定したクラスに分類する問題に焦点をおき，文章中で共起する語および語彙大系のカテゴリ情報と，あるクラスに特徴的な，固有表現を構成する部分文字列を素性とする手法を提案する．この手法をblogおよびWeb新聞中の固有表現を対象として評価し，F値が0.67から0.72に向上することを確認した．また，クラス毎に素性の有効性を調査し，出現頻度の低い語を多く含むクラスで部分文字列素性が有効であり，固有表現の曖昧性が多いクラスで共起情報が有効であることを確認した．</dc:description>
          <dc:description>This paper presents a method for classifying named entities into finer classes than those of the IREX definition, which is a standard for Japanese named entity recognition. This method uses substring patterns and co-occurrence information; words in the text and their categories derived from a thesaurus. The experimental results show that the proposed method improves F-measure to 0.72 from 0.67. Furthermore, our results show that the substring patterns are effective for the classes which have many low-frequent named entities, while the co-occurrence information is effective when the class includes many ambiguous named entities.</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2010-07-15</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告自然言語処理（NL）</dc:identifier>
          <dc:identifier>5</dc:identifier>
          <dc:identifier>2010-NL-197</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>6</dc:identifier>
          <dc:identifier>AN10115061</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/69896/files/IPSJ-NL10197005.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
