@techreport{oai:ipsj.ixsq.nii.ac.jp:00048520,
 author = {小磯, 花絵 and 前川, 喜久雄 and Hanae, Koiso and Kikuo, Maekawa},
 issue = {54(2001-NL-143)},
 month = {May},
 note = {国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度の下,自発性の高い話し言葉の情報処理技術の確立を目標に活動を進めている.現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している.このコーパスには,約700時間の音声(約700万形態素に相当),書き起こしテキスト,および形態素などの情報が含まれる予定である.本稿では,本コーパスの設計の概要および書き起こし基準の詳細について紹介する., A large-scale corpus of spontaneous Japanese speech is being compiled as a joint work of the National Institute for Japanese Language, the Communications  Research Laboratory, and Tokyo Institute of Technology.This corpus is designed to contain about 700 hours of speech (about 7 million morphemes), its transcription, and various tagging information such as POS information. In this paper, the transcription criteria designed specifically for CSJ is described after a brief overview of the general architecture of the corpus.},
 title = {『日本語話し言葉コーパス』の設計の概要と書き起こし基準について},
 year = {2001}
}