IEEE Kansai Section第18回技術講演会

IEEE Kansai Section第18回技術講演会のご案内
The 18th IEEE Kansai Section Lecture Meeting



"Design, compilation, and preliminary analyses of the 'Corpus of Spontaneous Japanese' "


前川 喜久雄 (Dr. Kikuo Maekawa)          独立行政法人国立国語研究所 研究開発部門 第2領域長

日時(Time & Date)

Tuesday, September 10, 2002 16:15~17:30


NTTコミュニケーション科学基礎研究所 大会議室(3F)
NTT Communication Science Labs. Conference Room (3F)
           〒619-0237 京都府相楽郡精華町光台2-4
           (NTT西日本 京阪奈ビル C棟3階 会場地図は下記ホームページを参照)




'Corpus of Spontaneous Japanese', or CSJ, is a large-scale annotated corpus of spontaneous speech that has been constructed under the collaboration of the National Institute for Japanese Language, Communications Research Laboratory, and Tokyo Institute of Technology. Currently, we are at the beginning of the fourth year of the five year (1999-2003) project. The main body of the corpus consists of seven million morphemes, or about 640 hours of spontaneously uttered Standard Japanese monologue speech. The speech is systematically trascribed using more than a dozen of annotation tags. The transcribed text is then morphologically analyzed in terms of word-boundary and POS information. Moreover, sub-phonemic segment labels and intonation labels are provided for a subset of the corpus, namely 500,000 morpheme or about 45 hours of speech. As long as the Japanese language is concerned, CSJ is the richest source of spontaneous speech data both for information processing --like ASR and NLP--, and linguistics. In this talk, I will present the basic design concepts of the corpus, the status-quo of the compilation work, and some preliminary results of CSJ-based analyses of linguistic variations in the Standard Japanese.


昭和59年4月  鳥取大学教育学部 助手(国語学)
昭和62年4月  鳥取大学教育学部 講師(国語学)
平成 元年4月  国立国語研究所 言語行動研究部 研究員
平成 4年7月  国立国語研究所 言語行動研究部 主任研究官
平成 5年7月~平成6年5月 オハイオ州立大学言語学科研究員(文部省在外研究)
平成 6年7月  国立国語研究所 言語行動研究部 第2研究室長
平成 8年9月  ウィスコンシン大学ワイズマンセンター 訪問研究員
平成11年4月~ 現在 独立行政法人 通信総合研究所技官(併任)
平成13年4月~ 現在 独立行政法人 国立国語研究所 研究開発部門 第2領域長

参加費 (Fee)

無料 (Free)

参加申込み先 (Contact for registration)

619-288 京都府相楽郡精華町光台2-2
ATRメディア情報科学研究所 本庄由美子
Yumiko Honjo (ATR MIS Labs.)
Tel: (0774) 95 1404
Fax: (0774) 95 1408
会場準備の都合上、参加ご希望の方は、所属、お名前(ふりがな)およびIEEE会員番号を上記参加申し込み先まで Email(Faxでも結構です)にて9月3日(火)までにお知らせください。
Please register in advance. E-mail or fax IEEE member ID, your name and affiliation by September 3 (Tue.).

なお、本講演会は"NTT-Stanford 概念・言語処理ワークショップ"のプログラム(無料)としても行われます。
ご興味のある方は もご覧ください。
This lecture will be held as part of the "NTT-Stanford Workshop on Concept and Language Processing".
If you are interested in the program of the NTT-Stanford Workshop, please access the following homepage:

本件連絡先 (For further information)

IEEE Kansai Section Technical Program Committee Secretary
間瀬 健二(ATRメディア情報科学研究所)
Kenji Mase (MIS Laboratories)


