はじめに
村田裕美子(LMU München, ミュンヘン大学)
このサイトでは、「ドイツ語話者日本語学習者コーパス German Learners' Corpus of Japanese Language(以下、GLJコーパス」として、次の2種類のコーパスを公開しています。
・「ドイツ語話者日本語学習者コーパス話し言葉編(以下、GLJコーパス話し言葉編)」
・「ドイツ語話者日本語学習者コーパス書き言葉編(以下、GLJコーパス書き言葉編)」
この度、研究成果の共有を目的に、ウェブサイトにてデータを公開します。本コーパスがドイツ語圏の日本語教育研究の発展および第二言語習得研究に貢献することを願っています。利用規約に従って、お使いください。
「ドイツ語話者日本語学習者コーパス話し言葉編」とは
「ドイツ語話者日本語学習者コーパス話し言葉編」とは、OPIの基準に沿ってレベル判定をした日本語学習者のインタビューデータを文字化し、まとめたものです。OPI基準の話し言葉コーパスでは、「KYコーパス」が広く知られていますが、KYコーパスは、中国語、英語、韓国語話者のデータしか含まれていません。そのため、本研究グループでは、ドイツ語話者のための話し言葉コーパスを作成することにしました。
本コーパスには、現在のところ、45名のデータが収録されています。45名の内訳は、初級学習者15名、中級学習者15名、上級学習者15名となっています。
GLJコーパス話し言葉編の協力者はドイツ、ミュンヘンに在住するドイツ語を母語とする日本語学習者です。「母語」の定義は複雑ですが、ここでは学校教育をドイツ語で受けた者をさします。コーパス名に「ドイツ語母語話者」と入れていないのは、今後「母語」を限定せず、ドイツ語圏で学ぶ日本語学習者のデータを加えていきたいと考えているからです。したがって、今後もデータを増やしたり、改訂したりする予定です。現在、一般に公開しているものは、「GLJコーパスversion1.0」です。テキスト内の表記の一部を変更したり修正したりした場合には、小数点以下のみ数字を変更し、データそのものを差し替えたり、増やしたりした場合には、Versionそのものの数字を変更します。
GLJコーパス話し言葉編の特徴
GLJコーパス話し言葉編の特徴は、以下の3点です。
- OPI準拠であること:多くの話し言葉コーパスにおいて、OPIが利用されている現状を踏まえ、本コーパスもOPIに準拠してデータを収集しています。これにより、他の話し言葉コーパスとの比較が容易になると考えています。
- 客観テストを実施していること:主観テストであるOPIに加え、「SPOT」 を実施し、客観テストによる言語能力の測定を行っています。
- 学習者の背景を示していること:学習者の日本語学習歴や日本滞在歴などの学習背景情報をセットで公開しています。
「ドイツ語話者日本語学習者コーパス書き言葉編」とは
「ドイツ語話者日本語学習者コーパス書き言葉編」とは、大学生および大学院生が「住みやすい国の条件とその理由」というテーマで書いた作文を収録したものです。高等教育を受けている大学生に適した社会的なテーマを扱いたいと考え、ドイツ語話者を中心に、さまざまな国の学生に協力してもらい、書き言葉コーパスとしてまとめることにしました。
本コーパスには、現在のところ、100名のデータが収録されています。100名の内訳は、ドイツ語を母語、またはドイツ語で教育を受けた日本語学習者初級20名、中級20名、上級20名、セルビア語を母語、またはセルビア語で教育を受けた日本語学習者中級20名、日本語を母語、または日本語で教育を受けた学生20名となっています。
GLJコーパス書き言葉編の協力者はドイツ、スイス、セルビア、日本に在住の大学生および大学院生です。GLJコーパス話し言葉編と同様に、「母語」の定義は複雑ですが、ここでは学校教育をドイツ語、セルビア語、日本語で受けた者をさします。コーパス名に「ドイツ語話者」と入れているのは、開発初期の目的がドイツの日本語教育の発展にあったためであり、そしてドイツで学ぶ日本語学習者を対象としたものであったからです。今後は、母語や教育を受けた国の影響が比較できるように、さまざまな国の学生の作文も、収集し、公開していきたいと考えています。
現在、一般に公開しているものは、「GLJコーパスversion1.0」です。テキスト内の表記の一部を変更したり修正したりした場合には、小数点以下のみ数字を変更し、データそのものを差し替えたり、増やしたりした場合には、Versionそのものの数字を変更します。
GLJコーパス書き言葉編の特徴
GLJコーパス書き言葉編の特徴は、以下の4点です。
- 様々なレベルの学習者が扱えるテーマ:課題「住みやすい国の条件とその理由」は、存在文や理由文を使えば、初級であっても文を産出させることができるようになっています。
- 大学生に適した社会的なテーマ:政治、経済、文化などさまざまな視点から記述することが可能で、多くの人に興味を持ってもらえるようなテーマになっています。
- 客観テストを実施していること:GLJコーパス話し言葉編と同様、「SPOT」 を実施し、客観テストによる言語能力の測定を行っています。
- 学習者の背景を示していること:学習者の日本語学習歴や日本滞在歴などの学習背景情報をセットで公開しています。
謝辞
本コーパスの発話データは、ミュンヘン大学、チューリヒ大学、ベオグラード大学、早稲田大学の学生および関係者によるものです。彼らの協力なしでは実現できません。また、言語能力の測定のため、「SPOT」のウェブ版を使用しています。
関係者の皆様に感謝申し上げます。