基本語彙表の作成に携わって

秋元美晴(恵泉女学園大学教授)

 7名の日本語教育の専門家と改訂『日本語能力試験出題基準』の語彙表を作っている。はじめてから2年近くたち、委員会はすでに60回を数えている。当初の予定では、語彙の選別を終了し、多義語の意味・記述をしている段階のはずなのであるが、まだ語彙を選別している状態である。7名はそれぞれ本務を持っており、家で宿題をやってきて、それを持ち寄り、部会に参加している。ときどき、脱線することはあるが、一生懸命作業をしている。基礎資料について国立国語研究所の山崎誠先生にご相談に伺ったとき、研究所でやるとしたら3年はかかるとおっしゃったのに、わたしたちはそれを2年間でやり遂げるのだと息巻いていたことを思い出す。

 日本語能力試験は、1984年から毎年1回、12月の同日に世界各地で一斉に実施されている。2006年度には47の国と147の地域で行われ、43万5000人を超える日本語学習者が受験している。世界の公的な言語テストの中でもTOEIC、TOEFLに次ぐ受験者を持つ大規模試験である。この試験は開始以来20余年を経ているが、その間に日本語教育学や世界のテスト理論も発展し、また、これまでの日本語能力試験のデータの蓄積を踏まえて、外国語能力を測定する国際的な試験とすべく改善のための検討会が組織された。それに伴い、現在いくつかの分科会が設けられ、作業を行っている。語彙表の作成もその一環である。

 語彙表の載っている現行『日本語能力試験出題基準』は、もともと試験問題作成者のために作られたものだが、1994年には出版されており、出題基準という範囲を超え、教材作成や日本語学習などの基準として転用されている。日本語能力試験は、1級から4級までに分かれているが、現行の語彙表の3、4級は日本国内外で使われていた主要な教科書により、また、1、2級は主に国立国語研究所作成の資料によって得られた基礎資料に、日本語教育専門家の判断を加えて作成されている。コーパスも少なく、また大量のデータ処理も難しかった当時のことを考えると、語彙表を完成させたことに大きな意義があったといえよう。

 しかし、日本語教育関係者からは現行の語彙リストに対して、食べ物や飲み物、スポーツ名、動・植物名が少ない、カタカナ語が少ない、対になる語がない、多義語の記述が具体的でない、最上級の1級の語彙数が一万語では足りないなどという声が聞かれようになった。また、そもそも、先に述べたように語彙の選定基準が下位級である3,4級と上位級である1,2級が異なること自体がおかしい、つまり、日本語学習者のための基本語彙ではないという指摘もあった。

 これらの指摘を受け、新しい語彙表作成に際しては、現在の日本人の言語使用の実態をできる限り反映させるために、一次資料として書きことばの大規模な客観データを複数組み合わせた頻度順の語彙一覧表を作った。この一覧表を利用することで、全級を通して同じ資料から語を選別することができることとなった。

 作業を通して気がつくことは、世代差である。ある語を採用するか否かの議論には、はっきりと世代の違いが反映する。性差を感じることもあるが、世代差の比ではない。二次資料には話しことばのデータベースを利用するが、その時は性差をより感じるようになるのであろうか。語彙は社会・文化の変化に応じて変わるものだと知っているつもりであったが、それを実感する日々である。ということは、この語彙表が出来上がるころは、すでにその時点では「聞いたことはあり、だいたい意味はわかるけど、自分では全く使ったことがない」という語が語彙表に入っているということになるのだろうか。委員会は新陳代謝をよくし、常に新しい世代の委員を入れ、少なくとも5年に一度は語彙表を見直していく必要があるだろう。ただ、若い世代が「聞いたことはあり、だいたい意味はわかるけど、自分では全く使ったことがない」という語を語彙表から排除することはむずかしい。日本語学習者が読んだり、聞いたりする語の中にそういう語が含まれていないとは限らないからである。

 このようなさまざまな語彙に関わる問題を見据えながら、われわれは21世紀に相応しい語彙表を作成すべく努力している。

2007年6月15日 掲載