やさしい日本語とAI翻訳が出会う時 その3 「AIやさしい日本語」の提唱
- 2019/6/14
- 多文化共生, 時代のことば
- 107 comments
やさしい日本語とAI翻訳が出会う時 その3 「AIやさしい日本語」の提唱
<「やさしい日本語」とAI翻訳の違い>
従来からの「やさしい日本語」は、もっぱら日本語を多少理解する外国人が対象であり、彼らが日本語で理解できるように日本語を話す側が表現を調整する。外国人が使う教科書や日本語能力試験の判定結果を参考にやさしさの目安を定め、日本語教育関係者らが言い換えや表現の工夫の研究や実践を進めてきた。
一方、AI技術を活用した多言語翻訳システム(以下「 AI翻訳」)は、日本語ネイティブが話す自由度の高い文章でも他の言語に翻訳できることを目標とする。昨今ではAI技術の一種である「ニューラルネットワーク」を使い、日本語文と他言語文の対訳データを大量に集め分析することで、極めて自然な翻訳に近い結果を出せるようになってきた。開発に関わっているのは主に言語学者とコンピュータ技術者である。
<AI翻訳の限界、英語の限界>
常にAI翻訳ツールを通じたコミュニケーションが実用的かどうかは別にして、多くの日本人は言語の壁をすべて技術が解決してくれることを望み、その日が来るのを待っているのではないだろうか。しかし、そのような日はそうそう来ないだろう。
- 英語翻訳ほどは進化しない、その他言語の翻訳
大量の対訳データを基にしたニューラルネットワークの出現で、AI翻訳の精度は飛躍的に向上した。日本語・英語間では自由度の高い表現でもズバリ翻訳する製品も登場している。だが、将棋のようにコンピュータが自己対戦を繰り返して強くなっていくような仕組みはAI翻訳の世界では使えない。他の言語を英語と同じ水準の精度にするためには、それぞれの言語で日英の翻訳データと同規模の対訳データを用意しなければならない。そのためには一つ一つの言語で莫大な投資が必要となる。おそらく今後もベトナム語やネパール語との翻訳が英語と同等精度になるとは考えづらいだろう。
- 英語を母語としない人と、英語翻訳を介して話すことの困難性
英語の翻訳精度が画期的に上がれば、相手が仮に英語を理解するタイ人であれば、タイ語ではなく英語でAI翻訳を使えばいいと考える人もいるだろう。しかし、それではまず機能しない。日英設定でAI翻訳ツールを使うということは、相手はAI翻訳が認識できる英語の発音で話す必要がある。タイ語に影響を受けた英語ではなく、アメリカ英語やイギリス英語の標準的な発音で話さないとまず認識しない。アメリカやイギリスなどの英語ネイティブ話者は別にして、世界中の人たちと日英のAI翻訳だけを使って双方向コミュニケーションするのは、相当無理がある。
<「 AIやさしい日本語」の提唱>
このように「やさしい日本語」と「AI翻訳」は様々な点で位相が違い、また英語のAI翻訳精度だけが向上しても現実の社会では適応できない場合も多いが、両者とも「多言語対応のための重要な手段」であるという点で一致している。実際、英語以外の言語についても、「やさしい日本語」の考え方を応用すれば、現在のAI翻訳でかなり実用レベルになっている。
私が所属する株式会社電通では、やさしい日本語ツーリズム研究会による社会啓発活動に加え、ダイバーシティ&インクルージョン課題のソリューション開発専門タスクフォースである「電通ダイバーシティ・ラボ」でもやさしい日本語のチームを立ち上げ、やさしい日本語による具体的なソリューションを提供していくことにしている。その中で、AI翻訳活用のためのやさしい日本語を「AIやさしい日本語」と命名し、以下のように定義した。
ここで大事なことは、AIやさしい日本語は「できるだけ多くの言語で共通に使える表現」であり、英語など特定言語のためのものではないという点である。役所の窓口や学校などでは、対応すべき言語がどんどん出てくる。そのような場合でも、AI翻訳が一般的に翻訳しやすい表現を使えば、すでに31言語に対応しているVoiceTraなどを活用してある程度の対応が可能になる。
「やさしい日本語」とAIやさしい日本語の違いは今後の研究対象となっていくが、現時点で私が考えるポイントをまとめてみた。
この中でもっとも大事なコツは、「ハサミの法則(はっきり言う・最後まで言う・短く言う)」のうちの「短く言う」だと考えている。AI翻訳では1文を短く表現することで劇的に翻訳効率が向上する。また1文を短く言うリズムは、小さい子供に説明するときや、中学校の英作文で書く文に似ていることもあり、自然に選ぶ語彙もかんたんになっていく。このような話し方は同時に日本語初級の外国人にもわかりやすいものになっている。
日本語初級の外国人向けのやさしい日本語が、実際に相手にとってわかりやすかったかどうかを検証するのは難しい。これに対しVoiceTraなら、一定の秒数で音声吹き込みを打ち切り、翻訳結果をさらに日本語に戻した結果を表示することで、入力した文章や翻訳結果の精度を自分で検証できる。VoiceTraは、1文を短く言ったり、かんたんな言葉を選んだり、方言を使わないといったことを実践する「やさしい日本語のトレーニングツール」としても活用可能なのである。
<多言語対応とSDGs>
現在行政サービスの場などでは11カ国語を目処にした多言語対応が求められている。多文化共生における多言語対応とは、必要な場面では相手の母語での対応を保障しようということに他ならない。それは国連が決めたSDGsの「誰一人取り残さない-No one will be left behind」の考え方に近いといえよう。この観点からは、英語の対応体制を整えるよりも、対応できる言語数を増やす方が重要なのである。そしてその際はAI翻訳の活用が不可欠である。
AI翻訳は語彙レベルでは大変な情報量があるため、AIやさしい日本語をそのまま日本語初学者の外国人に話しても分からない場合も多いであろう。しかしまずはAI翻訳の活用で1文を短かく言い語彙を調整する習慣を身につけることで、一橋大学庵功雄教授の言う「地域における共通言語」としてのやさしい日本語の普及も加速化することができると考えている。
多言語対応におけるAIやさしい日本語から始め、多文化共生における「やさしい日本語」の本格普及を図ることは、SDGsにも沿う施策と言えるのではないだろうか。やさしい日本語とAI翻訳の親和性を明記した総務省は、ICTと地方自治の両方を所管する官庁である。総務省の今後のリーダーシップを期待したい。
吉開 章