最近のエントリー
カテゴリー
過去のエントリー
カレンダー
S M T W T F S
1234567
891011121314
15161718192021
22232425262728
293031    
<< October 2017 >>
ブログ内を検索


PROFILE
モバイル
OTHERS
言語テクノロジーと出版
昨日は雑誌協会で機械翻訳ソフトについてお話をさせていただきました。この日は情報通信研究機構(NICT)の隅田英一郎氏、鳥澤健太郎氏、木俵豊氏が、NICT で開発された「統計翻訳にもとづく多言語機械翻訳システム」、「概念辞書」、「ウェブ情報分析システム”WISDOM”」についてそれぞれ話をされました。これらはいずれも日本の言語テクノロジーの最先端の研究成果であり、こうした技術と出版界の出会いは、今回がはじめてのことだったのではないでしょうか。編集者が最先端の言語テクノロジーを駆使して雑誌や書籍をつくる時代がいずれくると、私は考えています。

私はこうした出版の近未来像の前段として、言語テクノロジーのきわめて重要な1領域である機械翻訳について、特に現在市販されている機械翻訳ソフトが、雑誌記事の日英翻訳にどこまで使えるかという点に絞った、大日本印刷のGMS 研究所でのテスト結果を紹介させていただきました。

コンピューターに翻訳をさせるという機械翻訳の研究は、コンピューターそのものの誕生と同じくらい古い時代からはじまっています。現在、機械翻訳技術は、大量の対訳コーパスを使って翻訳を行う「統計翻訳」という方式が主流となっています。統計翻訳はコンピューターの能力の飛躍的な進歩ともあいまって、1990年代に急成長した方式です。

一方、それ以前から研究されてきたのが「構文主導翻訳」あるいは「ルールベース翻訳」とよばれる方式です。構文主導翻訳は「文法書」と「辞書」を使って翻訳する方式で、私たちが行っている翻訳と基本的に同じ方法でコンピューターに翻訳をさせるものです。

MT

日本にはこの方式で開発された優秀な翻訳ソフトがいくつも存在しており、産業翻訳や学術翻訳分野の英日翻訳で実績をあげています。今回のテストは、こうした翻訳ソフトを雑誌の記事という新しい分野の、しかも日英翻訳に使うことができるかというものです。

日本の雑誌にとって「多言語化」はきわめて重要な課題であり、とくにその要である日本語から英語への翻訳需要は、今後急増するとみられます。おそらくその需要は早晩、日本の翻訳会社および個人の翻訳者のキャパシティーを超えてしまうでしょう。日本の出版社が統計翻訳システムを業務で使う時代が遠からず来るとは思いますが、それまでの間、翻訳者の負担の軽減、増加する翻訳需要の緩和のために、こうした翻訳ソフトを使うのも選択肢の1つであると、私は考えています。

テストの結果、辞書の整備や前工程での原文の編集を行うことによって、雑誌の日英翻訳にこれらの翻訳ソフトを利用可能という感触が得られました。今後、さらにテストを続けていきたいと考えています。

翻訳ソフトを購入して自分のPC に入れれば、それで右から左に翻訳ができるかというと、そういうわけにはいきません。翻訳というのはきわめて人間的な行為であり、コンピューターが100% 人間に代わることができません。下の図は、翻訳ソフトを使って自動翻訳を行う場合の作業の流れを示したものです。

MT

これを見ていただけばお分かりのように、コンピューターがしてくれるのは赤い矢印の部分だけです。機械翻訳にかける前のプリエディティング、翻訳後のポストエディティング/リライティング、さらには辞書の整備や翻訳結果のフィードバックなど青の矢印の部分は、基本的には人間が行わなくてはなりません。「翻訳ソフト+人間」からなる機械翻訳システムを構築することが必要です。
ユニバーサル社会を目指す
目の見えない人がパソコンを使うためのソフト「xpNavo」を開発し、販売しているナレッジクリエーションという会社に行ってきました。「xpNavo」はパソコン画面上のテキストを音声で読み上げてくれるスクリーンリーダーといわれるソフトの1つです。

社長の新城直さんは横浜市立盲学校の教師でしたが、自分が使い、また生徒たちに使わせていたスクリーンリーダーには、いくつか改善すべき点があると感じていました。そこで、自らが考えた新しいスクリーンリーダー「xpNavo」を開発し、これを販売するために盲学校をやめて会社を立ち上げたのです。

「xpNavo」には、画面の文字を3種類の声で読み分ける機能があり、ユーザーにとって内容の把握が容易になりました、また、声も非常にきれいです。パソコンの初心者にとっても、使いやすいソフトです。しかし、このソフトの最大の特徴は、新城社長が目指しているユニバーサルデザインの発想にあるといってよいでしょう。

従来のスクリーンリーダーが全盲の人を対象としているのに対して、「xpNavo」は弱視者も使えるように、ユーザーの「耳」になるだけでなく、「耳」と「目」になるモードも用意されています。これは、新庄さんの教師時代の経験から生まれたものです。パソコンの画面がある程度見える生徒にとっては、画面のテキストを全部読んでくれる必要はなく、必要な個所のテキストだけを読んでくれるような機能がのぞまれます。今までのスクリーンリーダーを使っていると、全盲の生徒と弱視の生徒は教室で分断されてしまうというのです。全盲者用と弱視者用の両方のモードをもっている「xpNavo」は、この問題を解決してくれます。さらに、弱視者用のモードは高齢者がパソコンを使用するときにも使うことができます。全盲者、弱視者、高齢者、これらの人たちが分断されることなく、一緒に使えるというユニバーサルデザイン、バリアーフリーの発想が実現されているのです。

「私にとっての障害とは、社会にとっての不完全さを直感し、理解できる力と健常者にはない視点とノウハウをもたらしてくれます。不完全なものを改善することが、ユニバーサル社会の形成につながるのであれば、私にとって障害は最大のメリットとなります」という新城さんの言葉を深くかみしめたいと思います。
ロングルームと言語の壁
ダブリンに2日間滞在してからフランクフルトに来ています。ダブリンではトリニティー・カレッジでの会議に参加しました。

Trinity College

トリニティー・カレッジには古い歴史をもつ図書館があり、そのメインの部屋は「ロングルーム」とよばれています。その名の通り、奥行きの深い部屋で、両側には2階建ての書棚があり、ここに20万冊の本が保管されています。人類の偉大な知的遺産です。

The long Room, Trinity College, Dublin

ロングルームに来ると、もしも書棚の梯子を上って、おそらく何百年も開かれたことのない古い本のページをめくってみたらどんな気持ちになるだろうか、と想像しないわけにはいきません。しかし、私を含めたほとんどの日本人にとって、そこに書かれている内容を十分に理解することは難しいでしょう。言語の壁が厳然として立ちはだかっているからです。私が参加した会議というのは、最新のコンピューター・サイエンスやコンピューター・テクノロジーを使って、この言語の壁をいかにして乗り越えるかという会議でした。

▲PAGE TOP