機械翻訳精度95%のからくり<AI翻訳>数字のトリック

機械翻訳全盛

 機械翻訳の精度は〇〇%。プロ翻訳者レベルの精度を実現などの謳い文句で企業向けに自動翻訳(機械翻訳)の導入を薦める宣伝をよく目にします。
 果たして本当なのでしょうか?

プロ翻訳者の最低条件

 プロ翻訳者レベルの精度を実現するということですから、まずは、プロ翻訳者の最低条件について検討する必要があります。
 そもそも翻訳というのは、たとえば英日翻訳でしたら、英語から日本語に言語を変換することです。
 英語を日本語に変換する目的は、英語を理解することができない日本語を母語とする人々に英語で書かれた文の内容を正確に伝えることにあります。つまり、(英日)翻訳とは、英語で書かれた文を同じ意味でもって日本語に変換する作業ということになります。
 英語とそれを翻訳した結果の日本語が同じ意味にならなければ翻訳とはいえません。
 ここから、翻訳者としての最低条件とは、英日翻訳でしたら、英語を同じ意味をもった日本語に変換する能力ということになります。
 この最低条件を満たさない方は、そもそも翻訳者になれませんから、ましてやプロ翻訳者には当然なれません。
 プロ翻訳者の最低条件は、同じ意味を保持させながら、ある言語を別の言語に変換する能力となります。
 この能力はあくまでも最低条件、つまり必要条件であって、その能力以外にも、如何に自然な訳文に翻訳することができるかもプロ翻訳者には当然に要求されます。

機械翻訳の実力

 とある機械翻訳で、次の英文を翻訳させてみました。

Neo, last seen dead but recently repaired by the machines with his memory suppressed, doesn’t know he is living inside a new version of the Matrix as a new version of Thomas Anderson.

The Fouth “Matrix”: Unburied and Dead (THE WALL STREET JOURNAL/ Dec.23, 2021)からの引用です。訳文は次のようになりました。

最後に死んだはずのネオが、最近機械に修理され、記憶を封じられたことに気づいていない。彼は新バージョンのマトリックスの中で、新バージョンのトーマス・アンダーソンとして生きているのです。

 どうでしょうか?
 結構よくできてるかもと思われた方もいらっしゃるかもしれません。[ repair ]を「修理」と訳しているのはいまいちですが、それ以外は読むに耐える日本語になっているようです。
 では、この機械翻訳による訳には、プロ翻訳者の最低条件である「同じ意味を保持させながら、ある言語を別の言語に変換する能力」が発揮されていると言えるでしょうか?

評価

 残念ながら答えはノーです。
 詳細は控えますが、この英文の骨は、

Neo…doesn’t know he is living inside…the Matrix….

です。つまり、

ネオは、自分がマトリックスの内部で生きていることを知らない。

が骨となる文です。この骨となる部分を正確に日本語で表現しない限り、同じ意味を保持させながら、ある言語を別の言語に変換する能力があるとはいえません。
 この点、上の機械翻訳の日本語は、ネオが知らないのは、機械に修理(生き返ら)され、記憶を封じられたことになっています。機械翻訳の訳だと、ネオは、マトリックスの内部で生きていることを知らないのかどうかが不明です。これでは、原文の英語の骨が正確に伝わりません。日本語としてはまぁまぁ流暢かとは思いますが、プロ翻訳者に必要な能力(同じ意味を保持させながら、ある言語を別の言語に変換する能力)は残念ながらありません。

数字のトリック

 たとえば、翻訳精度95%という場合、その数字を聞けば残り5%だけで良いんだと思うのが通常でしょう。
 ですが、それは違います。残り5%が文の骨に関わる場合があるのです。なぜなら、文においては、すべての単語が同じ価値を有しているわけではないからです。文の骨を決める重みのある重要な単語というものがあるのです。
 たとえば、主語、動詞、肯定否定、頻度、程度などは文意にとってとても重要です(文脈にもよりますが、それはさておきます)。誰が何をしたのかは文の骨ですし、あるのかないのかでは意味は真逆になりますし、いつもなのかときどきなのかや、とても多いのかとても少ないのか、なども文意にとっては重要です。
 機械翻訳が、100語中のたった1語を誤訳した場合、精度は99%となりますが、その誤訳が肯定否定の誤訳だとすると99%の精度であっても文意が真逆になるという大誤訳となってしまいます。なんとも恐ろしいことです。
 これは、精度〇〇%というのが、単に量的なことを示しているからです。文では、意味が重要で、意味的な重みは単なる文字数を基にした%では測りきれません。

量的な1%意味的な1%

なのです。
 意味的に極めて重要な、単語数的に1%の単語は、意味的に1%の重みしか持たないというわけではないのです。
 そもそも機械は、人間のように意味を理解して翻訳をしているわけではないので、意味的に重要な単語か否かの判断はできません。その判断ができるのは人間だけなのです。

---終---

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
日頃からのご支援、誠にありがとうございます。
翻訳特にリーガル翻訳について正しい理解をしていただきたく、下記のブログに参加しております。
応援クリックをよろしくお願いいたします。
にほんブログ村 英語ブログ 英語 通訳・翻訳へ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です