AI翻訳は、以前よりもはるかに自然な文章を出しています。短いメールや一般的な内容であれば、人間が訳したように見えることもあります。
しかし、「自然な文章」は必ずしも「正しい文章」とは限りません。
AI翻訳には、意味のズレ、専門用語の誤訳、用語の不統一、責任の範囲を定める表現のズレが起きるからです。問題は、なぜそのようなことが起きるのか。
この記事では、AI翻訳の仕組みを普通の人が理解できる形で解説しています。
AI翻訳は「人間と同じように理解している」わけではない
AIはまるで人間の言葉が分かっているようですが、実際にはどうなっているでしょうか?
AIは人間の言葉を理解できません
私たち人間が話す言語(日本語や英語など)は「自然言語」といいます。それに対して、コンピューターが分かる言語は「形式言語」と呼ばれます。形式言語はプログラミングに使われるC言語やJavaなど、プログラマーがアプリケーションを作るときに使う言語のことです。
普通の人がプログラミング言語を理解できないように、コンピューターも人が話す言語が分かりません。つまり、AIは文章を作りますが、自分が言っていることの意味は分かっていません。
AIは“確率”で単語を並べている
意味が分からないのに、AIはどうやって文章を作っているのか?
AIの話では必ず「学習データ」というキーワードが出てきます。学習データは膨大な文章のデータベースだと思ってください。本やWebサイトなど、ありとあらゆるものから文章を抜き取って、一つのファイルに集めて、AIに与えます。
AIはその膨大なデータから“文の構造”を覚えます。単語を主語や動詞などに分けて、文を作る時の順番などを覚えて、再現できるようにパターンを記録します。私たちが学校で英語を勉強するときの「S+V+O+C」と同じようなパターンです。
文のパターンを覚えたら、あとは質問や文脈に合わせて使うべき主語や動詞の確率を計算するだけです。まるでサイコロを振りながら、単語を1つずつ並べて文章を組み立てます。
AI翻訳はなぜ自然な訳文を出せるのか
昔のGoogle翻訳と比べれば、AIは驚くほど自然な文章を作ります。人間の言葉が分かっているかのようですが、その自然な文章はどのように生み出されているのか?
大量の言語データから“自然な文章”を学習している
自然な文章は“違和感がない”、普通に感じる文章です。つまり、自然な文章は普通の文章です。
ネット上にある大量の学習データからAIはそれぞれの場面で「最も多く使われている言い回しはどれか」を覚えて、文章を書くときにその言い回しを使います。AIが自然な文章を作れるのは、“普通の文章の宝庫”であるインターネットから大量のデータを仕入れているためです。
言い換えれば、AIが作る文章の正確さや自然さはその学習データに依存しています。
この仕組みが分かれば、AIが自然な文章を出す条件が見えてきます。
長い文章より短い文章の方が自然に見える
AIは確率で文章を作っているため、短い文章の方が自然に見えます。その仕組みを見ていきましょう。
AIは自然言語が分からないため、言葉の意味が分かりません。確率で単語並べているため、サイコロを転がしながら文章を作っていると思ってください。
短い文章はサイコロを転がす回数が少なく、長い文章はサイコロを転がす回数が多いです。サイコロを1回だけ振って6の目を出す確率は6分の1ですが、サイコロを5回振ってすべてに6の目を出す確率は7776分の1です。
AIが短い文を得意とするのは、“サイコロを振る回数が少ない”からです。逆に、長い文章になればなるほど、AIがミスや誤訳を出す確率が高まります。
一般的な内容に自然さが出る
AIの学習データは主にネット上の情報から集められたものです。SNS、掲示板、知恵袋、人の会話など、普通の人が普通に書いている・話している内容です。そのため、専門性のない普通の文章を作るまたは訳すときに、AIが最も自然さを発揮できます。
逆に、専門的な内容、ネット上で情報量が少ない内容、機密性の高い内容になると、AIの文章にミスや違和感が目立ち始めます。
自然な文章を出せることと、意味を正しく判断することは違う
AIは文章として自然な訳文を出します。特に2016年から流行したMTPEと比べると、仕上がりに雲泥の差があります。
しかし、AIは確率と学習データで文章を組み立てているだけで、製品の背景、読者の状況、会社の意図、責任範囲を理解して、翻訳に落とし込んでいるわけではありません。「翻訳の目的」に関わる重要な情報を汲めないため、誤訳や用語のミスはもちろん、その翻訳で“到達したいゴール”にズレが出てきます。
「自然に見える文章」が「正しく翻訳された文章」と思われることがAI翻訳の最大の落とし穴です。
AIの自然な文章にどんな間違いが隠されているのか
AIの自然な翻訳にユーザーはどんなミスに気を付けるべきか?
文脈が足りないと、もっとも自然そうな意味を選んでしまう
原文には複数の意味に取れる表現があります。その時、AIはどう判断するのか?
人間の翻訳者なら、製品の背景、製品を購入する読者、翻訳の目的、依頼者との打ち合わせで得た様々な情報などを考えて正しい翻訳を選びます。
しかし、AI翻訳は学習データの中から「これじゃね?」というもっともらしいものを選びます。
その結果、文章全体の流れが自然でも、原文の意図とは違う翻訳になってしまいます。
専門用語を一般的な意味で訳してしまうことがある
専門用語、業界用語、製品固有の表現は、一般的な単語とは違う意味で使われることがあります。
しかし、AI翻訳は、それを一般的な意味で訳してしまう場合があります。なぜなら、AIの学習データには一般的な内容に関するデータの方が圧倒的に多いからです。
企業独自の用語、製品の呼び方、特許やブランディングのために使われている表現は会社の売り上げや訴訟などに直接影響を与える要素です。間違った用語の使い方が企業に与えるインパクトについては、用語集の重要性を参照してください。
否定・条件・範囲の表現にズレが生じることがある
取扱説明書、規約、契約関連文書などに以下の表現が頻繁に登場します:
- 〜してはいけません
- 〜する必要があります
- 〜の場合があります
- 〜に限ります
- 〜を保証しません
- 〜を除きます
これらの表現に企業が神経質になるのは、読者の行動や会社の責任範囲に影響するからです。間違えて翻訳されると、相手または企業が思わぬ損害を受けることがあります。
AI翻訳はこういった部分も確率と学習データで翻訳しているため、その文書に合った表現が使われるかどうかは誰も保証できません。ユーザーの自己責任になりますので、注意が必要です。
自然に読める誤訳ほど見落とされやすい
キュウリの山の中に入っているニンジンは探さなくても目に入ります。しかし、紛れ込んでいるのはズッキーニだったら、話しが変わります。
翻訳も同じです。不自然な翻訳は一瞬で気づけます。しかし、自然に読める誤訳ほど恐ろしいものはありません。カメレオンのごとく文章に同化している誤訳は目の前にあってもなかなか気づけません。マウスのカーソルのように、少し動かさないとどこにいるか分かりません。
AI翻訳の怖さは、文章の中に自然に埋め込まれている誤訳やミスにあります。チェックしても見落としやすく、ミスを炙り出すためには通常とは異なる方法が必要です。
AI翻訳はなぜ用語が統一されないことがあるのか
AI翻訳の弱点の一つは用語の統一です。なぜその問題が起きるのか?
一般的に自然な訳と、会社で使うべき訳は違う
AI翻訳は、その時の文脈に合わせて、自分の手札である学習データから最も自然に見える翻訳を出します。しかし、取扱説明書やマーケティング関連文書には企業独自の用語や表現が含まれています。AIを使うと、企業の独自性が失われた普通の文章に翻訳されます。
例えば、同じ製品名、機能名、ボタン名、サービス名などを文書全体で統一する必要があります。しかし、AIは学習データに基づいて翻訳を行うため、データの中に入っている“当たり障りのない”用語が使われてしまいます。
同じ言葉でも文脈によって訳が変わることがある
用語の不統一は学習データのせいだけではありません。AIの基本的な仕組みである“確率”も用語不統一の原因になっています。
AIはその時の確率で出る文章が変わります。文脈が変われば、違う答えを出す確率も当然変わります。AI翻訳は確率で動いているため、ルールが苦手です。「いつも同じ用語を使ってください」というルールを作ったとしても、聞くのは最初だけです。途中で状況や文脈が変われば、確率も変わるため、結局は用語がバラバラになってしまいます。
AIは過去の翻訳や社内ルールも苦手
過去の翻訳を踏襲することもAI翻訳の苦手なことの一つです。技術文書やマーケティングの重要なルールになぜAIが従えないのか?
翻訳の統一ができない
翻訳に一貫性が重要です。特に取扱説明書では、同じアクションに同じ指示を出すことが基本であり、文豪を気取った翻訳は困っているユーザーの人生を難しくするだけです。
プロの翻訳者は一貫性を保つためにCATツールの翻訳メモリを使います。翻訳メモリを活用することで、現在翻訳している取扱説明書だけではなく、過去の資料、Webサイト、営業資料などの文書と一貫した翻訳を作ることができます。
一方で、AI翻訳に翻訳メモリはないため、過去の翻訳を活用したり、他の文書の翻訳と統一を図ったりすることはできません。
スタイルガイドの設定も難しい
取扱説明書やWebサイトなど、企業が作る文章は見えないところで言葉遣いや表現のルールが厳しく決められています。そのルールを決めるのは、翻訳のスタイルガイドです。
スタイルガイドは単純な“ですます調”だけではなく、数字の表記方法からそれぞれの場合に使う表現まで、多岐に渡るルールが細かく定められています。この細かなルールが企業のブランド力を高めて、売り上げや知名度を高めます。
前にも説明したように、AIその“細かなルール”がとにかく苦手です。そのため、AI翻訳を選ぶことはブランディングを捨てることを意味します。
AI翻訳を企業で使うときの判断方法
AIは間違いなく便利な道具です。しかし、万能ではありません。前に立ちはだかるのは、「どんな条件なら仕事でAI翻訳が使えるのか?」という判断です。失敗できないからこそ、慎重な決断が必要です。次のページでは、AI翻訳の失敗を避けるための判断方法を説明します。












