機械翻訳エンジンを比べてみた!

近年、機械翻訳の精度は目覚ましく、無料で自由に使えるものも多いです。有名なところではGoogleやMicrosoft、国産のものではみんなの自動翻訳@TexTra® などがあり、オンラインで気軽に使えて種類も豊富です。外国語で書かれた興味のある記事の翻訳、お気に入りの海外アーティストのソーシャルサイトへの投稿や歌詞の意味を調べるなど、身近な用途に利用している方も多いのではないでしょうか。

翻訳対象となる言語の数や訳の精度は機械翻訳エンジンによりまちまちですが、多いものでは100以上もの言語を翻訳対象言語として扱うものもあります。扱っている言語数が少ないものでも、訳の精度が高かったり、特定の言語に特化していたりとそれぞれに特徴があります。また、単純にひとつの訳文を返すだけでなく、複数の訳文を提案してくれたり、単語を入力するとその意味や用途、類語まで教えてくれたりするものもあり、幅広い用途に利用することができます。

今回は、非常に簡単なものではありますが、4種類の機械翻訳エンジンの違いについて検証してみました。検証には、Google TranslateMicrosoft TranslatorDeepLみんなの自動翻訳@KIの4種類の機械翻訳エンジンを使用し、言語方向は英語から日本語への翻訳、英文にはシェイクスピアの有名なソネット18番から冒頭の2行を使いました。

敢えてやや古い英語で書かれた韻文を選びましたが、なかなか興味深い結果となりましたので、是非最後までお付き合いください。(1種類の英文のみを対象にした今回のような簡単な検証では、機械翻訳エンジン間の優劣を決めることまではできません。別の文章を使えばまた別の結果が得られたことでしょう。また機械翻訳エンジンは日々進化しています。これから述べることは、あくまで今回行った検証の結果に過ぎないということをご理解ください。

 

機械翻訳画像

検証開始!

まずは大手2社の結果を比べてみました。

英文:シェイクスピアのソネット18番(冒頭2行)

Shall I compare thee to a summer’s day?
Thou art more lovely and more temperate.

 

(1) Google Translate

あなた夏の日と比較しませんか?
あなたはもっと美しく、もっと温和です。

 

(2) Microsoft Translator

夏の日と比較しましょうか。
あなたはより美しく、より温暖です。

 

目立った差異としては、1行目でcompareの目的語(=thee)が訳出されているかどうか、2行目でtemperateが温和と訳されているか温暖と訳されているか、といったところでしょうか。ここではtemperateは人間を形容しているため、温暖よりは温和の方が適切と思われます。他方で、訳調の観点からは、1行目から(敢えて?)目的語を省き、「しませんか」ではなく「しましょうか」とした訳の方がここではふさわしいと言えるでしょう。そのことを踏まえると、次のみんなの自動翻訳@KIの訳文は両者の良いところが盛り込まれた訳となっていると言えるのではないでしょうか。

 

(3) みんなの自動翻訳@KI

夏の日と比べてみましょうか?
あなたはより美しく、より温和である。

 

しかし、今回の検証で圧倒的に訳文の品質が良かったのがDeepLのこちらの訳です。

 

(4) DeepL

汝を夏の日に例えようか?
汝はより美しく、より穏やかである。

 「例えようか」の訳調は詩にふさわしく、またthou/theeを現代語の「あなた」ではなく、古風に「汝」としたところも素晴らしいと思います。

改行の有無による出力結果の変化

さて、上記の検証は、ソネットの冒頭2行を、改行して、それをコピー&ペーストして行ったものです。それでは、この同じ冒頭の2行を、改行を削除して翻訳するとどうなるのでしょうか。意味がないように思えるかもしれませんが、実際に検証してみると興味深い結果が得られました。

まず、Google、Microsoft、DeepLについては、原文から改行がなくなったことを反映して、訳文からも改行がなくなりましたが、訳文自体には変化は見られませんでした。唯一、異なる結果を返してきたのがみんなの自動翻訳@KIです。

 

(3’) みんなの自動翻訳@KI(改行なし)

私はあなたを夏の日と比べましょうか?あなたはより美しく、より穏やかです。

改行ありの時の訳文は韻文調でしたが、改行なしの訳では、1文目の主語と目的語が明確に訳されていて、より散文調の強いものとなっています。また、2文目では、改行ありでは「温和」だった訳が、改行なしでは「穏やか」と少し変化しています。機械翻訳のエンジンがどのような処理を行っているのかは不明ですが、改行の有無で文脈やジャンルを判断して訳出しているのかもしれません。

コピー&ペーストとタイプの差?

最後に同じ英文を使ってもうひとつ検証を行ってみました。これまでの検証では、翻訳対象となる文をコピー&ペーストして行いましたが、そうではなく、タイプして入力することで訳文に何らかの変化が見られるのかを調べてみました。

Google、Microsoft、みんなの自動翻訳@KIでは結果に変化は見られませんでした。みんなの自動翻訳@KIは、文章を入力した後に「翻訳」をクリックして翻訳処理を行うので当然と言えば当然の結果かもしれません。しかし、DeepLの出力結果は、先ほどのものとは異なるものでした。

 

(4’) DeepL(原文をタイプ)

あなたを夏の日に例えてみましょうか。汝はより美しく、より穏やかである。

 2文目には変化は見られません。ところが、コピー&ペーストの時には古風だった1文目が、タイプしたものでは現代的な訳に変化しています。正直なところ、翻訳対象の文章が同じものであれば、コピー&ペーストしようがタイプしようが出力される訳文にも変化はないだろうと思っていたため、これは意外な結果でした。ここでもどのような処理が行われているかは不明ですが、ひとつ言えることは、同じエンジンでも、入力する文章にわずかに手を加えるだけで出力される結果に影響を及ぼすことがあるということです。

まとめ

いかがでしたでしょうか?

大まかな意味を知るのが目的であれば、お気に入りのひとつの翻訳エンジンを使用すれば十分かもしれません。しかし、より深く、より正確に意味を把握したい時、複数の機械翻訳エンジンの訳文を参考にすることで、求められる水準の訳文を作成する助けになります。

翻訳支援ツールのなかには、翻訳対象となる原文への修正を補助する機能や、複数の翻訳エンジンの訳文を同時に見比べられる機能を備えたものもあります(詳しくは、以下のXMATサービスページをご参照ください)。

機械翻訳とツールを上手に活用して、望み通りの訳文を得られるようにしたいですね。

補足

無料の機械翻訳サービスは機密情報が機械翻訳学習のために再利用されたり、非商用利用に用途が限定されていたりするものもあるため、ビジネスユースで利用する場合はご注意ください

川村インターナショナルでは、さまざまな要件(セキュリティ要件、目的、分野、想定ユーザー層など)に応じて、お客様に最適な機械翻訳ソリューションを幅広くご提案いたします。「自社に最適な機械翻訳エンジンがわからない!」という場合はお気軽にお問い合わせください。


フィードバックフォーム
当サイトで検証してほしいこと、記事にしてほしい題材などありましたら、
下のフィードバックフォームよりお気軽にお知らせ下さい!
例えば・・・
CATツールを自社に導入したいが、どれを選べばいいか分からないのでオススメを教えてほしい。
機械翻訳と人手翻訳、どちらを選ぶべきかわからない。
翻訳会社に提案された「用語集作成」ってどんなメリットがあるの?
ご意見ご要望をお待ちしております!
新着記事一覧
JSAマーク
ISO17100
JSAT 007

認証範囲:
金融・経済・法務、IT、医療・医薬、電気 ・機械、航空宇宙分野の技術翻訳サービス 及びソフトウェアローカリゼーション
SGS_ISO-IEC_27001_with_ISMS-AC
※当社では、ISO17100に準拠した翻訳サービスを提供可能です。
準拠サービスをご希望の場合は、ご依頼時にお申し付けください。