XMAT「用語検証」では何ができる?
機械翻訳プラットフォームの機能紹介
昨年1月に正式リリースとなった弊社開発の機械翻訳プラットフォーム「XMAT」。
順調にご成約いただいており、お問い合わせをいただく機会も更に増加しています。機械翻訳を手軽に利用できる、機械翻訳の結果を効率よく修正できる、といった特徴がありますが、実際の機能はどのようなものなのでしょうか。
今回は、XMATの用語検証機能についてご紹介いたします。

良い翻訳をするために最も重要なことの一つは用語集の作成/活用だと言ったら意外に思うでしょうか。
どんなに翻訳者に語学力があり翻訳文として完成されたものであっても、その用語表現が翻訳文のエンドユーザーにとっての正解とは限りません。
また、同じ単語に複数の表現がある用語の不統一があると、翻訳の品質としてはジャンク品になってしまいます。技術文書やマニュアルなどを扱う産業翻訳では作業全体のやり直しが必要になることもあります。
これらの問題を解決するために、関係者全員がアクセスできるデータベースの構築や、ツールによる自動検出などが活用できる翻訳支援ツールを併用することが近道であることは、翻訳会社では常識です。
ルールベースの機械翻訳(RBMT)や統計ベースの機械翻訳(SMT)では、辞書データを登録する、あるいは辞書データを学習させることで適切に用語が訳されるようにすることは比較的容易に実現することができました。
ところが、現在主流のニューラル機械翻訳(NMT)はブラックボックスで、かつ一文を超えた結束性判断が苦手なため、用語集を教師データに含めてディープラーニングを実施しても、思った通りの用語に訳される保証はなく、むしろ間違った訳語で出力されたり、用語の統一がなされなかったりする確率が上がっています 。
残念ながら、ニューラル機械翻訳と用語集の相性は決してよいとは言えません。
弊社製品の機械翻訳プラットフォーム「Translation Designer」には用語登録機能が備わっています。試しに、以下の文章を日本語から英語に翻訳してみました。
(選択エンジンはGoogle Translate、2021年12月時点)
| 原文: 用語集の管理は翻訳品質を左右する重要な要素である。 翻訳者が正しい訳語を適用できるように、現場の管理者は適切に用語集を管理する必要がある。 |
|
訳文(用語適用なし):
訳文(用語適用あり《管理=Managementと用語登録》): |
赤字が文法ミスとなってしまい、用語登録機能を使用する事により、かえって訳文が悪化していることがわかります。
むやみやたらに用語登録をすればよいというものでもなく、例えば固有名詞のみの登録に限定する等、検討が必要です。
これに対し、XMATの用語検証機能は、事前に登録した用語(原文、訳文ペア)を機械翻訳文において採用するものではなく、あくまで検証機能とし、警告に留めるものとしています。
(※以下キャプチャの「検証ステータス」雷マーク で対象の用語に警告がでており、 「用語フィールド」に登録された用語が記載されます。)


機械翻訳の出力結果のみで100%解決しようとすると、思わぬ大事故につながってしまう可能性があります。XMATの自動検証機能は「ポストエディット(人手による修正)の際にエラーを検出しやすくする」事を目的としていることをお判りいただけたでしょうか。
AIで翻訳もかなり便利になり、人間があっと驚くような翻訳結果も得られるまでになりました。しかし、もう人間は何もしなくてもよい、というわけではありません。
翻訳の用途を明確に区分けし、目的に沿った使い方をする事こそが重要であり、色々なユースケースにおいて適切に機械翻訳を使いこなすには、人間の知恵と工夫が必要です。
今回は「用語検証機能」のご説明に留めましたが、XMATの追加オプション機能「LAC (Language Asset Creator)」では、指定用語に置き換えた上での訳出も可能です。追加機能「LAC」のエンジンカスタマイズについては、次回テーマを設けてご紹介いたします。
次回もお楽しみに!