はじめてのポストエディットと用語集

機械翻訳が発展し、その実用性が注目されています。川村インターナショナルでも、機械翻訳の出力結果を人が修正する「ポストエディット」と呼ばれるサービスを展開しています。機械翻訳を使用することで、コスト削減や迅速な納品にも対応できるサービスです。しかし、その品質について、不安な方も多いのではないでしょうか。

本記事では、ポストエディットの品質を向上させる方法の一つである用語集について、また、用語集を作成する際の注意点について、簡単にご紹介します。

ポストエディットとは

ポストエディットとは、機械翻訳の出力結果を人が修正することです。この修正を行う担当者は「ポストエディター」と呼ばれます。

具体的には、数字の不整合や訳抜けの修正、前後の繋がりや文脈に合わせた修正など、誤った訳文の修正はもちろん、仕様に対応するために必要な作業も行います。例えば、用語集を使用して、定義された用語が正しく訳されているかをチェックします。

現在の機械翻訳では、特に、人名などの固有名詞や専門用語が正確に訳出されない傾向があります。そのため、用語集は、品質向上のために重要な資産の一つとなります

用語集とは

翻訳の工程で使用される「用語集」とは、用語とその対訳のデータを蓄積したものです。人による翻訳やチェックからポストエディットまで、翻訳に関わるあらゆる工程で使用されています。使用するツールによっては、用語の登録日、登録者、変更日などの付加情報も登録することができます。

用語集を使用すると、用語の確認をより効率的に、より正確に行うことができます。

また、用語集をCATツール(翻訳支援ツール)に取り込むことで、簡単に参照して訳文に反映できるようになります。これにより、訳の揺れや誤訳を防ぐことができ、品質が向上します。さらに、翻訳のためのリサーチにかける時間も短縮され、スピーディーな納期にも対応しやすくなります。

ポストエディットと用語集

ポストエディットにおいては、機械翻訳の出力結果に対して、用語集をもとに訳語が正しいことをチェックします。CATツールを使用する場合は 、検証機能などと呼ばれる機能を用いた品質チェックを行います。予め、CATツールに、用語集と用語のチェックの検証機能を設定しておくことで、機械的にチェックが行われます。表示された検証結果をもとに、機械翻訳の出力結果に含まれる、用語集に従っていない訳語を修正していきます

用語集作成のコツ

用語集には、基本的に、固有名詞や専門用語、業界用語を登録することをおすすめします。

また、一つの原文用語に対して、一つの訳文用語の登録が望ましいです。用語を重複して登録することで、せっかくの品質向上の効果が薄れてしまう場合があります。しかし、文脈に応じて訳し分ける必要が生じることもあるでしょう。そのため、あえて、一つの原文用語に対して複数の訳文用語を登録するように設定することも可能です。

また、用語を正しい表記で登録することが何よりも大切です。用語集に登録の表記と実際の原文に記載される表記が異なる場合、用語のチェックが行われない可能性があります。原文記載の表記に沿った登録が望ましいです。また、訳文用語の表記が統一されていないと、最終的な訳文にも訳揺れが生じます。用語登録の時点で揺れを防ぎ、実際に使用したい表記で正確に定義することが重要になります
 

下記に、用語集作成に役立つ簡単なチェックポイントを、日英翻訳の例とともにご紹介します。

スペル

スペルの違いにご注意ください。

例1は、訳文用語(英語)のスペルが異なり、訳揺れのリスクとなります。例2は、原文用語(日本語)の表記が異なるもので、用語が正しく適用されないリスクにつながります。

原文で使用されているスペル/表記および訳文で使用したいスペル/表記で定義することが重要です。また、翻訳対象の文章にあらかじめ表記の揺れがあることが分かっている場合は、揺れているパターンすべてを用語集に定義しておくこともできます。

   原文用語  訳文用語
例1-1  組織  Organization

例1-2

 組織  Organisation
例2-1  パーソナルコンピュータ  personal computer
例2-2  パーソナルコンピュータ  personal computer

 

大文字・小文字の表記

特に、会社名などの固有名詞については、大文字表記かどうかの注意が必要です。

CATツールでの設定によっては、大文字・小文字の区別をせずに、用語集を用いた検証機能を行うこともできます。

*区別をしない場合、機械翻訳結果と登録用語のスペルが一致していれば、用語は一致しているとみなされ、修正の対象になりません。この設定は、英語の文中において文頭を大文字にしなくてもいい用語の確認などに使用できます。

   原文用語  訳文用語
例1  川村インターナショナル  Kawamura International
例2  川村インターナショナル  KAWAMURA INTERNATIONAL

 

人名

漢字表記をアルファベット表記に変換する場合は、複数の読み方ができる漢字に注意が必要です。特に、人名については、用語集への登録をおすすめします。役職名なども、組織ごとに違いがありますので、登録がおすすめです。

   原文用語  訳文用語
例1  谷崎譲  Jo Tanizaki
例2  谷崎譲  Yuzuru Tanisaki

 

法人格を持つ語句

会社や組織など、法人格をもつ用語の登録にも、確認が必要です。下記の例は、法人格を含めるのか、含めないのかが異なります。法人格を含めて訳出する場合には、カンマを含めるかどうか、省略形にするかどうかなどを確認する必要があります。

   原文用語  訳文用語
例1  川村インターナショナル  Kawamura International
例2  川村インターナショナル  Kawamura International Co., Ltd.

 

略語

略語を登録する場合は、略語のままとするか正式名称で定義するかについて、原文で略語がどのように使用されているかに基づいて判断することが望ましいです

例えば、例1と例2の用語を登録している場合、「川村インターナショナル(KI)」という原文にこれらの用語を機械的に当てはめると、「Kawamura International (Kawamura International)」と同じ語が重複して訳出されることになります。例1と例3の用語を登録している場合は、「Kawamura International (KI)」と訳出されます。


一方で、原文で「KI」が単独でのみ使用されている場合、訳文では常に正式名称を使用したい場合は、例2の登録が有効です。
素早くエラーのない翻訳のためには、修正箇所や修正の判断を増やさない用語の設定が大変役立ちます。

   原文用語  訳文用語
例1 川村インターナショナル Kawamura International
例2 KI Kawamura International
例3

KI

KI

 

まとめ

機械翻訳×ポストエディットの品質については、まだまだ知られていないことも多いかと思います。しかし、用語集を使用することで、機械翻訳の特徴的なエラーを効果的に修正することができます。
また、本記事ではポストエディットと用語集についてご紹介しましたが、機械翻訳の段階で用語集を組み込むことも可能です。機械翻訳における用語集適用については、川村インターナショナルが提供するホワイトペーパー資料にて詳しく解説しています。興味のある方はぜひご一読ください。

川村インターナショナルでは、媒体やご利用目的、品質・納期・コストに応じて、機械翻訳とポストエディットを含めたサービスを提案します。用語集の作成もご協力できますので、お気軽にご相談ください


フィードバックフォーム
当サイトで検証してほしいこと、記事にしてほしい題材などありましたら、
下のフィードバックフォームよりお気軽にお知らせ下さい!
例えば・・・
CATツールを自社に導入したいが、どれを選べばいいか分からないのでオススメを教えてほしい。
機械翻訳と人手翻訳、どちらを選ぶべきかわからない。
翻訳会社に提案された「用語集作成」ってどんなメリットがあるの?
ご意見ご要望をお待ちしております!
新着記事一覧
JSAマーク
ISO17100
JSAT 007

認証範囲:
金融・経済・法務、IT、医療・医薬、電気 ・機械、航空宇宙分野の技術翻訳サービス 及びソフトウェアローカリゼーション
SGS_ISO-IEC_27001_with_ISMS-AC
※当社では、ISO17100に準拠した翻訳サービスを提供可能です。
準拠サービスをご希望の場合は、ご依頼時にお申し付けください。