
翻訳見積書の見方 ~100%マッチ・コンテキストマッチ・ICEマッチの違い~
翻訳会社に翻訳を依頼すると、見積書に「100%マッチ」、「コンテキストマッチ」、「繰り返し」などと記載されています。これらはいずれも、翻訳量の算出に使用される項目です。本記事では、これらの情報が実際にどういう意味を表し、どのように利用されているのかについて、ご紹介したいと思います。
目次[非表示]
- 1.100%マッチとコンテキストマッチの違い
- 2.100%と繰り返しの違い
- 3.100%マッチとコンテキストマッチのメリット
- 4.100%マッチを扱う際の注意点
- 4.1.同形同音異義語の翻訳
- 4.2.見出しと本文の翻訳
- 5.まとめ
- 6. 川村インターナショナルのサービス
翻訳業界で翻訳案件の見積を作成する際は、多くの場合、必要な費用と作業日数を算出するために翻訳対象原稿の文字数や単語数をカウントしています。このカウント方法にはさまざまな手法がありますが、一般的にはCATツールを使って行われます。
(画像出典:XTM公式HP)
CATツールのCATとはComputer Assisted Translationの略で、日本語では翻訳支援ツールと呼ばれています。その名のとおり、翻訳をサポートするソフトウェアやアプリケーションのことで、Trados、MemoQ、Phrase、XTMなどがよく知られています。
翻訳対象の原稿を読み込み、各種機能を備えたエディタを使用して翻訳を行いますが、大きな特長として、過去の翻訳実績を蓄積した翻訳メモリ(TM)を搭載していることが挙げられます。これにより訳文を再利用できるため、翻訳を効率化しながら品質を安定させることができます。
翻訳原稿の文字数をカウントする場合、CATツールを使用すると、単に文字を数えるだけでなく、実際の作業負荷を反映させた翻訳ボリュームを算出することができます。この便利な機能は、解析機能と呼ばれており、次のように動作します。
まず、翻訳原稿をCATツールに読み込ませる際に、原文はセグメント(文節)に分けられます。セグメントの区切り方は、あらかじめ設定されたセグメンテーションルールに従いますが、基本的には原文の言語の文法ルールが考慮されます。
例えば英語の場合は、一般に、ピリオドや改行までが1セグメントとみなされます。セグメントへの分割が完了すると、次に、翻訳メモリに蓄積された過去の翻訳実績と翻訳対象のセグメントが比較され、文字数が分析されます。これが解析機能です。
解析では、翻訳対象のテキストがどれぐらい過去の翻訳メモリと一致(マッチ)しているかを示すマッチ率が計算されます。すでに翻訳されている文章を流用できれば、翻訳の負荷が軽減されるため、マッチ率はとても重要な指標となります。マッチ率を計算するアルゴリズムはCATツールによって異なるため、同じ原稿を違うCATツールで解析すると、多少異なる結果が出ることがあります。
解析のマッチ率は、主に以下のカテゴリに分類されます。
・新規翻訳(0~49%マッチ)
・50~74%マッチ
・75~84%マッチ
・85~94%マッチ
・95~99%マッチ
・100%マッチ
・コンテキストマッチ
・繰り返し
マッチ率は、翻訳メモリの原文と翻訳対象の原稿をセグメント単位で比較し、どれぐらい一致しているかをパーセンテージで表しています。
100%マッチとコンテキストマッチの違い
上記の説明のとおり、マッチ率とは、翻訳原稿のセグメントのソーステキスト(原文)と翻訳メモリにあるセグメントがどれぐらい一致しているかをパーセンテージで示すものです。そのため、「100%マッチ」とは、翻訳原稿にあるセグメントの原文と翻訳メモリのあるセグメントの原文が完全に一致していることを示します。つまり、このセグメントは過去に翻訳されたことがあり、対訳が翻訳メモリに存在しているということです。
では、「コンテキストマッチ」とは何でしょうか。基本的には100%マッチと同じですが、コンテキストマッチは、さらにコンテキスト(文脈)も一致しています。翻訳メモリのコンテキストとは、前後のセグメントのことです。つまり、コンテキストマッチはそのセグメント自体が翻訳メモリと完全に一致しているだけでなく、翻訳原稿の前後のセグメントも翻訳メモリの登録内容と一致しています。文章の流れが一致していることになるため、メモリの訳文をそのまま流用できる可能性は100%マッチよりも高くなります。
コンテキストマッチは、CATツールによって名称が異なります。例えば、「ICEマッチ」(In Context Exact Match)や「101%マッチ」と呼ばれることがありますが、いずれも仕組みは上記のとおりです。
100%と繰り返しの違い
次に、解析結果のカテゴリにある「繰り返し」についてご説明します。繰り返しは文字どおり、繰り返し出現するセグメントです。つまり、同じ翻訳対象テキスト内に同じセグメントが2回以上存在しています。100%マッチはメモリとの一致ですが、繰り返しは原稿内での一致を示しています。
翻訳を進めていくと、翻訳メモリが蓄積されていきます。最初は空のメモリであっても、翻訳の終わったセグメントがどんどん蓄積されていくため、2回目に出現する際には100%マッチと同様になり、最初に訳した文を簡単に反映できるようになります。
100%マッチとコンテキストマッチのメリット
CATツールは翻訳の効率化に最適なツールです。翻訳メモリを使用して過去の翻訳実績を再利用することには、さまざまなメリットがあります。
- 過去の訳文を参考にできるため、翻訳作業がスムーズになり、翻訳品質も安定します。
- 過去の翻訳実績と同じ表現が使用できるので、旧版や既存文書との整合性が向上します。
- 複数名が同時に翻訳を行うような大規模案件では、リアルタイムでメモリを共有することで、表現の統一を図れます。
- 翻訳業界では、見積の際に、マッチ率の高いセグメントは通常の翻訳単価(メモリなしでゼロから訳す場合の単価)よりも低く設定されます。これは、マッチ率が高いほど、翻訳にかかる労力が低くなるためです。そのため、お客様にとっては、翻訳費用の削減につながります。お客様のご希望がある場合、100%マッチやコンテキストマッチを作業対象から完全に外すこともできます。以下で、この場合の注意点をご説明します。
100%マッチを扱う際の注意点
100%マッチやコンテキストマッチは、翻訳費用を抑えるために、翻訳作業から除外することが可能です。ここでの「除外」とは、メモリにある訳文を精査せず、そのまま採用するということです。
コンテキストマッチは前後のセグメントも一致しているため信頼度が高いですが、100%マッチを対象外にしてしまうと、いくつかリスクがあります。
同形同音異義語の翻訳
同形同音異義語は、単語の表記は同じですが、文脈によって意味が異なります。特に、システムのUIを翻訳する際は、短いテキストの翻訳が多く、文脈に関する情報が少ないことも多いです。
例えば、カーナビシステムの英和翻訳の場合は、「Home」はどのように訳すでしょう。状況によって、「ホーム画面」を指すことも、「自宅」を指すこともあり得ます。確認せずに100%マッチをそのまま流し込むと、誤った翻訳結果になる可能性があります。「Home」が翻訳メモリに「自宅」として登録されている場合、ホーム画面の意味の「Home」も「自宅」として訳される恐れがあります。
見出しと本文の翻訳
同じ文でも、原稿の見出しや箇条書きの場合と本文中の表現では訳し方が異なります。例えば英語に訳す場合は、見出しと本文でキャピタライズが異なる可能性があります。日本語であれば、句読点の有無や、訳調(ですます調、だである調、体言止めなど)を変えなければいけない場合があります。
このように、同じ原文であっても、翻訳先言語の文法のルールによって訳文が変わる可能性があります。
まとめ
翻訳業界では翻訳作業の効率を図るために、CATツールを導入しています。CATツールは翻訳メモリと連携し、蓄積された過去の翻訳実績を再利用できます。
翻訳対象テキストと翻訳メモリの一致はマッチと呼ばれ、CATツールで解析を行うと、マッチ率のパーセンテージによって、翻訳メモリをどれぐらい再利用できるかが分かります。
マッチ率の中に、100%マッチとコンテキストマッチがあります。100%マッチは原文と翻訳メモリが完全に一致していることを示し、コンテキストマッチはそのセグメントだけでなく前後の文も翻訳メモリと一致しています。これらは再利用できる可能性が高くなります。
100%マッチやコンテキストマッチは、翻訳費用を削減するために翻訳対象から外すことも可能ですが、注意が必要です。
川村インターナショナルのサービス
川村インターナショナルでは、IT・ローカリゼーション、医療機器・医薬、観光・インバウンド、製造業、金融・ビジネス・法務、SAP 関連文書など、幅広い分野の翻訳を扱っております。お客様の業種・専門分野に応じて最適な翻訳者が対応いたします。弊社の審査基準をクリアした、経験豊富なプロの翻訳者ですので、品質の面でもご安心ください。
翻訳会社への翻訳依頼をご検討されている方は、お気軽にご相談ください。
関連記事