memoQ 統計機能を掘り下げる

日々memoQを使用してプロジェクトのハンドリングを行っている筆者ですが、翻訳会社でPMを担当している方々にとって、使用頻度の多い機能といえばファイルの解析機能ではないでしょうか。

翻訳支援ツール(CATツール)には翻訳対象のファイルのボリュームやマッチ率を把握するための解析機能がついています。高い機能性を誇るCATツールのmemoQ。解析機能にも色々な設定がありますが、なんとなく初期設定のままで使ってしまっている人も意外と多いのではないでしょうか。(筆者もそうでした..)

今回は、memoQの解析機能について、掘り下げていきたいと思います。うまく使いこなせば、見積もりの精度アップや作業の効率化に繋がる機能があるかもしれません。是非最後まで読んでみてください。

目次

  1. 解析結果を理解しよう
    ・範囲
    ・総数
    ・単語数
    ・単語数/文字数中でのタグ
    ・分析
  2. まとめ

解析結果を理解しよう

プロジェクトホームで、解析したいファイルを選択し、統計ボタンを押します。

統計画面が表示されます。

エリアごとにみていきましょう。 

範囲解析をかける範囲を指定します。

  • プロジェクト
    o プロジェクトに含まれている全てのファイルを解析します
     
  • 選択した文書
    o 選択されたファイルのみ解析します
     
  • 開いている文書
    o エディタ上で開いているファイルを全て解析します
     
  • アクティブな文書
    o 編集中のファイルを解析します
     
  • カーソル以降
    o 編集中のファイルで、カーソル以降を解析します
     
  • 選択
    o 選択したセグメントのみ解析します
     
  • ビューで使用
    oビューを解析します

総数

  • カウントを表示
    o 翻訳メモリの解析結果とは別に、セグメント・ワード・文字の総数を表示します
  • 進捗レポート
    o 解析範囲のなかで、確定済み・編集中・未作業等のセグメントをステータス別にカウントします
     
  • ターゲットの数も含める
    o 訳文セグメントの文字数/ワード数をカウントします

単語数

  • memoQ
    o memoQのカウント基準で解析します(通常はこちらにチェックを入れます)
     
  • TRADOS 2007 スタイル
    o SDL Trados 2007のカウント基準で解析します

単語数/文字数中でのタグ

  • タグの加重
    o 翻訳対象がタグを多数含んでおり、タグもカウントに含めたい場合などに使用します。例えば「0.25単語」とすると、1タグ=0.25ワードとカウントされます。「2文字」とすると、1タグ=2文字としてカウントされます

分析

  • プロジェクトTMと資料
    o プロジェクトに設定されているすべての翻訳メモリやLiveDocsを使ってマッチ率を解析します
     
  • ソース単位での詳細
    o 翻訳メモリやLiveDocsごとにマッチ率を解析します
     
  • 均一性
    o 解析対象の中の類似セグメントのマッチ率を結果に含めます(インターナルファジー)
    [均一性]チェック無し


    [均一性]チェックあり
     
    原文の中にどれくらい似たようなセグメントがあるか知りたい場合に使う機能です。
     
  •  プロジェクト翻訳メモリを作成

    o プロジェクトに設定されている翻訳メモリやLiveDocsの中から、マッチしたセグメントを集めて新しい翻訳メモリを作成します
     

  •  加重カウント表示
     o 文字/ワード数の横にワークロードを表示します。ワークロードを計算する際の傾斜は[加重]に表示されます。(変更することも可能)

     

  • ロックされた行を含める
    o  ロックされたセグメントもカウントします
     

  • 文字数カウントに空白文字を含める

    o   スペースもカウントします
     

  • 繰り返しを100%一致よりも優先
    o 「繰り返し」且つ「100%マッチ」のセグメントがある場合、「繰り返し」としてカウントします。具体的には、以下の条件に当てはまるセグメントが「繰り返し」としてカウントされます。

    ・繰り返しのセグメントである
    ・2回目以降の繰り返しである
    ・TMマッチ率が100%である

    [繰り返しを100%一致よりも優先]チェック無し

     
    [繰り返しを100%一致よりも優先]チェックあり

     100%マッチのセグメントのうち、繰り返しである18セグメントが、「繰り返し」としてカウントされています。

     

  • クロスファイル繰り返し
     o   複数のファイル間での繰り返しを表示します

まとめ

解析結果の項目を見ていきましたが、いかがでしょうか。設定をうまく利用することで、様々なケースに対応できると思います。

  • 翻訳メモリごとに、ワークロードを出したい
  • 複数ファイルを一人の翻訳者で作業するので、ファイル間の類似・繰り返しを出したい
  • プロジェクトを軽くするために、複数の大きな翻訳メモリからプロジェクト用のメモリを作りたい
  • プロジェクト全体の進捗が見たい

など、様々なシーンで役に立つこと間違いなしの統計機能。今回の記事をきっかけに、少しでも活かしていただければ幸いです。


フィードバックフォーム
当サイトで検証してほしいこと、記事にしてほしい題材などありましたら、
下のフィードバックフォームよりお気軽にお知らせ下さい!
例えば・・・
CATツールを自社に導入したいが、どれを選べばいいか分からないのでオススメを教えてほしい。
機械翻訳と人手翻訳、どちらを選ぶべきかわからない。
翻訳会社に提案された「用語集作成」ってどんなメリットがあるの?
ご意見ご要望をお待ちしております!
新着記事一覧
JSAマーク
ISO17100
JSAT 007

認証範囲:
金融・経済・法務、IT、医療・医薬、電気 ・機械、航空宇宙分野の技術翻訳サービス 及びソフトウェアローカリゼーション
SGS_ISO-IEC_27001_with_ISMS-AC
※当社では、ISO17100に準拠した翻訳サービスを提供可能です。
準拠サービスをご希望の場合は、ご依頼時にお申し付けください。