成 果:川村インターナショナルが自社開発したツールにより対訳データを自動で作成し、それをもとに当社の経験豊富な担当者が翻訳メモリを作成しました。
成 果:お客様から提供いただいた翻訳済み技術資料をもとに、川村インターナショナルが持つ機械翻訳の知識と技術を駆使して学習データと用語集を作成し、お客様専用のカスタム翻訳エンジンを生成しました。
Q. どのようなデータから対訳集(コーパス)や用語集が作成できますか。
A. Microsoft Office文書、PDF、画像、音声など、テキストデータに変換できるものなら、対訳集や用語集を作成できます。原文や訳文のどちらかしかなくても、対訳集や用語集の作成が可能な場合がありますので、ご相談ください。
Q. 対訳集を作成するには、どのくらいの量のデータが必要ですか。
A. 現在主流となっているニューラル機械翻訳では、おおむね1万ペア未満の対訳集を学習させると、訳文の品質が低下することが多いです。ただし、弊社が提供している「みんなの自動翻訳@KI」では、ニューラル機械翻訳と用例ベース機械翻訳のハイブリッドを使用しているため、対訳数が少なくても品質の低下がありません。
Q. 手動翻訳用と機械翻訳用の用語集にはどのような違いがありますか。
A. 手動翻訳用の用語集は、翻訳者が見て適用の可否を判断するので、用語に注釈をつけることにより、文脈に応じた訳し分けなどが可能です。一方、機械翻訳用の用語集は、機械的に置き換えられるので、注釈などを含めることができません。また、機械翻訳の場合、一般的な用語が用語集に含まれていると、用語集を適用することによって訳文の品質が低下します。