Webデータ自動対訳作成サービス
CorpusNow


翻訳費用の低減・機械翻訳エンジンの構築に役立つ対訳データの作成

CorpusNowは、インターネット上の多言語Webサイトから、自動で対訳データを作成するサービスです。Webサイトからテキスト情報をスクレイピングし、原文と訳文を対のデータとして整形します。
※スクレイピング:特定のデータから余分な情報を除去し、必要な情報のみを抽出すること。

対訳データからできること

翻訳業務の効率化、コスト削減
翻訳メモリを作成
自社専用の機械翻訳エンジン構築
機械学習用の教師データの作成
自社Webサイトの分析用
自然言語処理用のデータ作成

こんな方におすすめのサービスです

  • 翻訳メモリを作成して翻訳コストを削減したい
  • 自社サイトを活用して専用の機械翻訳エンジンを作りたい
  • 多言語データを解析してグローバル市場を把握したい

【資料】データはスクレイピングすることで、こんなことに役立ちます!

翻訳費用の削減や、翻訳の質の向上につながるデータを作成する、AI・アノテーションサービスの具体的な活用例をまとめた資料です。
データの活用例を本資料にまとめました。​ ​主な内容はこちら。
活用例1: スキャニングした報告書から情報を抽出したい​
活用例2: 翻訳が必要な箇所を精査したい​
活用例3: インターネットの声をマーケティングに生かしたい​
問い合わせをする前にまずは資料を。という方はお気軽にご請求ください。
競合他社様および個人メールアドレスの方の資料請求はお断りすることがございます。
あらかじめご了承の程よろしくお願い申し上げます。

CorpusNowの特長

CorpusNowのご利用の流れ

01 収集対象を検討

収集対象のWebサイトが、スクレイピング/クローリングを許可しているかを確認します。禁止されているWebページは除外します。
※収集対象が未定の場合、弊社で選定するオプションもございます。

02 テキストのスクレイピング

各言語のWebサイトからテキストデータをスクレイピングします。対訳としたい言語のURLをそれぞれご指定ください(日本語と英語、あるいは英語と中国語の組み合わせなど)。

03 対訳データの作成

収集したテキストデータを対訳データとして整合します。整合したデータは独自の品質評価ロジックを用いて一定以上の評価指標以上のもののみ保存します。

04 納品

対訳データは、将来の翻訳費用の低減を可能にする翻訳メモリ(TM)や、機械翻訳エンジンをトレーニングするための教師データに加工できます。また、自然言語処理などの解析処理をご希望の場合など、お客様の要望に応じた形式で納品します。

よくある質問

翻訳メモリとはなんですか?

自社の保有するテキストデータを原文と翻訳文を一対としてデータベース化したもので、翻訳にかかる費用を低減することができます。CorpusNowでは、日本語と英語以外の翻訳メモリ作成も可能です。

どのようなデータ形式で納品いただけますか?

Excel形式、TSV/CSV、TMXなど、ご要望に応じたデータ形式での納品が可能です。まずはお問い合わせください。

他社のWebサイトからテキスト情報をスクレイピングするのは可能ですか?

はい、可能です。ただし、サイト上でスクレイピングが禁止されている場合には利用できません。また、著作権法で定められた用途以外での利用はできません。

機械翻訳エンジンのカスタマイズの支援は可能ですか?

はい、可能です。弊社ではGoogle AutoML、Globalese、Microsoft Custom Translator、みんなの自動翻訳@KIなどを利用した機械翻訳エンジンのカスタマイズが可能です。また、弊社の提供ソリューション「XMAT」では、教師データの作成からエンジンカスタマイズ、機械翻訳の利用まで、一気通貫でご利用いただくことも可能です。

Webサイト以外のデータを対訳データの形にすることは可能ですか?

はい、可能です。WordやPPTなどのMicrosoft Office形式のファイルや、HTML、XML、テキストデータなどを対訳データの形式にすることが可能です。お気軽にお問い合わせください。

費用の目安を教えてください。

20万ワードの対訳データ作成を10万円からご提供しております。アラインするボリュームが増えるにつれて費用も低減いたします。詳しくは、お問合せください。

翻訳サービスをお探しの方は、お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください。
商品紹介、ノウハウ集などの資料を
こちらからダウンロードできます。
JSAマーク
ISO17100/JSAT 007
認証範囲:
以下の翻訳サービス(英日・日英)
①金融・経済・法務
②医療・医薬
③工学・科学技術
SGS_ISO-IEC_27001_with_ISMS-AC
※当社では、ISO17100に準拠した翻訳サービスを提供可能です。
準拠サービスをご希望の場合は、ご依頼時にお申し付けください。