新しい翻訳サービスの精度が良いと話題になっていました。
それは「DeepL」という翻訳サービスです。
ブラインドテストでは、オンラインで使える様々な翻訳システムで訳した文章とDeepL翻訳で訳した文章を並べ、翻訳システムの名前を伏せた状態で日本語と中国語の翻訳者に示し、それぞれ評価してもらいました。DeepLの翻訳が他よりも優れているとして選ばれる頻度が最も高いという結果になりました。
紹介記事
IT系の各メディアでDeepLが紹介されていますね。
DeepL翻訳はドイツに本拠を置く企業によって開発された、機械学習を用いた人工知能による翻訳システムです。以前から英語・オランダ語・フランス語・ドイツ語・イタリア語・ポーランド語・ポルトガル語・ロシア語・スペイン語などの言語に対応していましたが、2020年3月19日から日本語と中国語にも対応したと発表されました。
新しい翻訳サービス「DeepL」がその精度の高さで話題になっている。Google翻訳はもちろん、「みらい翻訳」にも匹敵するのではないかともっぱらの評判だ。
テキスト入力だけでなく、Microsoft WordやPowerPointの文書などをドラッグ&ドロップして翻訳することも可能。PCに専用アプリ(Windows/macOS)をダウンロードすると、キーボードのショートカットキー(WindowsならCtrl+C)を2回押すだけで翻訳できる。
“DeepL翻訳”は、同社のWebサイトで無償で利用可能。有償プラン“DeepL Pro”(個人利用の場合、年額5.99ユーロより)に登録すれば、オンライン翻訳の文字数制限がなくなるほか、送信されたテキストを訳文を届けると同時に破棄する機密性保持機能や、月5つまでオフィス文書を丸ごと翻訳するサービスなどを利用できる。
DeepL Translator の教訓
深層学習は極めてデータドリブンな技術です.「シェアードタスクだと成功するが手持ちのスモールデータだと失敗する」というは誰しも味わう経験だと思います.Andrew Ng 先生はインタビュー記事で「こんにちの深層学習は大規模データが得られる領域でしか真価を発揮しない」と発言しています.
DeepL は Linguee という対訳文検索エンジンからクロールした大規模・高品質なデータセットを用いて翻訳モデルを訓練しています.
このように機械翻訳では大規模・高品質な学習データがモデルの性能を著しく向上させます.
DeepL Translator
深層学習はデータ量とマシンパワーで殴るのが正解?
DeepL Translator の開発元は対訳文検索エンジン Linguee (2009~) を運営しており,Linguee からクロールした 10 億文で訓練している.大規模コーパスだと言われる WMT'14 英仏 3000 万文,英独 450 万文と比べても非常に巨大な訓練データである.
また,5.1 petaFLOPS (世界ランキング 23 位相当) のスパコンを所有している (PFN の 1024 GPU よりも高火力).すごい.
まとめ
高性能な翻訳サービスがいろいろ使えるようになってきました。
- Google翻訳 https://translate.google.co.jp/
- みらい翻訳 https://miraitranslate.com/trial/
- DeepL翻訳 https://www.deepl.com/translator
翻訳サービスをうまく活用して、日本語だけでなく外国語でも情報発信していきたいです。