空腹は最高のタレです

近ごろは英語が苦手でも、ブラウザーのボタンをプチッと押せば英米Webページから情報を仕入れられる。バルセロナやパリの公共機関が発信する話だって読める。けどあまりにも不自然な日本語のため、つい原文に戻してしまい、めまいを覚える。

機械翻訳の精度は相当に向上した。とはいえ、一般的な技術である統計翻訳(SMT)では、たとえば"Hunger is the best sauce."が、「空腹であれば。」と翻訳され、読み手や聞き手は、「誰が!」とか「何を!」と突っ込みを入れたくなる。昨年2,400万人を突破し今年もすでに1,100万人超の訪日客(政府観光局資料より)を全国各地で受け入れている今日、ディープラーニング(深層学習)技術の一種である、ニューラルネットワーク(模擬脳神経回路網)を用いた機械翻訳の実用技術を、情報通信研究機構(NICT)の先進的音声翻訳研究開発推進センターが開発した。

総務省の「多言語音声翻訳技術の研究開発」における社会実証用コーパスの構築の成果を用いた。今回の実用技術では、「単語とその訳語及びそのクラス(意味分類)」を利用する手法を実装し、ニューラル機械翻訳(NMT)技術を用いることにより、従来のSMT技術に比べ、精度が大幅に向上。9割前後の翻訳精度を達成していて、上記英文を、「空腹は最高のタレです。」と訳した。

"Yes, you can't take a reserved taxi or a pickup taxi."を、「はい貸切タクシーや送迎タクシーはご利用いただけません。」と、自然な日本語に翻訳している。NMT技術を組み込んだ多言語音声翻訳アプリ「VoiceTra」は、Google PlayおよびApp Storeで入手可能だ。

NICTは今回の技術について、NMTに特徴的な誤訳の解決を目指すとともに、全10言語をカバーできるよう順次開発を進めるという。