したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

各種イノベーション・新発明・新技術など

431とはずがたり:2017/03/06(月) 22:19:41
>>430-431
 これに代わってIBMが1980年代に開発を始め、近年急速に普及したのが「統計翻訳」と呼ばれるビッグデータを活用した翻訳だ。対訳のデータを大量に集めて統計処理することで、翻訳規則や翻訳辞書に相当する翻訳モデルを自動的に作成する。典型的なAI技術だ。

 例えば「どこですか」という日本語を英語にする場合。「どこですか」という言葉が含まれるものには、Could you direct me to Kyoto station?(京都駅はどこですか)、Where is the station?(駅はどこですか)、Where is the rest room?(トイレはどこですか)、Where is the taxi stand?(タクシー乗り場はどこですか)、Where am I?(ここはどこですか)――などの例がある。この場合「Where is」が5例中3回(60%)、「Could you direct me to」が同1回(20%)、「Where am」が同1回(20%)の割合で表れる。

 大量の対訳例をもとにこうした「確率付きの対訳辞書」を自動的に作製し、これをもとに翻訳結果を決める。日英で語順が変わるかどうかや、ある単語の次にどんな単語が来ることが多いかなども学習する。学習する対訳データが多いほど翻訳の精度が向上する。

 統計翻訳は多くの言語に対応できるのも特徴だ。統計翻訳では言語の文法や単語の意味を知らなくても対訳データさえ集めれば翻訳モデルが短時間で自動的につくれる。NICTが無償公開している自動音声翻訳システム「ボイストラ」は日英独仏や中国語はもとよりミャンマー語など31言語に対応している。従来のルール翻訳では、言語ごとに1つずつ翻訳ルールを専門家が何年もかけてつくっていた。

■さらに進化、脳を模した「ニューラルネット翻訳」に

 昨年、統計翻訳をさらに進化させた翻訳技術がウェブ上で使えるようになった。グーグルとマイクロソフトはそれぞれ、脳の働きを模したニューラルネットワーク(神経回路網)による翻訳技術を開発。ネットで利用できる「グーグル翻訳」や「マイクロソフト・トランスレーター」として公開した。

 新方式も統計翻訳と同様に大量の対訳データを学習して翻訳モデルをつくる。ただ統計翻訳のように文のパーツごとに翻訳するのではなく、文単位で文脈を把握することでより適切な訳語を見つける。グーグルは統計翻訳による従来法と比べ翻訳エラーを平均60%減らせたとしている。ネット上では「グーグル翻訳の精度が目立って上がった」といった声が寄せられた。

 ニューラルネット翻訳は京都大学など国内勢も研究を進めており、NICTも導入の時期を探っている。2020年の東京五輪や観光立国などで外国語を使う機会は増えるが、日本人にとって言葉の壁は依然として厚い。だが、進化する機械翻訳システムを使うことで外国語でのコミュニケーションが格段に容易になる時代が見えてきた。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板