したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

PC関連スレ

719とはずがたり:2008/10/12(日) 14:24:59
自民党とインテルとマイクロソフトと巨人と東京と兎角一番手が嫌いな俺はIEもIMEも使わない様にしてるが最近のIMEは酷いんですかね?ATOKは概ね快適であるが時々IMEに自動で切り替わってしまい苛々する。

MS IMEさらに...お馬鹿になっていく
http://furukawablog.spaces.live.com/blog/cns!156823E649BD3714!9079.entry

某MS社員に、「MS IME最近どうなっているのよ?」と先週聞いた答えが...「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......個人的にはATOKに切り替えようと思っている」と言う現役開発系社員の発言に絶句!!! 

コメント欄より

そんなことはないようです。
Microsoft Research でサマーインターンを経験した方のブログには
次のように書かれています。
http://www.smalltown.ne.jp/~usata/diary/?date=20080218#p03
> 根本的には(まだ準備が整っていないのに)完全に統計的な手法に
> スイッチしてしまったのが今回の問題の原因であると思っている。
http://www.smalltown.ne.jp/~usata/diary/?date=20080217#c02
> MS-IME の開発は中国主体ですが、日本の人も関わっているし、
> シアトルの MSR の(日本人の)研究者も関わっていますよ。

ということで、かな漢字変換モデルを変更したことが
精度低下の原因のようです。
(一部しか抜粋していないのでリンク先をご覧ください)

統計的手法によるかな漢字変換では、
1. 文章を数GB以上集める
Google が大規模日本語データを公開しています。
http://googlejapan.blogspot.com/2007/11/n-gram.html
2. どの性質の単語がどの性質の単語と結びつきやすいかを
算出して辞書を作る
こうしてできた辞書を基にかな漢字変換を行います。

この方式のいいところは、
・辞書を手作業で編集する必要がない
・日本語に限らずどの言語でも同じ方式でシステムを構築することができる
(大量の文章と単語切り分けシステムがあれば辞書を構築できる)
ということです。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板