レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
おちゃめくらぶ掲示板
-
Llano登場でGPGPUがいよいよ普及する・・・?
昨日書いた次世代のデュアルコアNanoにもCPUにGPU機能を内蔵しているように今後のCPUの
トレンドはCPUにGPU(およびノースブリッジ)の機能を内蔵することにょ。
昔はGPUを内蔵するのはほぼ低価格化のためだけだったけど現在は省電力化と性能向上が
主な狙いとなっているにょ。
その中でも一番の注目はやはりIntelが来年初頭に発売予定のSandyBridgeにょ。
Intelの場合は1年ごとに製造プロセスと新アーキテクチャの導入とという「チックタック
モデル」を導入しているにょ。
ムーアの法則では2年ごとに製造プロセスは√2分の1に微細化(同一ダイサイズであれば
2倍のトランジスタを搭載可能)となっており、2年ごとに新アーキテクチャの導入と
製造プロセスを同時に行うという方法もあるけどそれをせず新アーキテクチャの導入と
微細化の年をずらしているのはリスク軽減のためにょ。
実際新アーキテクチャを導入したPrescottコアのPen4は微細化を同時に行って失敗して
しまったわけだしね。
9月15日に書いたようにSandyBridgeは256bitのAVXを備えているというのが一番のウリだけど
それだけではなくGPU性能も大幅に向上しているにょ。
SandyBridgeは現在のArrandle/Clarkdaleと同じく45nmプロセスで製造されるため大幅な
性能向上は難しいはずだけど現在はCPUコアとGPUが内蔵されているノースブリッジは
同一パッケージ内にあるもののCPUコアが32nm、ノースブリッジが45nmという別々のダイで
構成されているためそれが32nmとなることで実質1世代分の性能向上が期待できるからにょ。
そのSandyBridgeに対抗するべく登場するのがAMDの「Llano」にょ。
http://pc.watch.impress.co.jp/docs/column/kaigai/20101104_404182.html
ダイサイズはSandyBridgeとほぼ同クラスだけど両者を見比べるとその設計思想の違いが
見えてきてなかなか興味深いにょ。
http://pc.watch.impress.co.jp/img/pcw/docs/404/182/html/05.jpg.html
ダイの写真を見るとCPUコア、およびL2に関してはSandyBridgeの方が大きいけどGPUコアに
関しては別格のサイズ差があるにょ。
それもそのはず、LlanoにはGPUはSP数が400程度と予想されているからね。
しかも、SandyBridgeに内蔵のGPUがDirectX10止まりの対応なのに対してLlanoに内蔵の
GPUはDirectX11に対応となっているにょ。
Llanoの「DirectX11に対応」「400sp」というスペックを元にするとGPU性能はRADEON HD5570
クラスと考えることができるにょ。
これは統合型チップセット(およびCPU内蔵GPU)では過去最高レベルの性能になるにょ。
MacBook AirにはSP数48という統合型チップセットとしては現在最強となるGeForce 320Mが
搭載ということで3D性能はIntel製の統合型チップセットと比べて別格の性能を出していた
けれどそれをさらに大きく上回るということにょ。
GeForceとRADEONではアーキテクチャが全く異なるためSP数では性能比較はできない(同一
アーキテクチャであれば性能比較の1つの指標にはなる)ということで同じSP数48となる
GeForce GT220と比較してみるにょ。
http://www.4gamer.net/games/098/G009886/20100208044/
GT220とHD5570を比較してみるとHD5570の方がワンランク上と感じるけどそこまで大きな
差はないにょ。
しかし、いくらAirに搭載さいれているGeForce 320MがGT220と同じSP数48といっても
コアクロックが625MHz→450MHz、シェーダクロックが1360MHz→950MHzと下げられており
何よりノースブリッジ経由でないとアクセスできないというのが大きなボトルネックに
なっているにょ。
http://pc.watch.impress.co.jp/img/pcw/docs/402/484/html/13gpu.jpg.html
Llanoに内蔵されているGPUがHD5570と比べてどれだけ下げられているのか分からないけど
仮に450MHzまで下げられていたとしても最大のボトルネックが緩和されているため320Mと
比べて1.5〜2倍程度の性能になるのではないかと思うにょ。
ローエンドの単体GPUに相当する性能を内蔵したチップセットは過去に多く存在するけど
実際はローエンド以下でしかなかったのに対してLlanoはまさにローエンドGPU並の性能の
GPUをCPUに内蔵しているということがいえそうにょ。
決して高性能ではないけど最新の3Dゲームであっても設定を落とせば普通にプレイできる
レベルの性能はあるからね。(現在の一般的なPC用3Dゲームを普通にプレイしたければ
GeForce 8800GTクラスは必要だからそこまでくるとさすがにゲームをしない人にとっては
オーバースペックになる)
ゲームだけではなく多くのアプリがGPU対応になっているため高性能なGPUはアプリ動作
速度向上にも繋がってくるにょ。
これはWindows普及期(3.1〜95)の頃にGDI性能を競い合って上げていたのに近い状態では
ないかと思われるにょ。
当時はGPU性能(というかGDI性能)で体感速度は大きく変わっていたからね。
AMDがCPUにこれほどまでに高性能なGPUを内蔵する理由はベクトル演算用のためではないか
と思われるにょ。
IntelはSandyBridgeでAVXを搭載したけどAVXはSSEと同じくその新命令を使い、新命令に
対応したCPUでそれを動作時に初めて活用できるからね。
SSEはPen3に初めて搭載されて以降多くのCPUに搭載されており、今となっては必須と
言っても過言ではないものにょ。(というか、今時SSEを非搭載のCPUを現役として使って
いる人の方がほとんどないだろうけど)
しかし、MMXやSSEというSIMD命令はそれのためにPC(CPU)を買い換えるというものではなく
それが搭載されたCPUが普及し対応アプリが増えて初めて価値があるからね。
http://pc.watch.impress.co.jp/docs/2009/0105/hot586.htm
AVXがいくら優れていようと新命令を使わないと性能を発揮できないのであればGPGPUと
比べてアドバンテージは何もないにょ。
では、まずGPGPUはなぜ普及しないのか・・・?
それは対応アプリ作成側の問題にょ。
すでに普及が進んでいるSSEを使った開発環境とは異なりGPGPUとしてはAMDより1歩も2歩も
先を行くnVidiaもまだまだ十分とはいえない状況にょ。
それだけではなくやはり重要なのは当たり前のことだけどGPGPUには対応GPUが必要になる
ということにょ。
GPGPUはDirectX10でようやくまともに機能し始めDirectX11でようやく本格スタートすると
見込まれているけどDirectX11対応のGPUがどれだけ普及しているかということを考えると
GPGPUが普及していなくても当然にょ。
しかも、SSEとは異なりGPGPUの場合はGPUメーカーによって全く設計思想が異なるため
互換性がないという問題(CPUで言えばSSEに対するAMDの3D Nowみたいなものであり両者に
互換性はない)があるからね。
実はこの互換性問題が厄介にょ。
CUDAの場合は基本的に後方互換性が取られているとはいえ完全なものではないにょ。
それにGPGPUの場合は搭載しているSP数も考慮して対応アプリを作る必要があるにょ。
CPUで例えるならばデュアルコア用、クアッドコア用と別々に作るような感じにょ。
CUDAの場合はCUDAドライバで対応しているとはいえパフォーマンスを引き出すのは簡単な
ものではないにょ。
スパコンに多くのGPUを搭載しそれ専用のアプリを作るというのであれば何ら困ることは
ないけどPCに搭載のGPUは仕様が異なるものが氾濫しすぎているため難しいというのが
GPGPUの普及を遅らせている原因ではないかと思われるにょ。
それならばGPGPUを普及させるには一定の性能を持つ同一アーキテクチャのGPUが普及
させれば良いだけの話にょ。
それにはCPUに搭載するのが最も近道にょ。
Llanoは「GPGPUに使えるレベル」(フルに使えばCPUでSIMD命令を実行するより圧倒的に
高速となるレベル)のGPUをCPUに内蔵しているためAVX今からを普及させなくてはならない
Intelと比べて十分アドバンテージがあるにょ。
とはいえIntelのCPUの方が圧倒的に多く売れるだろうから実際はAVXの方が早く普及する
だろうけど同じくGPGPUを進めたいnVidiaにとってはこれはピンチにょ。
確かにGPGPUの現時点での普及率はnVidiaの方が上だけどnVidiaの場合はCPUを作ってない
ために単体GPUを買ってもらわないといけないという最大の問題があるからにょ。
数量ベースで最も売れるであろうチップセット内蔵GPUに関してもIntel、AMDの両者が
GPU内蔵のCPUを販売するため単体GPUのみが頼りになるにょ。
その単体GPUも(旧機種からのアップグレードを除けば)ローエンドの単体GPU並の性能を
持つLlanoによってローエンドGPU市場で厳しくなってしまうにょ。
ミドルクラス〜ハイエンドは金額的には大きくても数量的にはそれほど多くないため
nVidiaはGPGPUの普及においてAMDに追い抜かれる可能性が高くなったと考えられるにょ。
残念ながらAMDのGPUはnVidiaのCUDA対応GPUと比べてGPGPUの使い勝手が良いとはいえない
けど「普及したもの勝ち」だからね。
実際、このシェアは存続においてかなり厳しい状況であるためx86市場では生き残れず
ARMに活路を見いだしているくらいにょ。
http://pc.watch.impress.co.jp/docs/column/ubiq/20100924_395960.html
また、GPGPUにとっては最大の問題はレイテンシにょ。
GPUだけでアプリケーションを動作させることができずCPUとの連携が必須になるわけだけど
これがCPUにGPUが内蔵されることで大幅にレイテンシを減少させることが可能になるため
GPGPUがより効果的に活用(実効性能の向上)できるようになるにょ。
このようにLlanoはCPU性能でIntelに対してやや劣っているため1つのウリとしてGPU性能を
高めたというだけではなく多方向をにらんで強化されたものだと推測されるにょ。
|
|
掲示板管理者へ連絡
無料レンタル掲示板