アカウント名:
パスワード:
京のFFT性能が明らかになったら、ぜひ地球シミュレータと比較して溜飲を下げてください#工学系の人間にとって、FFTの遅いスパコンなんてスパコンじゃない
FFTは全空間通信がいるので超並列系には普通向いてません。アルゴリズム的にFFTを使わない形で、定式化そのものを見直す方向の方がこの手の超並列の世界だと一般です。端的にはK空間から実空間へ。もう少しマシな並列性能をたたき出せるFFTもアルゴリズムの段階からいろいろと考案されてますが、でもやっぱりFFTはFFT。超並列のボトルネックです。やっぱ、京の性能の神髄は超並列にあるので、いまさらFFTと言われても困る。そういう人は別のスケールの計算機を使う。ベクトルを使う。そこいらの棲み分け、超並列が必要な研究(有効な研究と)そうでない研究を分けないと。工学系というくくりは大きすぎてわけがわからんです。ベクトルにはベクトル。スカラーな超並列には超並列です。なんでもかんでも京に群がると、京の意味が無い。
FFTが早くないとスパーコンピュータという感じがしないのですが,(どっちかというとPCクラスタのように思える)FFTを使わないようにアルゴリズムを変えるわけですか。確かにそうできる分野もあるのでしょうが,FFTが絶対に必要な分野があるのなら,ベクトル機の開発が止まりそうなのは結構ピンチ?(本当はベクトルとの複合機だったんですよね。)
>K空間から実空間へなのに名前が Kei という...
仮にES2の10倍のノード性能でも8TFlopsなので、10PFlopsには1250ノード必要。ESの時は640ノード全結合でしたが、8TFlopsに見合った通信速度で1000ノードの全結合はかなり厳しく、スカラーよりましとはいえ全空間通信は問題になるのでは。
ということは,ES2の100倍のノード性能をだせれば,125ノードでOKなんんですよね。125ノードならいけるかも。
それはともかく単段クロスバーにこだわらなくてもいいと思う。ES2だって単段クロスバーではなく,ファットツリーだけれど,FFTでは実は今でも世界一の演算速度。
なのでぜひNECにはES3を開発して10PFを目指して,FFT世界最速を守って欲しいな。ES2は65nmなので, 30nmで作ればワンチップ4コアくらいは余裕?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー
複雑 (スコア:2, 興味深い)
同時に、自分たちの仕事を完遂できなかったのが残念で、悔しいです。
へたれなんでACでしか言えない。
Re: (スコア:0)
京のFFT性能が明らかになったら、ぜひ地球シミュレータと比較して溜飲を下げてください
#工学系の人間にとって、FFTの遅いスパコンなんてスパコンじゃない
Re: (スコア:3, 参考になる)
FFTは全空間通信がいるので超並列系には普通向いてません。アルゴリズム的にFFTを使わない形で、定式化そのものを見直す方向の方がこの手の超並列の世界だと一般です。端的にはK空間から実空間へ。もう少しマシな並列性能をたたき出せるFFTもアルゴリズムの段階からいろいろと考案されてますが、でもやっぱりFFTはFFT。超並列のボトルネックです。やっぱ、京の性能の神髄は超並列にあるので、いまさらFFTと言われても困る。そういう人は別のスケールの計算機を使う。ベクトルを使う。そこいらの棲み分け、超並列が必要な研究(有効な研究と)そうでない研究を分けないと。工学系というくくりは大きすぎてわけがわからんです。ベクトルにはベクトル。スカラーな超並列には超並列です。なんでもかんでも京に群がると、京の意味が無い。
Re: (スコア:0)
FFTが早くないとスパーコンピュータという感じがしないのですが,
(どっちかというとPCクラスタのように思える)
FFTを使わないようにアルゴリズムを変えるわけですか。
確かにそうできる分野もあるのでしょうが,FFTが絶対に必要な分野があるのなら,
ベクトル機の開発が止まりそうなのは結構ピンチ?
(本当はベクトルとの複合機だったんですよね。)
>K空間から実空間へ
なのに名前が Kei という...
Re:複雑 (スコア:0)
仮にES2の10倍のノード性能でも8TFlopsなので、10PFlopsには1250ノード必要。ESの時は640ノード全結合でしたが、8TFlopsに見合った通信速度で1000ノードの全結合はかなり厳しく、スカラーよりましとはいえ全空間通信は問題になるのでは。
Re: (スコア:0)
ということは,ES2の100倍のノード性能をだせれば,125ノードでOKなんんですよね。
125ノードならいけるかも。
それはともかく単段クロスバーにこだわらなくてもいいと思う。
ES2だって単段クロスバーではなく,ファットツリーだけれど,FFTでは実は今でも世界一の演算速度。
なのでぜひNECにはES3を開発して10PFを目指して,FFT世界最速を守って欲しいな。
ES2は65nmなので, 30nmで作ればワンチップ4コアくらいは余裕?