
CERNがLHCの観測データ300TBを公開 16
ストーリー by hylom
解析してみよう 部門より
解析してみよう 部門より
あるAnonymous Coward 曰く、
CERNが、大型ハドロン衝突型加速器(LHC)による観測データ300TB分を公開した(TechCrunch、CERNの発表)。公開はCERNのopendataサイトで行われている。
また、データを解析するためのツールについても同時に公開されている模様。
300TBは一度には必要無い (スコア:2)
生データが300TBだけ有った所で、人間に何か分かる筈もない。
膨大なデータを処理・集計して、せいぜい1kB程度に纏めてやっと「何か」が理解出来るだろう。
で、処理のスループット分のデータ供給速度が有れば十分。ローカルに全データを置いて何度も参照する様な処理アルゴリズムだと、多分まともな時間では終わらないと思われる。
そもそも、一回の衝突で多数の検出器から得たデータが一塊として提供されている様なので、衝突を個別に解析して纏めたデータをローカルに保存する様な解析手段しか実用性が無いんじゃないかな。
一回の衝突解析に要する時間は、多分ダウンロード速度よりも遥かに長いと推測されるから、データが擬似ストリーミング的に供給されてるだけで十分だと思う。
寧ろ、欲しい部分のデータだけを取得出来る様な形態で提供されてるかの方が重要かなと思ったり。
-- Buy It When You Found It --
Re: (スコア:0)
下手にやるとゴチャゴチャうるさい奴がいるから全部まとめて提供してるという可能性
300 TB のデータを格納できるストレージがない (スコア:1)
Re:300 TB のデータを格納できるストレージがない (スコア:1)
ストレージを用意したとして、ダウンロードは何日かかりますか?
Re:300 TB のデータを格納できるストレージがない (スコア:1)
秋葉原に行けばほぼ直結のところがあるのでは
#それはSERN
Re: (スコア:0)
LHC<圧縮してから送っていいですか?
# そしてゲル状の何かがSAN値直送
Re: (スコア:0)
LHCのデータ圧縮用に開発されたツールがLHarcである。(民明書房刊「データ圧縮技術のすべて」より)
Re: (スコア:0)
ラウンダー<IBN5100持ってるってことでいいんだな?
# ブラウン管は好きですか?
Re:300 TB のデータを格納できるストレージがない (スコア:1)
10Mbpsでダウンロードすると、おおよそ8年。
1Gbpsなら1ヵ月くらい。
Re: (スコア:0)
何GBの磁気テープを鞄につめて飛行機で運ぶと何bpsとか書いてあったような。
懐かしいネタを思い出した。
http://www.amazon.co.jp/dp/4621043005 [amazon.co.jp]
Re: (スコア:0)
似たようなので
https://what-if.xkcd.com/31/ [xkcd.com]
レイテンシが1日ある代わりにバンド幅は177Pbps出せるという話。
Re: (スコア:0)
SNAP [engadget.com]も似たようなやつですね。
ジョークRFCにもあります。 [wikipedia.org]
Re:300 TB のデータを格納できるストレージがない (スコア:1)
10TBのHDDが、個人でも用意できるようになったので、ニアライン向けなのはがまんして30台用意できれば格納できるのだから、たいした障壁では無いはず
Re: (スコア:0)
ここで調べたら100TB/月が$2239.99だった
https://www.mediafire.com/upgrade/index.php?plan=Pro#space [mediafire.com]
Re: (スコア:0)
できない理由を探しているようでは面接に着ていく服が無いというニートと同じだぞ。
Re:300 TB のデータを格納できるストレージがない (スコア:1)