ハッブル宇宙望遠鏡の有名な測定ハッブルディープフィールド(HDF) [wikipedia.org]はwikipediaにあるように極めて慎重に観測領域を選定されました。同ページにあるようにHDFの画像は正方形がやや欠損した視野のサンプルを得ています。天文学者は10年以上この画像を元に深宇宙について考察しました。 ISAAC [iop.org]というカメラでとられた同じ領域の新しい画像があります。HDFの観測領域が白枠で示されています。ひとめで分かるように、ハッブルの測定は天体の数が多いところを不幸にも偶然観測していたのです。これによって銀河の数の分布の見積もりは大幅な修正が必要になりました。
研究者さぼりすぎ (スコア:1, 興味深い)
>世界の牧草地308か所の写真に写っていた牛8510頭を調べた結果、大半が北か南を向いていた。
>その方位を平均すると、地軸の南北より、少しずれた地磁気の南北に近かった。
どう考えても牛は8510頭以上写ってるし、牧草地は308箇所以上ある。
きっと手作業でやって途中で飽きたか満足してしまったんだろうな。
Re:研究者さぼりすぎ (スコア:3, すばらしい洞察)
例えば内閣の支持率を調べるのに日本人全員からアンケートを取る必要はありません。
日本の場合は1000人とか2000人ですね。
母集団の数と最終的に求める精度からサンプル数を決定する手法は、統計学では基礎の基礎です。
http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/index.html [gunma-u.ac.jp]
そもそも、論文が学会誌に掲載されるためには査読というプロセスを通過する必要があります。
素人が直感で思いつくような問題点が残っている論文は査読に通りません。
Re:研究者さぼりすぎ (スコア:3, 参考になる)
>例えば内閣の支持率を調べるのに日本人全員からアンケートを取る必要はありません。
>日本の場合は1000人とか2000人ですね。
>母集団の数と最終的に求める精度からサンプル数を決定する手法は、統計学では基礎の基礎です。
このような測定は、一様にランダムにサンプルがとれることが前提条件として必要です。例えば、山間部、都市部、あるいは首相の出身県にサンプルが偏ってしまえば結果は全く異なったものになるでしょう。たまたま内閣支持率の場合、国民を電話帳からかなりランダムに選べる。それですら、報道各社の発表する数字には1割近い誤差が発生することもあるわけです。
ハッブル宇宙望遠鏡の有名な測定ハッブルディープフィールド(HDF) [wikipedia.org]はwikipediaにあるように極めて慎重に観測領域を選定されました。同ページにあるようにHDFの画像は正方形がやや欠損した視野のサンプルを得ています。天文学者は10年以上この画像を元に深宇宙について考察しました。
ISAAC [iop.org]というカメラでとられた同じ領域の新しい画像があります。HDFの観測領域が白枠で示されています。ひとめで分かるように、ハッブルの測定は天体の数が多いところを不幸にも偶然観測していたのです。これによって銀河の数の分布の見積もりは大幅な修正が必要になりました。
このような例からわかるように、サンプルを無バイアスで選ぶというのは困難で、(ハッブル宇宙望遠鏡の場合は観測時間コストという制約をうけてやむをえず狭い領域の観測になった結果として深刻なエラーを生んだわけで)、できるなら測定者は全数をサンプルしたいものです。牛をカウントするのにGoogleEarthを使う魅力は、はじめて全地球規模の全数に近い牛を(ちょっと頑張れば全自動で)サンプルできることです。この魅力的な素材を前にして8000頭強の見えやすくて餌場や水場から遠い平らなところにいる牛だけを選びましたというのはなんかもったいないように思う。
でも自分でやりたいとは思いません。。。。
情報系の学部の演習課題としては面白いかも
Re:研究者さぼりすぎ (スコア:2, すばらしい洞察)
というのは個人的にも賛成ですが、サンプル数とか一様性というのはやはりその分野の人間なら誰でも知っている話で、
そんな条件すらクリアしていない論文が査読に通るとはとても思えないです。
本文ありました。
http://www.pnas.org/content/early/2008/08/22/0803650105.full.pdf [pnas.org]
これを見ると、場所と時刻に多様性を持たせたサンプリングをしている旨が記述されていますね。
母数は分からないのですがなんとも言えないので、ちょっとアジアが少ないような気はしますね。
これ以上の数を調べるなら、おっしゃるとおりに画像処理を用いないと厳しいでしょうが、
おそらくこの研究グループは画像系の研究をしているわけではないのだと思いますよ。
もしかするとこのネタを見て情報系の人たちがチャレンジするかもしれませんね。
Re: (スコア:0)
問題は、人間から見えにくい所に行くと東西を向くのですか?という事でしょう。
サンプルバイアスを調べるなら、サブサンプルとサンプルに含まれない集団を幾つか持ってきて比較すれば良いのでは。
そこから結果を外挿するのは至極まっとうな推論だと思います。
査読に通るというのは、そのような検証方法を帯びている"可能性の高い"論文だという事ですから
とりあえず一定の信頼から始めても良いのでは (勿論当該論文の検証方法の検証が必要というか全てですが)
まあ査読者含めて皆馬鹿という可能性もありますから、権威のある論文誌に載ったというだけで
無条件にその論文を信奉してしまうのは、どう考えても間違った態度ですね。
論文は教科書でも聖書でもありませんし。
Re: (スコア:0)
そこまでサンプリングについて分かっていながら「さぼりすぎ」とまでお書きになるというのは解せませんね。
#1411590のコメントでは「なんかもったいないように思う」と書かれていますが、「さぼりすぎ」というのは「なんかもったいない」などというよりはるかに強い批判と考えますので、ちょっとコメントさせてもらいます。
# 論文の査読で「さぼりすぎ」と判断されれば、通常はrejectではないでしょうか。
# よくて「実験を追加して再投稿」くらいでは。
結局は「想定される限り完全な研究しか受け入れられない」という主張のように取れるのですが、それはハードル
Re:研究者さぼりすぎ (スコア:1)
僕がこの問題に挑戦するならば、、
------
GoogleEarthのデータはある時点で70TBほどだったそうです。でもこの研究の対象とする牛を探索したいならば、70TBもダウンロードする必要はないんです。
ここ [google-earth-travel.net]には世界最大の牧場があるそうなのですが、牛がいることはわかっても牛がどっちを向いているのか判定するのは不可能です。というわけで、第一段階の探索で、GoogleEarthから高解像度の画像が含まれているエリアに絞り込みます。
↑実はこの段階で研究の前提は破綻している。このような方法で、地磁気との因果関係が示せるとも思えないけど、、、
↑因果関係がなくても相関関係はでるからね。
一方で、牛の向きを決定するならば、GoogleEarthの最大解像度なデータは不必要だということも分かります。たとえば、GoogleMapで牛を探すとこんな感じ [google.co.jp]で牛の耳の向きまで見えるようなデータも含まれています。これが70TBの正体です。最大の牧場 [google-earth-travel.net]のイメージ程度の解像度で、(1)牛らしきものが判定できて、(2)その1段階程度拡大するとかなりの確度で牛であることがわかり、(3)もう二段階拡大すると明らかに向きを決定できるでしょう。でも実際のデータはその10倍以上の解像度まで存在しています。
(1)や(2)の画像で、牛らしきものがいないエリアを排除すれば、おそらく牛のいない場所は排除できるでしょう。このときダウンロードしなければならないデータは解像度が低いのでごく僅かです。この段階で面積率で1万分の1以下になるでしょう(地上をまっすぐに100mあるいて1m以上の牛に平均一度以上衝突しないと仮定)。さらに最大解像度まで10倍以上(データサイズにして100倍以上)の開きがあります。したがって次の段階でダウンロードしなければならないデータは70TBのうちの百万分の一程度、すなわち7MB程度です。
画像処理がうまくいかなくて牛じゃない何かを牛の1000倍ヒットしたとしても、7GB程度になります。
そのデータを10倍拡大してダウンロードして70GB、そこから牛じゃない何かを削除したら700MB
その段階で牛飼いを発見! [google-earth-travel.net]して凹んだりするかもしれないけど、
実際のところ、ほとんどの牛は人間様が飼育しているから、人間に強くかかわっていそうなサンプルを消したら(人工の構造物に囲まれているなど)1割以下に絞り込める。こうやって絞り込んだ数十MBのデータを5人くらいで一ヶ月よってたかってチェックして明らかな異常データを撥ねたら計算機で牛の向きを計算する。
----
そりゃぁ実際には技術的な困難がでてくるだろうけど、最初っから無理だと決め付けなくてもいいと思う。
情報系の学生の課題としては重くない。
Re: (スコア:0)
この件については、電話帳に番号を載せるような人であるとか、電話調査が行われる時刻帯に在宅するような生業であるというバイアスがかかってると思うんですが、どう考慮されているんでしょうかね?
自営業、専業主婦、高齢者、無業者が多そうな気がするんですが。
Re: (スコア:0)
Re:研究者さぼりすぎ (スコア:1, おもしろおかしい)
なにを無粋な。
ここは素人が直感で論文を否定するサイトじゃないですか。
似たような例、過去に何度も見かけましたよ?
Re: (スコア:0)
地理的な南北じゃなくて地磁気的な南北に向いてるね。すごいね。っていう論文だろうに、極軌道の衛星だからとか午前中の航空写真だからとか南向きで日当たりいいからとか。マジでここには文盲しかいないの?
Re: (スコア:0)
リンク先を読む IT リテラシーも本文を読む識字率も、平均すれば実にお粗末なものです。
Re: (スコア:0)
Re: (スコア:0)
♪ト~リ~ビ~ア~~
Re:研究者さぼりすぎ (スコア:1, おもしろおかしい)
Re: (スコア:0)
Re: (スコア:0)