アカウント名:
パスワード:
よくある監視カメラの映像からも盗聴(?)ができるようになるかもしれない、というのがこの研究の趣旨ですかね。
> 毎秒60フレームの撮影能力を持つ普通のデジタルカメラでも、一定の高周波振動の情報は推察できるとのこと
映像フレーム数が落ちたら、低周波振動しか推察できなくなるんじゃないのかな?
ローリングシャッター現象を逆手に取ることで、フレームレート以上の周波数の振動を観察するらしいです。
折り返し雑音から元の振動を推定するんですね。
映像だと音声の折り返し雑音より情報量増えるのかしら。
>映像だと音声の折り返し雑音より情報量増えるのかしら。
原理的には増やすのは難しい気がしますがどうですかね
人間の音声を聞き分けるには3kHzくらいの帯域があるといいと言われていまして>毎秒2000~6000フレーム撮れるハイスピードカメラこのカメラのフレームレートは最大3kHzくらいの帯域が取れるようにサンプリングしましょうという前提で決められたんでしょう。声を聞くという目的だと割と理にかなったフレームレートですよね
一方、60spsから音声を再構築するとなると、ほとんどあてずっぽうに近くなりますが人の声しかない、という前提なら何とか出来きなくもないか、な?
音はサラウンドとかを気にせず純粋に振幅だけをみれば空間的には一次元で、CDでも分解能は16ビットとかです。翻って、動画は二次元映像の情報で16ビットどころでは済まない大量の情報です。ですから、音に必要な時間分解能が100倍足りなくても、もともと映像が持っている情報量は100倍では利かないほどありますから、シミュレーションの逆演算で何とかなる、って話ですね。16ビットまでは戻せなくても、数十〜数百段階で十分音っぽいわけですし。
秒速300メートルの音が1/60秒間に進む距離は5メートルです。ですから、被写体の大きさが10メートルくらいあれば、音の先端と音の末端の与える影響が被写体に入りきるので、「現在の音」から「1/60秒前の音」までを連続的に再現シミュレーションできる、って話ですね。被写体が10センチくらいなら、その原理では難しいですが、実際には、反射や余韻が被写体を動かしているから、被写体自体の音速や特性などから推測できる、ということでしょう。
情報量そのもので下回っていない限り、空間分解能を使って時間分解能を補うのは理論的に可能で、そのアルゴリズムを組んでみたら、大した手間もかけずに意外と実用性がありそうだ、ってことでしょう。
全くの門外漢ですが、モーショントラッキングの応用的な気がしますね。8つの特徴点の振動する動きの度合いから3次元空間における位相を推定して再合成みたいな。いや憶測でデタラメ言ってるだけですが。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
マイクロ波を使った同様の盗聴装置(?)は聞いたことあるけど (スコア:0)
よくある監視カメラの映像からも盗聴(?)ができるようになるかもしれない、というのがこの研究の趣旨ですかね。
> 毎秒60フレームの撮影能力を持つ普通のデジタルカメラでも、一定の高周波振動の情報は推察できるとのこと
映像フレーム数が落ちたら、低周波振動しか推察できなくなるんじゃないのかな?
Re: (スコア:0)
ローリングシャッター現象を逆手に取ることで、フレームレート以上の周波数の振動を観察するらしいです。
折り返し雑音 (スコア:2)
折り返し雑音から元の振動を推定するんですね。
映像だと音声の折り返し雑音より情報量増えるのかしら。
Re: (スコア:0)
>映像だと音声の折り返し雑音より情報量増えるのかしら。
原理的には増やすのは難しい気がしますがどうですかね
人間の音声を聞き分けるには3kHzくらいの帯域があるといいと言われていまして
>毎秒2000~6000フレーム撮れるハイスピードカメラ
このカメラのフレームレートは最大3kHzくらいの帯域が取れるようにサンプリングしましょうという前提で
決められたんでしょう。声を聞くという目的だと割と理にかなったフレームレートですよね
一方、60spsから音声を再構築するとなると、ほとんどあてずっぽうに近くなりますが
人の声しかない、という前提なら何とか出来きなくもないか、な?
Re:折り返し雑音 (スコア:1)
音はサラウンドとかを気にせず純粋に振幅だけをみれば空間的には一次元で、CDでも分解能は16ビットとかです。翻って、動画は二次元映像の情報で16ビットどころでは済まない大量の情報です。ですから、音に必要な時間分解能が100倍足りなくても、もともと映像が持っている情報量は100倍では利かないほどありますから、シミュレーションの逆演算で何とかなる、って話ですね。16ビットまでは戻せなくても、数十〜数百段階で十分音っぽいわけですし。
秒速300メートルの音が1/60秒間に進む距離は5メートルです。ですから、被写体の大きさが10メートルくらいあれば、音の先端と音の末端の与える影響が被写体に入りきるので、「現在の音」から「1/60秒前の音」までを連続的に再現シミュレーションできる、って話ですね。被写体が10センチくらいなら、その原理では難しいですが、実際には、反射や余韻が被写体を動かしているから、被写体自体の音速や特性などから推測できる、ということでしょう。
情報量そのもので下回っていない限り、空間分解能を使って時間分解能を補うのは理論的に可能で、そのアルゴリズムを組んでみたら、大した手間もかけずに意外と実用性がありそうだ、ってことでしょう。
Re: (スコア:0)
全くの門外漢ですが、モーショントラッキングの応用的な気がしますね。
8つの特徴点の振動する動きの度合いから3次元空間における位相を推定して再合成みたいな。
いや憶測でデタラメ言ってるだけですが。