![バイオテック バイオテック](https://srad.jp/static/topics/biotech_64.png)
DNAを記録メディアにする試み 36
ストーリー by hylom
そのDNAはどこに保存するのだろうか 部門より
そのDNAはどこに保存するのだろうか 部門より
あるAnonymous Coward 曰く、
人間のDNAを使ってデータを記録するというネタは昔からあるが、それが本当に実現しそうだ。CNETの記事によれば、わずか1mgのDNAに米国議会図書館の全書籍のデータをエンコードでき、それでもまだ十分な空きが残るという。ただ人間の生体の場合、変化や不安定性といった問題があるという。そこで、ハーバード大学のGeorge Church氏が率いる科学者グループは、より丈夫な合成DNAを生成し、そこにデータを記録する方法を考えついた。
この合成されたDNAは、インクジェットプリンタによって小さなガラス製チップに噴きつけられる。DNAはアデニン(A)、グアニン(G)、シトシン(C)、チミン(T)の4種類の塩基から成り、これら塩基の配列が遺伝情報を決定する。このため、データは通常の0と1の羅列ではなく、A、G、C、Tの4種類のアルファベットを使ったDNAの言語に変換されるという。実験ではエラー率は100万ビット中わずか2件という素晴らしい結果になったとしている
むしろこのサイト的に (スコア:3, 参考になる)
話題となって良いのは,記録された情報が「JavaScriptとjpegを含むhtml」という点では無いかと.単なるテキストじゃなくなったあたり,時代の変化ですかね.
#まあ,記録しちゃえば所詮はただのビットなわけですが.
なお実験では,1塩基につき4bit(AGCTを全て別情報として扱う)では無く,あえて2bit(AとC,GとTは同じ情報として扱う)にしてるそうです.
こうすると,場合に応じてCの代わりにAを使う,というような自由度が出てくるので,外れにくいG-Cの組が沢山ある配列(書き込み・読み込みが困難)を避けるだとか,2次構造が変な構造になるのを防ぐ(塩基対を適宜入れ替えることで2次構造をある程度制御出来るようになる)とかいろいろ出来るようになって便利だからだそうです.
Re:むしろこのサイト的に (スコア:4, 興味深い)
# 1塩基につき、2bitではなく1bitですね。(4種類全部使える場合は2bit)
それにしても、記事には DNA: The Ultimate Hard Drive [sciencemag.org] と書いてありますが、DNA は Hard なのだろうか…。
物理的な固さだけでなく媒体の特性的にも、Ultimate Hard Drive というよりは「究極のテープライブラリ」に近い印象を受けますね。ランダムアクセスできるようになればいいんですが、さすがに難しいか。
Re:むしろこのサイト的に (スコア:1)
>1塩基につき、2bitではなく1bitですね。
うわ……素で間違えた.ご指摘ありがとうございます.
#論文にも1bitってちゃんと書いてあるのになんで間違えてるんだか.
>ランダムアクセス
何をおっしゃいますか.このストレージはランダムアクセスですよ!
#多数の断片として蓄えるので,文字通りランダムにしか読めない.
草薙少佐が (スコア:2)
永世小学六年生神アイドル支持者(バランス取らなくっちゃなぁっ!!)
DeNAを記録メディアにする試み (スコア:1)
記録情報:最下位
保存できても (スコア:0)
複製しないと意味がないんじゃない?
複製法は既に確立されている (スコア:0)
ポリメラーゼ連鎖反応 [wikipedia.org]
エラーレート (スコア:0)
10e-6 だと、記録媒体としては並じゃない?
Re:エラーレート (スコア:1)
エラー訂正駆使しないと使い物にならないのは光学メディアやHDDも同じでは?
Re:エラーレート (スコア:2, 興味深い)
キリ番おめ。
Re: (スコア:0)
Re: (スコア:0)
記念真紀子
Re: (スコア:0)
ここにいたか。
キリ番探すためだけに10トピックぐらい探しちゃったよ。
Re: (スコア:0)
記録媒体には詳しくないので素な質問ですが,最初に実験した時点でそのエラーレートを実現してるのは「並」なのでしょうか?
保存環境とか (スコア:0)
ちょっと考えただけですが
カビに弱い
紫外線に弱い
乾燥に弱い
コンタミに弱い
ライタ/リーダーが高価
実用的になにかいいことあるのかな
実生物にステガノグラフィするとか?
Re:保存環境とか (スコア:4, 参考になる)
一応著者の主張としては,
・最大のメリットはビット密度
現時点で1016bit / mm3を達成しており,HDDなどより数桁高い
弱点に対しては,
・データは重複した多数のDNA断片に納められるので,多少の変異やエンコードミスは問題にならない.
(データを細かく分割してアドレス情報を納めたヘッダとともに短いDNAにエンコード,各断片は多数のコピーを作ってまとめて保管している)
・リーダ&ライタは今はそこそこ高価だが,単位読み取り速度あたりのコストは年に1/5から1/12と半導体などに比べても劇的な低コスト化が続いており,もうしばらく待てばきっと問題にならなくなる.実際,ハンドヘルドサイズの単分子DNA読み取り機の実現も見えてきている.
(願望は入っているが,実現してもおかしくはない)
とかそんな主張みたいです.
Re: (スコア:0)
だから、比較的安価なインクジェットプリンタで、ガラス上に塗布したという話なのでは?
安くないよ! (スコア:3, 参考になる)
これアジレントの装置ですけど,そんなに安くはなかったと思います.
いやまあ,以前の手法に比べれば安いですし,著者も書いてるように将来的には劇的に安くなる可能性はありますが.
使用するのは以下のようなものです.
インクカートリッジ
・合成DNAの元になる塩基(を含む分子)4種類
・合成反応に使う酸化剤
・各塩基には必要なときだけ反応するように保護基が付いているので,それを外す脱保護剤
基板
・合成DNAの最初の一文字がくっつけられたアレイ
合成の手順としては確か,
1. 基盤に対し脱保護剤を射出(末端塩基の保護基が外れる)
2. 次の塩基を射出(カップリング反応が起こり,DNAが一文字伸びる)
3. 酸化剤を射出(反応しやすい状態だったリン原子を,正常な酸化数に戻す)
を,必要な長さになるまでループで回します.
この「必要な薬剤各種を,アレイ中の狙ったセルに少量射出する」と言う部分がインクジェット方式になってます.
Re: (スコア:0)
じゃあ次はクマムシに保存する方法を考えようか。
Re: (スコア:0)
脱走されてデータ流出とか.
ショウジョウバエとか飛翔生命体に埋め込むと拡散も速そうですな.
Re: (スコア:0)
脳内に一部埋め込んで生体メモリとして活用とかなったら未来のような世界ですねぇ。
無理でしょうが。w
Re: (スコア:0)
それより、飲み込んだら自動的に脳内に情報がインプットされるような仕組みを…
あれ、暗記パンだな。
Re: (スコア:0)
本物のウィルスを合成するコンピュータウィルス、なんてのもできるかも。
Re: (スコア:0)
あかんで。それ、リ・・。
悪夢 (スコア:0)
ヒトのDNAにはジャンク領域がたくさんあって、何に使われてるかわからないのですが、この手の情報がエンコードされてたら、楽しいですね。
他の究極の記録メディアとしては、光速度やプランク定数、円周率や自然対数の底があります。
読み出し方法は確立してますので、書き込み方法の開発が急がれます。
Re: (スコア:0)
> 他の究極の記録メディアとしては、光速度やプランク定数、円周率や自然対数の底があります。
> 読み出し方法は確立してますので、書き込み方法の開発が急がれます。
すでにあらゆるデータが書き込み済みですので、書き込みの必要はありません。
将来発明されるすごい装置の設計図も、将来はやる歌のデータも、すべて入っています。
ただし、インデクシングの技術がまだ開発されていません。
また、インデックスデータそのものが、少なくとも元のデータと同じくらいの情報量になるはずなので、
それをどのような記録メディアに記録するか、という問題もあります。
Re: (スコア:0)
>この手の情報がエンコードされてたら、楽しいですね。
こういうの [srad.jp]ですか?
Re: (スコア:0)
>ヒトのDNAにはジャンク領域がたくさんあって、何に使われてるかわからないのですが、この手の情報がエンコードされてたら、楽しいですね。
もしジャンク領域に書き込めるなら、なにか歴史的に意味のある文明の記録でも残しておけばいいのではないだろうか。
何百万年か暗黒時代を経験してすっかり人類の文明が失われていたとしても、
パズルのピースを集めるようにして元のデータが復元できるかも知れない。
そしてある日、
「厳正なる抽選の結果、人類保管委員会は貴君のジャンクDNA領域に松坂季実子AV全集を保存することを決定しました」
米国議会図書館の全書籍のデータ? (スコア:0)
米国議会図書館の全書籍のデータが何バイトかわからないけど、
わずか1mgのDNAに余裕で記録できるとかよくわからない。
1mgでどの位の塩基の配列が存在するのか?
Re: (スコア:0)
ググってみたら沢山出てくるのにみんな容量が違い結局どれくらいなのか判らなかった。
そらどんどん増えていくんだから当然と言えば当然だけど
てか米国では東京ドーム何個分的に使われているっぽく見えるけど
どんどん増えて行くものを単位として使うのはどうなの…
# 進捗状況は横浜駅の完成度くらいです的な
Re: (スコア:0)
横浜駅っていつ開業するんだろー
Re: (スコア:0)
塩基対の分子量が650-700ぐらい。
実際にはこれにくっついてる水分子とか居るんだけど、それを無視して大雑把によく使うのが、10億塩基対で1ピコグラム、って換算。
(650[g]/アボガドロ数 * 10億 ~ 1pg)
そうすると1mgは10^9pgだから、塩基対の数で10億の9桁上で……100京塩基対?
1塩基対あたり今回の手法は1bitらしいから、そうすると1エクサビット?
(実際にはアドレスビットとかいろいろ入るみたいだからもっと少ないんだろうけど)
Re: (スコア:0)
つまり、バイト換算だと、ざっくりPBオーダー程度だな。
米国議会図書館の全書籍のデータにはテキストだけでなく画像もあるけど、その程度のものなのか。
あと、10年くらいすれば個人PCのHDD?の容量もそれくらいになったるかも。
OSインストールで数TBで、ビデオや音楽で数PB。
生命の起源 (スコア:0)
地球外知的生命体の残した「エロ画像」データ
だったりしたらヤだな・・・。
「人間のDNAを使ってデータを記録する」 (スコア:0)
「人間の・・・」って断る意味あるのか?
Re: (スコア:0)
生きた人間にデータを埋め込む場合、複製が大変だな