![テクノロジー テクノロジー](https://srad.jp/static/topics/technology_64.png)
GitHubでDNA情報が公開される 32
ストーリー by hylom
mergeできません 部門より
mergeできません 部門より
あるAnonymous Coward 曰く、
Manu Spornyという人物が2月13日、自分の遺伝子情報を GitHubに公開した。
同氏のブログに貼られたREADMEによると、コンピュータ技術者とバイオエンジニア向けの試験用データに利用される事を期待してパブリックドメインで公開しているようだ。
そもそも、遺伝子情報をバージョン管理する意義はあるのだろうか?
みんなでつついて (スコア:3, 参考になる)
よりよい遺伝子情報にしてください
Ver 1.1 ○○を修正してManu Spornyの寿命を5年延長しました
Ver 1.2 ○○を修正して細胞の癌化率を10%低減しました
Ver 1.3 ○○を追加して頭部における毛髪の減少を低減しました
みたいな感じ
ウイルス (スコア:2)
ウイルス感染歴とか。
Re:ウイルス (スコア:1)
コメントの履歴管理では? (スコア:2)
そういった、情報を付加していって欲しいのでは?
具体的に、Gitでそれが可能か否か、私は知らないのですが。
Diff (スコア:2, 興味深い)
許可 (スコア:2, すばらしい洞察)
公開にあたって、製造元の許可は取ったのだろうか。
Ver.2 (スコア:1)
子供ができたら Ver.2 として公開し,第2子が生まれると Ver.2.1 として公開するとか.
Re:Ver.2 (スコア:2, おもしろおかしい)
>>そもそも、遺伝子情報をバージョン管理する意義はあるのだろうか?
>子供ができたら Ver.2 として公開し,第2子が生まれると Ver.2.1 として公開するとか.
/trunk -- 本妻
/branches -- * 愛z^H^H^H大人の駆け引き *
/tags -- * 携帯電話やスマートフォン等の連絡先アドレス *
==========================================
投稿処理前プレビュー確認後書込処理検証処理前反映可否確認処理後……
Re: (スコア:0)
気がついたら /trunk 以下に自分のコードが含まれていませんでした。
どうすれば……
Re:Ver.2 (スコア:2)
僕のバージョンは4.9だな。
親(4.1)よりも出来が悪いから。
4.9: WindowsME
4.1: Windows98,98SE
# でもMeタンほど可愛くはない。
Re:Ver.2 (スコア:1)
Re: (スコア:0)
畜産分野の方が系統管理の点で進んでるのは当然だと思うけど?
ヒトの遺伝情報利用はまだまだこれからだし悲嘆することないよ
Re: (スコア:0)
Re:Ver.2 (スコア:2)
テスト用でない正統な遺伝子があるなら発現形を是非見てみたい
言ってないことに反論するなよ
Re:Ver.2 (スコア:1)
バージョンに負数があってはいけないと誰が決めた?
なお、バーチャル妻(夫)との間にできた子供は、虚数だな。
きっと、虚数バージョン同士掛け合わせれば、実に戻れるかも知れない。
# なんの話だ。
Re: (スコア:0)
Re: (スコア:0)
わが子は二世ではなくVer2.0 [srad.jp]
マジレス (スコア:1)
> そもそも、遺伝子情報をバージョン管理する意義はあるのだろうか?
真面目に答えますと,アノテーションデータがアップデートされれば情報の更新はありえます.
今回公開されたデータはDNA配列全体ではなくて,個人の特徴を示すSNP 100万箇所のデータです.
それらは既に報告されている,「ヒト間で違いのある場所」で,これを元に病気に罹患しやすいかどうかを判定する
ことも(理論的には)できますが,元の参照情報の方がアップデートされれば,ゲノム上の位置が違ったり
別のものとされていたものが同じものに統合されたり,本当はヒトの配列でなかったりといったことも
ないわけではありません.
また,今回の情報の有用性ですが,通常ゲノム情報は個人から取得するにはいろいろと情報管理で
厳しい制限もありますし,学生が簡単に自分のデータを読めるほどには安価でないということから,
自由かつ無料で使えるので,学生の学習用にはよいのではないかと思いました.
データ構造,ファイルフォーマット,データの規模や規則性が本番そのものなので,現実のヒトの
情報に合わせたランダムデータをつくるよりよほど効率的になります.
#Manu Sporny氏がこの先病気になったときにその情報も公開してもらえば更に便利に.
kaho
Re:マジレス (スコア:1)
自分にがんが見つかったら、毎日組織サンプルを取って、それぞれ全ゲノムをシーケンシングして、変異箇所をトレースできるようにするとか…
…してくれたら尊敬するなぁ。
#お金はすっごいかかるけど。
ゲノム情報はアップデートされ続けます (スコア:1)
注釈には部分配列の遺伝子名やその機能の情報を記してあります。
ゲノム内にはまだまだ機能のわかっていない部分が大量にありますので、それを付加し続ける限りはバージョンは上がり続けることになります。
リファレンスとなるNCBIなどにあるヒトゲノム配列との変異部位に関しても加えていけば、いくらでもバージョンアップの余地があります。
また、ゲノム配列は一般的にはwhole-genome shotgun法によって読み取られます。
これは、大量の細胞から抽出したDNAを超音波などで適度なサイズ(数百~数千塩基対)にバラして重複は気にせずにとにかく読みまくってから、プログラムでオーバーラップを検出して染色体1本の連続した配列を復元するという手法です。
そのため、全ゲノムよりもずっと多くの塩基を読まなくてはなりません。
ヒトゲノムの場合は既存のゲノムがあるので、それを参考にマッピングすることになります(既知ゲノムがない場合はもっと大変です)。
普通はプログラムに全部おまかせでは一発で完全な染色体セットができず、与えるオプションを試行錯誤したりさらに配列を追加したり、手作業で修正したりします。
ですから、配列部分もdraftからバージョンアップしていってようやく完成します。
というわけで、バージョン管理する意義は十分あるでしょう。
というか、おそらく実際にゲノムプロジェクト内でバージョン管理システムを使っているところはあるんじゃないでしょうか。
Re:ゲノム情報はアップデートされ続けます (スコア:2, 参考になる)
>また、ゲノム配列は一般的にはwhole-genome shotgun法によって読み取られます。
今回のものはIlluminaのBeadChip [illumina.com]を使って読み取られていますので配列の解読は行っていません.
READMEを最後まで読んでみたところ23andMe [23andme.com]のサービスを使っているようですね.
>おそらく実際にゲノムプロジェクト内でバージョン管理システムを使っているところはあるんじゃないでしょうか。
当然バージョン管理はしていますがSVNやらGitやらの意味でのバージョン管理システムは使えません.
多数のファイルの差分を記録するというモデルのものでは1塩基が挿入されただけでそれ以降の配列を全て差分として
記録しなければならないので現実的ではないからです.
BACクローンごとにユニークなIDを振って,データの改善があるごとにバージョンを新しくして別ファイルとして管理し,
アセンブリ情報はまた別に管理し(こちらには所謂バージョン管理システムは利用可能です),最終的なDNA配列情報は
それらを結合して都度出力となります.
kaho
Re:ゲノム情報はアップデートされ続けます (スコア:2, 興味深い)
ちょうど次世代シーケンサが出力したデータのアセンブルに取り組んでいたことも影響してしまいました。
そうすると、本人の表現型や病歴の情報が含まれていないとあまり役に立たないのでは・・・。
中身を見たところ、そのような情報はないようです。
既知のマーカーのデータは本人には役立つでしょうけど、何も新しいものが得られませんよね。
表現型や病歴(今後のだけじゃなくて過去のも)があればSNPと照らし合わせてSNPと何かの相関が新たにわかるかもしれないのに。
名前が特定できることより、名前は特定できないけど表現型や病歴がわかっている方がはるかに有益なんですけど。
とは言え、サンプルデータとしては確かにそれなりに使えそうです。
それにしてもジェノタイプはどうやって判定しているんだろうか。
BeadChipキットをよく知らないのですが、同じSNPを何度も読んでヘテロを検出する方式でしょうか。
Re:ゲノム情報はアップデートされ続けます (スコア:1)
> それにしてもジェノタイプはどうやって判定しているんだろうか。
> BeadChipキットをよく知らないのですが、同じSNPを何度も読んでヘテロを検出する方式でしょうか。
釈迦に説法的かとは思いますがIlluminaによる論文 [nature.com]のArray Designにあるように
2つのSNP型に一致する塩基配列を持ったのビーズを用意しておいてそれぞれの蛍光強度をAとBとしたとき,
theta =(2/pi) arctan(B/A)
の値が0付近ならAA, 0.5付近ならAB, 1付近ならBBと判定しているということです.
つまり一つのアリル当たり2つのビーズを用意して,入力サンプル内のDNA量を測定する方法です.
CNVが多いような場合は判定ができなくなりますので,重複が多そうな完全にガン化したような細胞には使いづらいですが,
23AndMeのように唾液を採取したり血液から染色体を調整するような場合はうまくいくと思います.
kaho
遺伝子情報をバージョン管理する意義 (スコア:0)
Re: (スコア:0)
誰かコンパイラもフリーで提供してくれないか。 (スコア:0)
ソースがあってもコンパイラーがないのでコンパイル出来ないんだ('・ω・`)
しかし、そもそものソースも相当な歯抜けになってる気がするんだけど気のせいかな?
つまりこれは (スコア:0)
なんだってー!(AA略
公開する場合、情報継承元の許可は…?(ネタ) (スコア:0)
遺伝子は究極の個人情報である、という観点に立つと、
公開する前には情報の継承元(両親やそのまた両親・・・・)の許可が必要なんだろうか?
遺伝子コンテンツの構成要素の半分は父親、もう半分は母親で、どうマッシュアップしたかの部分のみが
本人のオリジナル要素である、と。
#特許や著作権は関係ないんだろうけどね。
Re: (スコア:0)
アダムはappleを食べていたので、少なくともGPLではなさそうだ。
奴は24MBの価値しかないのか (スコア:0)
Re:奴は24MBの価値しかないのか (スコア:1)
あくまで初期パラメータですからね。
現在のレベルとかスキルとか装備とか現在位置とかアイテム所持数とかは抜きです。
「ヒトの価値」と言ったら多くはその後から付いて来る方が重要だったりするんじゃないですかね。
#家柄や国籍や親の七光りも含まれてませんね
部門 (スコア:0)
が、がんばって...!