SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Downloaden Sie, um offline zu lesen
自宅でできるゲノム研究
―DDBJ/GenBank/ENA―
有田 正規
国立遺伝学研究所
arita@nig.ac.jp
生物学を、自宅でできる時代
DIYBio.org
(do it yourself)
欧米を中心に、部活動の
感覚で分子生物学を学ぶ
コミュニティ活動
遺伝子情報のおおくは、
インターネットで入手可能。
「ゲノムデータは無償公開」
という大前提があって初め
て、実現。
なぜ無料?
研究者が努力したから。
(もとは税金)
生命 = 物理化学 + 情報
生物学ときくと、野外で生物を観察したり、顕微鏡で
微生物を観察しているイメージがありませんか?
いまの医療やゲノム科学の多くは、 「コンピュータ
解析」が中心です。
木原生物学研究所のウェブサイトより
データベースの国際連携
DNA配列の 「登録」 がとても重要な作業。
登録して 「アクセッション番号」 を受け取らないと、
研究論文を発表できない。(研究者の義務)
配列は公開、だれでも使える。
DNA Data Bank of Japan (DDBJ)
GenBank, EMBL データベースと連携した、3極構造
の一つとして 1986 年に発足、翌年から稼働。
International Nucleotide Sequence Database
Collaborationという枠組みで
・次世代シーケンスデータ
・DNA配列
・生物試料(Biosample)、計画
情報(Bioproject)などを共有
データサイズ
注釈のない生データは、
ペタバイト級
登録される生物種
B bp
X線結晶解析で初めて
立体構造がわかった
タンパク質
(Perutz, Kendrew 1959)
筋肉に酸素を運ぶ, ミオグロビン
8本のアルファヘリックス
血液で酸素を運ぶ, ヘモグロビン
アルファとベータ鎖が4量体を形成
テーマ:Globin
化合物ヘムに
酸素がつく
ケンドリュー
ペルーツ
ヘモ、ミオグロビンの違い
いずれも、グロビンフォールドと
呼ばれる8本のαヘリックスを持つ。
ヘモグロビンは4量体
http://ptgl.uni-frankfurt.de/motif_overview.php
ヘモグロビンを検索してみよう
PDBj では、日本語で検索できる (1buw)
ヘモグロビンと入力
Hemoglobinの配列を検索する
Human beta hemoglobin mRNA と入力
検索結果
2000件以上もヒット
1, 2, 3番とも病気の配列
がヒットしてくる。
(説明付き)
ファイル形式を選べる
クリックして遺伝子情報へ。
FastA形式にすると、配列
だけを取り出せる。
検索結果の絞込み
ARSAでは高度な検索方法が使えます。
AND、OR、NOT の利用
“ ” でくくったフレーズ
ワイルドカード
(実はGoogle検索でも使える)
DNAからアミノ酸へ
検索結果の FEATURES 欄で、CDS (coding sequence)
とあるのがアミノ酸配列です。
DNA … ATGC の4文字
アミノ酸 … 20文字 (比較が面倒!)
Beta hemoglobin (disease type) Phe 42 Leu
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFLESFGDLSTPDAVMG
NPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCV
LAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH
Normal beta hemoglobin
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMG
NPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCV
LAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH
アラインメントという作業
間のスペースをなるべく少なくしつつ、同じタイプの
アミノ酸を縦に一致させて並べるアルゴリズム
ヒト、ウマ、クジラの配列比較
ヒトとウマのalpha鎖がとても似ていることがわかる。
集めた配列のアラインメント
アライメントで進化系統樹を作れる。
EMBL-EBIのものが便利
スパコン環境の提供
国内研究者なら
誰でもスパコンを
無料で利用可能。
(学生も指導教員の
承諾があればOK)
新規ユーザ登録の部分から申請しましょう
スパコンでできること
国内外、500以上の機関が利用しています。
(20コア64Gメモリ500台、2TBメモリ10台、10TB 1台)
• 読み取ったゲノム配列をアセンブル
• 遺伝子発現量の解析(マッピング)
• 配列機能の予測(アノテーション)
などなど。
配列はDDBJから入手、解析はスパコン
いずれも 「無料で」 できる。
まとめ
• これからの生物学は、情報処理が中心
コンピュータを扱えることが大前提。プログラミングも。
英語は重要。
• 遺伝研DDBJは世界3極で、データ無償公開
公開するからこそ、新規性や重要性がわかる。
科学の発展のためには必須。
• まずは遺伝子やタンパク質から調べてみよう
研究機関は信頼できる情報を多く提供しています。
情報アクセスの能力を身に着けよう。
まとめ
• 本格的な解析にはスパコンを利用しよう
学校や研究室単位で申し込みます。
大量ユーザでなければ無料です。
• 説明書もインターネットにあります
便利な書籍もありますが、利用法も無償公開です。
制度はいろいろあるので、ぜひ利用してください。
高校や大学への出前授業
夏休みの研究室体験(高校生)
遺伝研体験入学プログラム(大学生)
研究者交流促進プログラム

Weitere ähnliche Inhalte

Mehr von DNA Data Bank of Japan center

[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法DNA Data Bank of Japan center
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観DNA Data Bank of Japan center
 
[All-in-one2016] 立体構造データの検索・可視化法
[All-in-one2016] 立体構造データの検索・可視化法[All-in-one2016] 立体構造データの検索・可視化法
[All-in-one2016] 立体構造データの検索・可視化法DNA Data Bank of Japan center
 
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法DNA Data Bank of Japan center
 
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析DNA Data Bank of Japan center
 
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンクDNA Data Bank of Japan center
 
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者DNA Data Bank of Japan center
 
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)DNA Data Bank of Japan center
 
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)DNA Data Bank of Japan center
 
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介DNA Data Bank of Japan center
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向DNA Data Bank of Japan center
 
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティションDNA Data Bank of Japan center
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)DNA Data Bank of Japan center
 
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際DNA Data Bank of Japan center
 

Mehr von DNA Data Bank of Japan center (20)

[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
 
[All-in-one2016] 立体構造データの検索・可視化法
[All-in-one2016] 立体構造データの検索・可視化法[All-in-one2016] 立体構造データの検索・可視化法
[All-in-one2016] 立体構造データの検索・可視化法
 
[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法[All-in-one2016] 文献情報を利用したサービスの活用法
[All-in-one2016] 文献情報を利用したサービスの活用法
 
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
[All-in-one2016] DDBJデータベースを用いた配列の検索と解析
 
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
[All in-one2017] 「生命の素子」のカタチのデータベース: 蛋質構造データバンク
 
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
 
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)[DDBJing34]  NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
[DDBJing34] NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Mac用)
 
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
[DDBJing34]NIG SuperComputer の利用方法(1) PCに公開鍵を設定してスパコンにログインする(Win用)
 
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
[DDBJjing34] DRA(DDBJ Read Sequence Archive) の紹介
 
[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介[DDBJing34] BioProject, BioSample の紹介
[DDBJing34] BioProject, BioSample の紹介
 
[DDBJing34] DDBJ と NIG SuperComputer の紹介
[DDBJing34] DDBJ と NIG SuperComputer の紹介[DDBJing34] DDBJ と NIG SuperComputer の紹介
[DDBJing34] DDBJ と NIG SuperComputer の紹介
 
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
 
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
 
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
 
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
 
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)
 
[DDBJing33] Mass Submission System の紹介
[DDBJing33] Mass Submission System の紹介[DDBJing33] Mass Submission System の紹介
[DDBJing33] Mass Submission System の紹介
 
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
[DDBJing33] ゲノムワイド多型を利用した遺伝解析の実際
 

[All in-one2017] 自宅でできるゲノム研究:DDBJ/GenBank/ENA