NBDC Research ID: hum0364.v1
研究内容の概要
目的: 次世代シークエンス技術(NGS)により全ゲノムシーケンス(WGS)解析が可能になり、一塩基変異、挿入・欠失、コピー数変異、構造変異などの遺伝子変異を同定できるようになった。 しかし、リード長が短く、リピート領域でのシーケンスエラー率が高いため、マイクロサテライト(MS)領域の変異や多型の同定は困難であった。本研究では、ヒトのMS多型の全容を明らかにするため、公開されている2つの大規模なヒトゲノムシーケンスデータセット(Simons Genome Diversity Project [SGDP]、Human Genome Diversity Project [HGDP])および縄文人の全ゲノムデータについて、以前開発したMS検出法(MIVcall法)を用いて約900万個のMS領域の解析を行った。
方法: MIVcall法を用いたMS多型の検出
対象: 非制限公開されているWGS解析データをダウンロードし、データの質の評価をクリアしたSGDP 276サンプル、 HGDP 693サンプル、縄文人 1サンプル(全て健常者由来)
データID | 内容 | 制限 | 公開日 |
---|---|---|---|
hum0364.v1.wgs-ms.v1 | NGS(WGS) | 非制限公開 | 2022/08/29 |
※リリース情報はこちら
※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら。
分子データ
対象 |
非制限公開されているヒトのWGS解析データ(健常者) SGDP:276名 HGDP:693名 縄文人:1名 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | - |
ソース | |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | - |
断片化の方法 | - |
ライブラリ構築方法 | - |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | - |
クオリティコントロール方法 | 10本未満のリードで覆われているMSは深度不足とした。全MSのうち深度不足が4%以上のサンプルは解析から除いた。 |
重複するリードの除去 | SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。 |
リアライメントおよびベースクオリティのキャリブレーション | SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。 |
マッピング方法 | SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。 |
マッピングクオリティ | 20以上のリードを用いた。 |
マッピングの際のリファレンス配列 | GRCh37 |
平均カバー率(Depth) | MSをカバーしていたリード数の平均 31.7 (HGDPおよびSGDP)、30.4 (Funadomari) |
変異検出方法 | MIVcall法 |
MS数(QC後) | 733900(常染色体) |
NBDC Dataset ID |
(データのダウンロードは上記Dataset IDをクリックしてください) |
総データ量 | 9.37 GB(vcf) |
コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 藤本 明洋
所 属 機 関: 東京大学大学院 医学系研究科 人類遺伝学教室
プロジェクト/研究グループ名: -
URL: http://www.humgenet.m.u-tokyo.ac.jp
科研費/助成金(Research Project Number):
科研費・助成金名 | タイトル | 研究課題番号 |
---|---|---|
科学研究費補助金 新学術領域研究 | ゲノム配列を核としたヤポネシア人の起源と成立の解明 | 18H05511 |
科学研究費補助金 挑戦的研究 (萌芽) | マイクロサテライトを用いた人類集団史の推定 | 18H02680 |
国立研究開発法人日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 | 先進的シークエンス情報解析技術基盤の開発 | JP20km0405207 |
関連論文
タイトル | DOI | データID | |
---|---|---|---|
1 | |||
2 |