NBDC Research ID: hum0364.v1

 

研究内容の概要

目的: 次世代シークエンス技術(NGS)により全ゲノムシーケンス(WGS)解析が可能になり、一塩基変異、挿入・欠失、コピー数変異、構造変異などの遺伝子変異を同定できるようになった。 しかし、リード長が短く、リピート領域でのシーケンスエラー率が高いため、マイクロサテライト(MS)領域の変異や多型の同定は困難であった。本研究では、ヒトのMS多型の全容を明らかにするため、公開されている2つの大規模なヒトゲノムシーケンスデータセット(Simons Genome Diversity Project [SGDP]、Human Genome Diversity Project [HGDP])および縄文人の全ゲノムデータについて、以前開発したMS検出法(MIVcall法)を用いて約900万個のMS領域の解析を行った。

方法: MIVcall法を用いたMS多型の検出

対象: 非制限公開されているWGS解析データをダウンロードし、データの質の評価をクリアしたSGDP 276サンプル、 HGDP 693サンプル、縄文人 1サンプル(全て健常者由来)

 

データID内容制限公開日
hum0364.v1.wgs-ms.v1 NGS(WGS) 非制限公開 2022/08/29

※リリース情報はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0364.v1.wgs-ms.v1

対象

非制限公開されているヒトのWGS解析データ(健常者)

  SGDP:276名

  HGDP:693名

  縄文人:1名

規模 WGS
対象領域(Target Captureの場合) -
Platform -
ソース

非制限公開されているSGDPHGDP縄文人のWGS解析データ(NGS)

検体情報(購入の場合) -
ライブラリ作製方法(キット名) -
断片化の方法 -
ライブラリ構築方法 -
リード長(除:バーコード、アダプタ、プライマー、リンカー) -
クオリティコントロール方法 10本未満のリードで覆われているMSは深度不足とした。全MSのうち深度不足が4%以上のサンプルは解析から除いた。
重複するリードの除去 SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。
リアライメントおよびベースクオリティのキャリブレーション SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。
マッピング方法 SGDPやHGDPにより行われた。本研究では公開されているbamファイルを用いた。
マッピングクオリティ 20以上のリードを用いた。
マッピングの際のリファレンス配列 GRCh37
平均カバー率(Depth) MSをカバーしていたリード数の平均 31.7 (HGDPおよびSGDP)、30.4 (Funadomari)
変異検出方法 MIVcall法
MS数(QC後) 733900(常染色体)
NBDC Dataset ID

hum0364.v1.wgs-ms.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

README

総データ量 9.37 GB(vcf)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 藤本 明洋

所 属 機 関: ​東京大学大学院 医学系研究科 人類遺伝学教室

プロジェクト/研究グループ名: -

URL: http://www.humgenet.m.u-tokyo.ac.jp

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
科学研究費補助金 新学術領域研究 ゲノム配列を核としたヤポネシア人の起源と成立の解明 18H05511
科学研究費補助金 挑戦的研究 (萌芽) マイクロサテライトを用いた人類集団史の推定 18H02680
国立研究開発法人日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 先進的シークエンス情報解析技術基盤の開発 JP20km0405207

 

関連論文

タイトルDOIデータID
1
2