NBDC Research ID: hum0501.v1

 

研究内容の概要

目的: 北ユーラシアの先住民および南アメリカの先住民の集団間における基礎的な分岐数、混血度合、および孤立度合いについては議論が続いており、これまでの知見の多くは全ゲノムシークエンスデータに基づいている。本研究は、現在の北ユーラシアおよびアメリカの集団形成における古代のダイナミクスとその影響をより深く理解することを目的とし、これらの地域からの139の民族集団に属する1,537人の大規模な全ゲノムシークエンスデータを使用し、集団構造を特定し、先史時代の移住や環境が集団の多様化に果たした役割を明らかにする。

方法: 全ゲノムシークエンシング

対象: 約100の民族集団に属する健常者1,323名

URL: https://www.genomeasia100k.org/

 

データID内容制限公開日
JGAS000781 NGS(WGS) 制限公開(Type I) 2025/05/15

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

JGAS000781

対象

約100の民族集団に属する健常者:1,323名

  ADRC(Asian DNA Repository Consortium)由来:313名

  RIMG(Research Institute of Medical Genetics SB RAMS in Russia)由来:486名

  GenomeAsia 100K Project(GenomeAsia 100K Consortium, 2019, Nature):524名

規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq X]
ライブラリソース 唾液または末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA Nano
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
クオリティコントロール方法

VQSLOD<0の変異を除外

removed multi-allelic SNPs and indels, remaining only biallelic SNPs.

重複するリードの除去 SAMBLASTER
リアライメントおよびベースクオリティのキャリブレーション -
マッピング方法 BWA-MEM v0.7.13
マッピングクオリティ MAPQ = ~60
マッピングの際のリファレンス配列 GRCh37
平均カバー率(Depth) >20X
変異検出方法 GATK v3.5
SNP数(QC後) 52,589,813
INDEL数(QC後) -
Japanese Genotype-phenotype Archive Dataset ID JGAD000923
総データ量 310.8 GB(vcf、tabix)
コメント(利用にあたっての制限事項) NBDC policy および 民間企業における利用禁止

 

提供者情報

研究代表者: Hie Lim Kim

所 属 機 関: Asian School of the Environment、​Nanyang Technological University

プロジェクト/研究グループ名:-

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
GenomeAsia 100K consortium

 

関連論文

タイトルDOIデータID
1 From North Asia to South America: Tracing the longest human migration through genomic sequencing doi: 10.1126/science.adk5081 JGAD000923
2

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間