NBDC Research ID: hum0197.v6

最新版はこちらです

 

研究内容の概要

目的: 多層的オミクス解析による疾患病態の解明、日本人集団におけるGWASおよび複数集団におけるGWASメタ解析

方法: メタゲノムシークエンス、ゲノムワイド関連解析、small RNA-seq解析、eQTL解析

対象: 日本人集団(95+103+227+30名)の腸内細菌叢のメタゲノムシークエンスデータ

            肺胞蛋白症患者:198名、対照者:395名のゲノムワイド関連解析データ

            バイオバンク・ジャパン(179,000名)、UKバイオバンク(361,000名)、FinnGen(136,000名)の215形質のゲノムワイド関連解析データ

            日本人集団141名のsmall RNA-seq解析により定量した個人毎のmiRNAリードカウントデータと、全ゲノムシーケンス解析データと合わせて解析したeQTL解析データ

 

データID内容制限公開日
JGAS000205 メタゲノム 制限公開(Type I) 2019/11/15
hum0197.v2.gwas.v1 肺胞蛋白症のGWAS 非制限公開 2020/11/27
JGAS000260 メタゲノム 制限公開(Type I) 2020/11/27
hum0197.v3.gwas.v1 215形質のGWAS 非制限公開 2021/03/22
JGAS000316 メタゲノム 制限公開(Type I) 2021/10/12
JGAS000415 メタゲノム 制限公開(Type I) 2021/12/10
hum0197.v5.gwas.v1 10形質のGWAS 非制限公開 2021/12/21
hum0197.v5.finemap.v1 79形質のFine-mapping 非制限公開 2021/12/21
JGAS000504 miRNAリードカウント 制限公開(Type I) 2022/02/08
hum0197.v6.eqtl.v1 eQTL解析データ 非制限公開 2022/02/08

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

JGAS000205

対象 日本人集団:95名
規模 メタゲノム
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 3000]
ライブラリソース 便より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) KAPA Hyper Prep Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
Japanese Genotype-phenotype Archive Data set ID JGAD000290
総データ量 477 GB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0197.v2.gwas.v1

対象

肺胞蛋白症(ICD10:J840):198症例

対照者:395名

規模 genome wide SNPs
対象領域(Target Captureの場合) -
Platform Illumina [Infinium Asian Screening Array]
ソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Infinium Asian Screening Array
遺伝子型決定アルゴリズム(ソフトウェア) GenomeStudio for genotyping, shapeit2 for haplotype phasing, and minimac3 for imputation
関連解析(ソフトウェア) PLINK2
フィルタリング

Sample QC: We excluded samples with low genotyping call rates (call rate < 98%) and in close genetic relation (PI_HAT > 0.175). We included samples of the estimated East Asian ancestry.

Variant QC: We excluded variants with (1) genotyping call rate < 98%, (2) P value for Hardy–Weinberg equilibrium < 1.0 × 10−6, and (3) minor allele count < 5, or (4) > 10% frequency difference with the imputation reference panel.

マーカー数(QC後) 12,153,232 autosomal variants and 242,876 X-chromosomal variants after QC.
NBDC Data Set ID

hum0197.v2.gwas.v1

(データのダウンロードは上記Data IDをクリックしてください)

Dictionary file

総データ量 390MB for autosome (txt.gz) and 19MB for X chromosome (txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000260

対象 日本人集団:103名
規模 メタゲノム
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 3000]
ライブラリソース 便より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) KAPA Hyper Prep Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
Japanese Genotype-phenotype Archive Data set ID JGAD000363
総データ量 408 GB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0197.v3.gwas.v1

対象

バイオバンク・ジャパン(179,000名)、UKバイオバンク(361,000名)、FinnGen(136,000名)

形質数:215

規模 genome wide SNPs
対象領域(Target Captureの場合) -
Platform

BBJ:Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip]

UK Biobank:Applied Biosystems [UK BiLEVE Axiom Array、UK Biobank Axiom Array]

FinnGen:Thermo Fisher Scientific [FinnGen1 ThermoFisher Arrayなど]

ソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン)

BBJ:HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip

UK Biobank:UK BiLEVE Axiom Array、UK Biobank Axiom Array

FinnGen:FinnGen1 ThermoFisher Arrayなど

遺伝子型決定アルゴリズム(ソフトウェア)

BBJ:Eagle、Minimac3

UK Biobank:IMPUTE4

FinnGen:beagle4.1

関連解析(ソフトウェア)

For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM or plink software was used with the same covariates.

フィルタリング

BBJ:We included imputed variants with Rsq > 0.7.

UK Biobank:We excluded the variants with (i) INFO score ≤ 0.8, (ii) MAF ≤ 0.0001 (except for missense and protein-truncating variants annotated by VEP, which were excluded if MAF ≤ 1 × 10-6), and (iii) PHWE ≤ 1 × 10-10.

FinnGen:We excluded variants with an imputation INFO score < 0.8 or MAF < 0.0001.

マーカー数(QC後)

BBJ:13,530,797 variants

UK Biobank:13,791,467 variants

FinnGen:16,859,359 variants

NBDC Data Set ID

hum0197.v3.gwas.v1

(データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください)

Dictionary file(BBJEURMETA

総データ量

BBJ:~1.5G for autosome and ~33M for chrX

UK Biobank:~1.5G for autosome and ~15M for chrX

FinnGen:~740M for autosome and ~20M for chrX

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000316

対象 日本人集団:227名
規模 メタゲノム
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 3000、NovaSeq 6000]
ライブラリソース 便より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) KAPA Hyper Prep Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
Japanese Genotype-phenotype Archive Data set ID JGAD000427
総データ量 881.2 GB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000415

対象 日本人集団:30名
規模 メタゲノム
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 3000]
ライブラリソース 便より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) KAPA Hyper Prep Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
Japanese Genotype-phenotype Archive Data set ID JGAD000532
総データ量 106.7 GB GB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1

対象

バイオバンク・ジャパン(179,000名)

形質数:79

規模 genome wide SNPs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip]
ソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) Eagle、Minimac3
関連解析(ソフトウェア)

GWAS: For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM was used with the same covariates.

Fine-mapping: FINEMAP and SuSiE were used with GWAS summary statistics and in-sample dosage LD, allowing up to 10 causal variants per region.

フィルタリング

GWAS: We included imputed variants with Rsq > 0.7. For binary traits, variants with MAC < 10 were additionally excluded.

Fine-mapping: We defined fine-mapping regions based on a 3 Mb window around each lead variant and merged regions if they overlapped. We excluded the major histocompatibility complex (MHC) region (chr 6: 25–36 Mb) from analysis due to extensive LD structure in the region. For each method, we only included variants from successfully fine-mapped regions while excluding those from failed regions (e.g., due to conversion failure or available memory restrictions).

マーカー数(QC後) 13,531,752 variants(ref: hg19)
NBDC Data Set ID

hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1

(データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください)

Dictionary file

総データ量

14 GB

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000504

対象 日本人集団:141名
規模 small RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血単核細胞から抽出したRNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMARTer smRNA-Seq Kit
断片化の方法 -
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
マッピング方法 bowtie(GRCh37)
リードカウント決定アルゴリズム(ソフトウェア) featureCounts + miRbase v22
フィルタリング(QC)方法 We performed adapter trimming using Cutadapt v1.8 and removed reads with a low quality score (Phred quality score < 20 in >20% of total bases) using fastp v0.20.0. Also, we removed reads with a length of >29 bp or <15 bp, which are not expected to be mature miRNAs. Mature miRNAs detected with ≥1 read in at least half of the individuals were included in the dataset.
miRNA数 343
Japanese Genotype-phenotype Archive Data set ID JGAD000621
総データ量 54.7 KB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0197.v6.eqtl.v1

対象 日本人集団:141名
規模 eQTL
対象領域(Target Captureの場合) -
Platform

small RNA-seq:Illumina [HiSeq 2500]

全ゲノムシーケンス:Illumina [HiSeq X Ten]

ソース JGAS000504のリードカウントデータおよび全血から抽出したgenomic DNAを用いた全ゲノムシーケンスデータ
検体情報(購入の場合) -
調整試薬(キット名、バージョン)

small RNA-seq:JGAS000504を参照のこと

全ゲノムシーケンス:TruSeq DNA PCR-Free Library Preparation Kit

遺伝子型/リードカウント決定アルゴリズム(ソフトウェア)

リードカウントについてはJGAS000504を参照のこと

全ゲノムシーケンスデータはBWA-MEM v0.7.13を用いGRCh37にアラインメントし、GATK v3.8-0を用いbest practiceに準じて解析した。

フィルタリング

リードカウントについてはJGAS000504を参照のこと

全ゲノムシーケンスデータはGenotype call rate <90%, ExcessHet > 60, Hardy-Weinberg平衡検定P値<1.0×10−10のバリアントを除外した上で、Beagle v5.1によるgenotype imputationを実施した。

マーカー数(QC後)

リードカウントについてはJGAS000504を参照のこと

全ゲノムシーケンスデータ:12,171,854 variants

eQTL検出方法 We analyzed the association between genetic variants with minor allele frequency (MAF) ≥ 0.01 within a cis-window around each miRNA (±1 Mb of the mature miRNA) and normalized expression values using MatrixEQTL v2.3.
NBDC Data Set ID

hum0197.v6.eqtl.v1

(データのダウンロードは上記Data IDをクリックしてください)

Dictionary file

総データ量 1.1 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 岡田 随象

所 属 機 関: 大阪大学 大学院医学系研究科 遺伝統計学

プロジェクト/研究グループ名: -

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
日本医療研究開発機構(AMED) 革新的先端研究開発支援事業 ソロタイプ(PRIME) 遺伝統計学が紐解く微生物叢・宿主・疾患・創薬のクロストーク JP19gm6010001
⽇本医療研究開発機構(AMED) ⾰新的先端研究開発⽀援事業 ステップタイプ(FORCE) メタゲノムワイド関連解析による疾患特異的微生物叢解明と個別化医療実装 JP20gm4010006
⽇本医療研究開発機構(AMED) 難治性疾患実用化研究事業 横断的オミクス解析を駆使した肺胞蛋白症の病態解明とインシリコ・リポジショニング創薬 JP20ek0109413
日本医療研究開発機構(AMED) 免疫アレルギー疾患実用化研究事業 疾患ゲノム情報を活用した自己免疫疾患における核酸ゲノム創薬の推進 JP19ek0410041
日本医療研究開発機構(AMED) 免疫アレルギー疾患実用化研究事業 免疫オミクス情報の横断的統合による関節リウマチのゲノム個別化医療の実現 JP21ek0410075
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 遺伝統計学に基づく日本人集団のゲノム個別化医療の実装 JP21km0405211
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 次世代ゲノミクス研究による乾癬の疾患病態解明・個別化医療・創薬 JP21km0405217
科学研究費助成事業 基盤研究(A) 横断的オミクス解析と全ゲノムシークエンスを駆使した疾患病態と組織特異性の解明 19H01021

 

関連論文

タイトルDOIデータID
1 Metagenome-wide association study of gut microbiome revealed novel aetiology of rheumatoid arthritis in the Japanese population. doi: 10.1136/annrheumdis-2019-215743 JGAD000290
2 Genetic determinants of risk in autoimmune pulmonary alveolar proteinosis. doi: 10.1038/s41467-021-21011-y hum0197.v2.gwas.v1
3 A metagenome-wide association study of gut microbiome in patients with multiple sclerosis revealed novel disease pathology. doi: 10.3389/fcimb.2020.585973 JGAD000363
4 A cross-population atlas of genetic associations for 220 human phenotypes. doi: 10.1038/s41588-021-00931-x hum0197.v3.gwas.v1
5 Metagenome-wide association study revealed disease-specific landscape of the gut microbiome of systemic lupus erythematosus in Japanese doi: 10.1136/annrheumdis-2021-220687 JGAD000427
6 Whole gut virome analysis of 476 Japanese revealed a link between phage and autoimmune disease doi: 10.1136/annrheumdis-2021-221267 JGAD000532
7 Insights from complex trait fine-mapping across diverse populations doi: 10.1101/2021.09.03.21262975

hum0197.v5.gwas.v1

hum0197.v5.finemap.v1

8 Genetic architecture of microRNA expression and its link to complex diseases in the Japanese population. doi: 10.1093/hmg/ddab361

JGAD000621

hum0197.v6.eqtl.v1

 

制限公開データの利用者一覧

研究代表者所属機関研究題目利用データID利用期間