研究内容の概要

目的： 多層的オミクス解析による疾患病態の解明、日本人集団におけるGWASおよび複数集団におけるGWASメタ解析

方法： メタゲノムシークエンス、ゲノムワイド関連解析、small RNA-seq解析、eQTL解析

対象： 日本人集団（95＋103＋227＋30名）の腸内細菌叢のメタゲノムシークエンスデータ

肺胞蛋白症患者：198名、対照者：395名のゲノムワイド関連解析データ

バイオバンク・ジャパン（179,000名）、UKバイオバンク（361,000名）、FinnGen（136,000名）の215形質のゲノムワイド関連解析データ

日本人集団141名のsmall RNA-seq解析により定量した個人毎のmiRNAリードカウントデータと、全ゲノムシーケンス解析データと合わせて解析したeQTL解析データ

データID	内容	制限	公開日
JGAS000205	メタゲノム	制限公開（Type I）	2019/11/15
hum0197.v2.gwas.v1	肺胞蛋白症のGWAS	非制限公開	2020/11/27
JGAS000260	メタゲノム	制限公開（Type I）	2020/11/27
hum0197.v3.gwas.v1	215形質のGWAS	非制限公開	2021/03/22
JGAS000316	メタゲノム	制限公開（Type I）	2021/10/12
JGAS000415	メタゲノム	制限公開（Type I）	2021/12/10
hum0197.v5.gwas.v1	10形質のGWAS	非制限公開	2021/12/21
hum0197.v5.finemap.v1	79形質のFine-mapping	非制限公開	2021/12/21
JGAS000504	miRNAリードカウント	制限公開（Type I）	2022/02/08
hum0197.v6.eqtl.v1	eQTL解析データ	非制限公開	2022/02/08

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞（Acknowledgement）に記載して下さい。記載例はこちら。

分子データ

JGAS000205


対象	日本人集団：95名
規模	メタゲノム
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 3000]
ライブラリソース	便より抽出したDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	KAPA Hyper Prep Kit
断片化の方法	超音波断片化（Covaris）
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
Japanese Genotype-phenotype Archive Data set ID	JGAD000290
総データ量	477 GB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

hum0197.v2.gwas.v1


対象	肺胞蛋白症（ICD10：J840）：198症例対照者：395名
規模	genome wide SNPs
対象領域（Target Captureの場合）	-
Platform	Illumina [Infinium Asian Screening Array]
ソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Infinium Asian Screening Array
遺伝子型決定アルゴリズム（ソフトウェア）	GenomeStudio for genotyping, shapeit2 for haplotype phasing, and minimac3 for imputation
関連解析（ソフトウェア）	PLINK2
フィルタリング	Sample QC: We excluded samples with low genotyping call rates (call rate < 98%) and in close genetic relation (PI_HAT > 0.175). We included samples of the estimated East Asian ancestry. Variant QC: We excluded variants with (1) genotyping call rate < 98%, (2) P value for Hardy–Weinberg equilibrium < 1.0 × 10⁻⁶, and (3) minor allele count < 5, or (4) > 10% frequency difference with the imputation reference panel.
マーカー数（QC後）	12,153,232 autosomal variants and 242,876 X-chromosomal variants after QC.
NBDC Data Set ID	hum0197.v2.gwas.v1 （データのダウンロードは上記Data IDをクリックしてください） Dictionary file
総データ量	390MB for autosome (txt.gz) and 19MB for X chromosome (txt.gz)
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000260


対象	日本人集団：103名
規模	メタゲノム
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 3000]
ライブラリソース	便より抽出したDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	KAPA Hyper Prep Kit
断片化の方法	超音波断片化（Covaris）
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
Japanese Genotype-phenotype Archive Data set ID	JGAD000363
総データ量	408 GB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

hum0197.v3.gwas.v1


対象	バイオバンク・ジャパン（179,000名）、UKバイオバンク（361,000名）、FinnGen（136,000名）形質数：215
規模	genome wide SNPs
対象領域（Target Captureの場合）	-
Platform	BBJ：Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip] UK Biobank：Applied Biosystems [UK BiLEVE Axiom Array、UK Biobank Axiom Array] FinnGen：Thermo Fisher Scientific [FinnGen1 ThermoFisher Arrayなど]
ソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	BBJ：HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip UK Biobank：UK BiLEVE Axiom Array、UK Biobank Axiom Array FinnGen：FinnGen1 ThermoFisher Arrayなど
遺伝子型決定アルゴリズム（ソフトウェア）	BBJ：Eagle、Minimac3 UK Biobank：IMPUTE4 FinnGen：beagle4.1
関連解析（ソフトウェア）	For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM or plink software was used with the same covariates.
フィルタリング	BBJ：We included imputed variants with Rsq > 0.7. UK Biobank：We excluded the variants with (i) INFO score ≤ 0.8, (ii) MAF ≤ 0.0001 (except for missense and protein-truncating variants annotated by VEP, which were excluded if MAF ≤ 1 × 10-6), and (iii) PHWE ≤ 1 × 10-10. FinnGen：We excluded variants with an imputation INFO score < 0.8 or MAF < 0.0001.
マーカー数（QC後）	BBJ：13,530,797 variants UK Biobank：13,791,467 variants FinnGen：16,859,359 variants
NBDC Data Set ID	hum0197.v3.gwas.v1 （データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください） Dictionary file（BBJ、EUR、META）
総データ量	BBJ：~1.5G for autosome and ~33M for chrX UK Biobank：~1.5G for autosome and ~15M for chrX FinnGen：~740M for autosome and ~20M for chrX
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000316


対象	日本人集団：227名
規模	メタゲノム
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 3000、NovaSeq 6000]
ライブラリソース	便より抽出したDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	KAPA Hyper Prep Kit
断片化の方法	超音波断片化（Covaris）
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
Japanese Genotype-phenotype Archive Data set ID	JGAD000427
総データ量	881.2 GB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000415


対象	日本人集団：30名
規模	メタゲノム
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 3000]
ライブラリソース	便より抽出したDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	KAPA Hyper Prep Kit
断片化の方法	超音波断片化（Covaris）
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
Japanese Genotype-phenotype Archive Data set ID	JGAD000532
総データ量	106.7 GB GB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1


対象	バイオバンク・ジャパン（179,000名）形質数：79
規模	genome wide SNPs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip]
ソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip
遺伝子型決定アルゴリズム（ソフトウェア）	Eagle、Minimac3
関連解析（ソフトウェア）	GWAS: For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM was used with the same covariates. Fine-mapping: FINEMAP and SuSiE were used with GWAS summary statistics and in-sample dosage LD, allowing up to 10 causal variants per region.
フィルタリング	GWAS: We included imputed variants with Rsq > 0.7. For binary traits, variants with MAC < 10 were additionally excluded. Fine-mapping: We defined fine-mapping regions based on a 3 Mb window around each lead variant and merged regions if they overlapped. We excluded the major histocompatibility complex (MHC) region (chr 6: 25–36 Mb) from analysis due to extensive LD structure in the region. For each method, we only included variants from successfully fine-mapped regions while excluding those from failed regions (e.g., due to conversion failure or available memory restrictions).
マーカー数（QC後）	13,531,752 variants（ref: hg19）
NBDC Data Set ID	hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1 （データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください） Dictionary file
総データ量	14 GB
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000504


対象	日本人集団：141名
規模	small RNA-seq
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血単核細胞から抽出したRNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	SMARTer smRNA-Seq Kit
断片化の方法	-
ライブラリ構築方法	Single-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	100 bp
マッピング方法	bowtie（GRCh37）
リードカウント決定アルゴリズム（ソフトウェア）	featureCounts + miRbase v22
フィルタリング（QC）方法	We performed adapter trimming using Cutadapt v1.8 and removed reads with a low quality score (Phred quality score < 20 in >20% of total bases) using fastp v0.20.0. Also, we removed reads with a length of >29 bp or <15 bp, which are not expected to be mature miRNAs. Mature miRNAs detected with ≥1 read in at least half of the individuals were included in the dataset.
miRNA数	343
Japanese Genotype-phenotype Archive Data set ID	JGAD000621
総データ量	54.7 KB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

hum0197.v6.eqtl.v1


対象	日本人集団：141名
規模	eQTL
対象領域（Target Captureの場合）	-
Platform	small RNA-seq：Illumina [HiSeq 2500] 全ゲノムシーケンス：Illumina [HiSeq X Ten]
ソース	JGAS000504のリードカウントデータおよび全血から抽出したgenomic DNAを用いた全ゲノムシーケンスデータ
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	small RNA-seq：JGAS000504を参照のこと全ゲノムシーケンス：TruSeq DNA PCR-Free Library Preparation Kit
遺伝子型/リードカウント決定アルゴリズム（ソフトウェア）	リードカウントについてはJGAS000504を参照のこと全ゲノムシーケンスデータはBWA-MEM v0.7.13を用いGRCh37にアラインメントし、GATK v3.8-0を用いbest practiceに準じて解析した。
フィルタリング	リードカウントについてはJGAS000504を参照のこと全ゲノムシーケンスデータはGenotype call rate <90%, ExcessHet > 60, Hardy-Weinberg平衡検定P値<1.0×10⁻¹⁰のバリアントを除外した上で、Beagle v5.1によるgenotype imputationを実施した。
マーカー数（QC後）	リードカウントについてはJGAS000504を参照のこと全ゲノムシーケンスデータ：12,171,854 variants
eQTL検出方法	We analyzed the association between genetic variants with minor allele frequency (MAF) ≥ 0.01 within a cis-window around each miRNA (±1 Mb of the mature miRNA) and normalized expression values using MatrixEQTL v2.3.
NBDC Data Set ID	hum0197.v6.eqtl.v1 （データのダウンロードは上記Data IDをクリックしてください） Dictionary file
総データ量	1.1 MB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

提供者情報

研究代表者： 岡田随象

所属機関： 大阪大学大学院医学系研究科遺伝統計学

プロジェクト/研究グループ名： -

科研費/助成金（Research Project Number）：

科研費・助成金名	タイトル	研究課題番号
日本医療研究開発機構（AMED）革新的先端研究開発支援事業ソロタイプ（PRIME）	遺伝統計学が紐解く微生物叢・宿主・疾患・創薬のクロストーク	JP19gm6010001
⽇本医療研究開発機構（AMED）⾰新的先端研究開発⽀援事業ステップタイプ（FORCE）	メタゲノムワイド関連解析による疾患特異的微生物叢解明と個別化医療実装	JP20gm4010006
⽇本医療研究開発機構（AMED）難治性疾患実用化研究事業	横断的オミクス解析を駆使した肺胞蛋白症の病態解明とインシリコ・リポジショニング創薬	JP20ek0109413
日本医療研究開発機構（AMED）免疫アレルギー疾患実用化研究事業	疾患ゲノム情報を活用した自己免疫疾患における核酸ゲノム創薬の推進	JP19ek0410041
日本医療研究開発機構（AMED）免疫アレルギー疾患実用化研究事業	免疫オミクス情報の横断的統合による関節リウマチのゲノム個別化医療の実現	JP21ek0410075
日本医療研究開発機構（AMED）ゲノム医療実現推進プラットフォーム事業	遺伝統計学に基づく日本人集団のゲノム個別化医療の実装	JP21km0405211
日本医療研究開発機構（AMED）ゲノム医療実現推進プラットフォーム事業	次世代ゲノミクス研究による乾癬の疾患病態解明・個別化医療・創薬	JP21km0405217
科学研究費助成事業基盤研究（A）	横断的オミクス解析と全ゲノムシークエンスを駆使した疾患病態と組織特異性の解明	19H01021

	タイトル	DOI	データID
1	Metagenome-wide association study of gut microbiome revealed novel aetiology of rheumatoid arthritis in the Japanese population.	doi: 10.1136/annrheumdis-2019-215743	JGAD000290
2	Genetic determinants of risk in autoimmune pulmonary alveolar proteinosis.	doi: 10.1038/s41467-021-21011-y	hum0197.v2.gwas.v1
3	A metagenome-wide association study of gut microbiome in patients with multiple sclerosis revealed novel disease pathology.	doi: 10.3389/fcimb.2020.585973	JGAD000363
4	A cross-population atlas of genetic associations for 220 human phenotypes.	doi: 10.1038/s41588-021-00931-x	hum0197.v3.gwas.v1
5	Metagenome-wide association study revealed disease-specific landscape of the gut microbiome of systemic lupus erythematosus in Japanese	doi: 10.1136/annrheumdis-2021-220687	JGAD000427
6	Whole gut virome analysis of 476 Japanese revealed a link between phage and autoimmune disease	doi: 10.1136/annrheumdis-2021-221267	JGAD000532
7	Insights from complex trait fine-mapping across diverse populations	doi: 10.1101/2021.09.03.21262975	hum0197.v5.gwas.v1 hum0197.v5.finemap.v1
8	Genetic architecture of microRNA expression and its link to complex diseases in the Japanese population.	doi: 10.1093/hmg/ddab361	JGAD000621 hum0197.v6.eqtl.v1

制限公開データの利用者一覧

研究代表者	所属機関	研究題目	利用データID	利用期間

研究内容の概要

分子データ

提供者情報

関連論文

制限公開データの利用者一覧