NBDC Research ID: hum0197.v6
最新版はこちらです
研究内容の概要
目的: 多層的オミクス解析による疾患病態の解明、日本人集団におけるGWASおよび複数集団におけるGWASメタ解析
方法: メタゲノムシークエンス、ゲノムワイド関連解析、small RNA-seq解析、eQTL解析
対象: 日本人集団(95+103+227+30名)の腸内細菌叢のメタゲノムシークエンスデータ
肺胞蛋白症患者:198名、対照者:395名のゲノムワイド関連解析データ
バイオバンク・ジャパン(179,000名)、UKバイオバンク(361,000名)、FinnGen(136,000名)の215形質のゲノムワイド関連解析データ
日本人集団141名のsmall RNA-seq解析により定量した個人毎のmiRNAリードカウントデータと、全ゲノムシーケンス解析データと合わせて解析したeQTL解析データ
データID | 内容 | 制限 | 公開日 |
---|---|---|---|
JGAS000205 | メタゲノム | 制限公開(Type I) | 2019/11/15 |
hum0197.v2.gwas.v1 | 肺胞蛋白症のGWAS | 非制限公開 | 2020/11/27 |
JGAS000260 | メタゲノム | 制限公開(Type I) | 2020/11/27 |
hum0197.v3.gwas.v1 | 215形質のGWAS | 非制限公開 | 2021/03/22 |
JGAS000316 | メタゲノム | 制限公開(Type I) | 2021/10/12 |
JGAS000415 | メタゲノム | 制限公開(Type I) | 2021/12/10 |
hum0197.v5.gwas.v1 | 10形質のGWAS | 非制限公開 | 2021/12/21 |
hum0197.v5.finemap.v1 | 79形質のFine-mapping | 非制限公開 | 2021/12/21 |
JGAS000504 | miRNAリードカウント | 制限公開(Type I) | 2022/02/08 |
hum0197.v6.eqtl.v1 | eQTL解析データ | 非制限公開 | 2022/02/08 |
※リリース情報はこちら
※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。
※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら。
分子データ
対象 | 日本人集団:95名 |
規模 | メタゲノム |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 3000] |
ライブラリソース | 便より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | KAPA Hyper Prep Kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 150 bp |
Japanese Genotype-phenotype Archive Data set ID | JGAD000290 |
総データ量 | 477 GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
肺胞蛋白症(ICD10:J840):198症例 対照者:395名 |
規模 | genome wide SNPs |
対象領域(Target Captureの場合) | - |
Platform | Illumina [Infinium Asian Screening Array] |
ソース | 末梢血から抽出したDNA |
検体情報(購入の場合) | - |
調整試薬(キット名、バージョン) | Infinium Asian Screening Array |
遺伝子型決定アルゴリズム(ソフトウェア) | GenomeStudio for genotyping, shapeit2 for haplotype phasing, and minimac3 for imputation |
関連解析(ソフトウェア) | PLINK2 |
フィルタリング |
Sample QC: We excluded samples with low genotyping call rates (call rate < 98%) and in close genetic relation (PI_HAT > 0.175). We included samples of the estimated East Asian ancestry. Variant QC: We excluded variants with (1) genotyping call rate < 98%, (2) P value for Hardy–Weinberg equilibrium < 1.0 × 10−6, and (3) minor allele count < 5, or (4) > 10% frequency difference with the imputation reference panel. |
マーカー数(QC後) | 12,153,232 autosomal variants and 242,876 X-chromosomal variants after QC. |
NBDC Data Set ID |
(データのダウンロードは上記Data IDをクリックしてください) |
総データ量 | 390MB for autosome (txt.gz) and 19MB for X chromosome (txt.gz) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人集団:103名 |
規模 | メタゲノム |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 3000] |
ライブラリソース | 便より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | KAPA Hyper Prep Kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 150 bp |
Japanese Genotype-phenotype Archive Data set ID | JGAD000363 |
総データ量 | 408 GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
バイオバンク・ジャパン(179,000名)、UKバイオバンク(361,000名)、FinnGen(136,000名) |
規模 | genome wide SNPs |
対象領域(Target Captureの場合) | - |
Platform |
BBJ:Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip] UK Biobank:Applied Biosystems [UK BiLEVE Axiom Array、UK Biobank Axiom Array] FinnGen:Thermo Fisher Scientific [FinnGen1 ThermoFisher Arrayなど] |
ソース | 末梢血から抽出したDNA |
検体情報(購入の場合) | - |
調整試薬(キット名、バージョン) |
BBJ:HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip UK Biobank:UK BiLEVE Axiom Array、UK Biobank Axiom Array FinnGen:FinnGen1 ThermoFisher Arrayなど |
遺伝子型決定アルゴリズム(ソフトウェア) |
BBJ:Eagle、Minimac3 UK Biobank:IMPUTE4 FinnGen:beagle4.1 |
関連解析(ソフトウェア) |
For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM or plink software was used with the same covariates.
|
フィルタリング |
BBJ:We included imputed variants with Rsq > 0.7. UK Biobank:We excluded the variants with (i) INFO score ≤ 0.8, (ii) MAF ≤ 0.0001 (except for missense and protein-truncating variants annotated by VEP, which were excluded if MAF ≤ 1 × 10-6), and (iii) PHWE ≤ 1 × 10-10. FinnGen:We excluded variants with an imputation INFO score < 0.8 or MAF < 0.0001. |
マーカー数(QC後) |
BBJ:13,530,797 variants UK Biobank:13,791,467 variants FinnGen:16,859,359 variants |
NBDC Data Set ID |
(データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください) |
総データ量 |
BBJ:~1.5G for autosome and ~33M for chrX UK Biobank:~1.5G for autosome and ~15M for chrX FinnGen:~740M for autosome and ~20M for chrX |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人集団:227名 |
規模 | メタゲノム |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 3000、NovaSeq 6000] |
ライブラリソース | 便より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | KAPA Hyper Prep Kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 150 bp |
Japanese Genotype-phenotype Archive Data set ID | JGAD000427 |
総データ量 | 881.2 GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人集団:30名 |
規模 | メタゲノム |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 3000] |
ライブラリソース | 便より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | KAPA Hyper Prep Kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 150 bp |
Japanese Genotype-phenotype Archive Data set ID | JGAD000532 |
総データ量 | 106.7 GB GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1
対象 |
バイオバンク・ジャパン(179,000名) |
規模 | genome wide SNPs |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip] |
ソース | 末梢血から抽出したDNA |
検体情報(購入の場合) | - |
調整試薬(キット名、バージョン) | HumanOmniExpressExome BeadChip、HumanOmniExpress BeadChip、HumanExome BeadChip |
遺伝子型決定アルゴリズム(ソフトウェア) | Eagle、Minimac3 |
関連解析(ソフトウェア) |
GWAS: For binary traits, SAIGE software was used with age, age2, sex, age×sex, age2×sex, and top 20 principal components as covariates. For quantitative traits (biomarkers), BOLT-LMM was used with the same covariates. Fine-mapping: FINEMAP and SuSiE were used with GWAS summary statistics and in-sample dosage LD, allowing up to 10 causal variants per region. |
フィルタリング |
GWAS: We included imputed variants with Rsq > 0.7. For binary traits, variants with MAC < 10 were additionally excluded. Fine-mapping: We defined fine-mapping regions based on a 3 Mb window around each lead variant and merged regions if they overlapped. We excluded the major histocompatibility complex (MHC) region (chr 6: 25–36 Mb) from analysis due to extensive LD structure in the region. For each method, we only included variants from successfully fine-mapped regions while excluding those from failed regions (e.g., due to conversion failure or available memory restrictions). |
マーカー数(QC後) | 13,531,752 variants(ref: hg19) |
NBDC Data Set ID |
hum0197.v5.gwas.v1 / hum0197.v5.finemap.v1 (データのダウンロードは上記データIDをクリックし、遷移先のサイトの各Data set IDをクリックしてください) |
総データ量 |
14 GB |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人集団:141名 |
規模 | small RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血単核細胞から抽出したRNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMARTer smRNA-Seq Kit |
断片化の方法 | - |
ライブラリ構築方法 | Single-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
マッピング方法 | bowtie(GRCh37) |
リードカウント決定アルゴリズム(ソフトウェア) | featureCounts + miRbase v22 |
フィルタリング(QC)方法 | We performed adapter trimming using Cutadapt v1.8 and removed reads with a low quality score (Phred quality score < 20 in >20% of total bases) using fastp v0.20.0. Also, we removed reads with a length of >29 bp or <15 bp, which are not expected to be mature miRNAs. Mature miRNAs detected with ≥1 read in at least half of the individuals were included in the dataset. |
miRNA数 | 343 |
Japanese Genotype-phenotype Archive Data set ID | JGAD000621 |
総データ量 | 54.7 KB(txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人集団:141名 |
規模 | eQTL |
対象領域(Target Captureの場合) | - |
Platform |
small RNA-seq:Illumina [HiSeq 2500] 全ゲノムシーケンス:Illumina [HiSeq X Ten] |
ソース | JGAS000504のリードカウントデータおよび全血から抽出したgenomic DNAを用いた全ゲノムシーケンスデータ |
検体情報(購入の場合) | - |
調整試薬(キット名、バージョン) |
small RNA-seq:JGAS000504を参照のこと 全ゲノムシーケンス:TruSeq DNA PCR-Free Library Preparation Kit |
遺伝子型/リードカウント決定アルゴリズム(ソフトウェア) |
リードカウントについてはJGAS000504を参照のこと 全ゲノムシーケンスデータはBWA-MEM v0.7.13を用いGRCh37にアラインメントし、GATK v3.8-0を用いbest practiceに準じて解析した。 |
フィルタリング |
リードカウントについてはJGAS000504を参照のこと 全ゲノムシーケンスデータはGenotype call rate <90%, ExcessHet > 60, Hardy-Weinberg平衡検定P値<1.0×10−10のバリアントを除外した上で、Beagle v5.1によるgenotype imputationを実施した。 |
マーカー数(QC後) |
リードカウントについてはJGAS000504を参照のこと 全ゲノムシーケンスデータ:12,171,854 variants |
eQTL検出方法 | We analyzed the association between genetic variants with minor allele frequency (MAF) ≥ 0.01 within a cis-window around each miRNA (±1 Mb of the mature miRNA) and normalized expression values using MatrixEQTL v2.3. |
NBDC Data Set ID |
(データのダウンロードは上記Data IDをクリックしてください) |
総データ量 | 1.1 MB(txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 岡田 随象
所 属 機 関: 大阪大学 大学院医学系研究科 遺伝統計学
プロジェクト/研究グループ名: -
科研費/助成金(Research Project Number):
科研費・助成金名 | タイトル | 研究課題番号 |
---|---|---|
日本医療研究開発機構(AMED) 革新的先端研究開発支援事業 ソロタイプ(PRIME) | 遺伝統計学が紐解く微生物叢・宿主・疾患・創薬のクロストーク | JP19gm6010001 |
⽇本医療研究開発機構(AMED) ⾰新的先端研究開発⽀援事業 ステップタイプ(FORCE) | メタゲノムワイド関連解析による疾患特異的微生物叢解明と個別化医療実装 | JP20gm4010006 |
⽇本医療研究開発機構(AMED) 難治性疾患実用化研究事業 | 横断的オミクス解析を駆使した肺胞蛋白症の病態解明とインシリコ・リポジショニング創薬 | JP20ek0109413 |
日本医療研究開発機構(AMED) 免疫アレルギー疾患実用化研究事業 | 疾患ゲノム情報を活用した自己免疫疾患における核酸ゲノム創薬の推進 | JP19ek0410041 |
日本医療研究開発機構(AMED) 免疫アレルギー疾患実用化研究事業 | 免疫オミクス情報の横断的統合による関節リウマチのゲノム個別化医療の実現 | JP21ek0410075 |
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 | 遺伝統計学に基づく日本人集団のゲノム個別化医療の実装 | JP21km0405211 |
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 | 次世代ゲノミクス研究による乾癬の疾患病態解明・個別化医療・創薬 | JP21km0405217 |
科学研究費助成事業 基盤研究(A) | 横断的オミクス解析と全ゲノムシークエンスを駆使した疾患病態と組織特異性の解明 | 19H01021 |
関連論文
タイトル | DOI | データID | |
---|---|---|---|
1 | Metagenome-wide association study of gut microbiome revealed novel aetiology of rheumatoid arthritis in the Japanese population. | doi: 10.1136/annrheumdis-2019-215743 | JGAD000290 |
2 | Genetic determinants of risk in autoimmune pulmonary alveolar proteinosis. | doi: 10.1038/s41467-021-21011-y | hum0197.v2.gwas.v1 |
3 | A metagenome-wide association study of gut microbiome in patients with multiple sclerosis revealed novel disease pathology. | doi: 10.3389/fcimb.2020.585973 | JGAD000363 |
4 | A cross-population atlas of genetic associations for 220 human phenotypes. | doi: 10.1038/s41588-021-00931-x | hum0197.v3.gwas.v1 |
5 | Metagenome-wide association study revealed disease-specific landscape of the gut microbiome of systemic lupus erythematosus in Japanese | doi: 10.1136/annrheumdis-2021-220687 | JGAD000427 |
6 | Whole gut virome analysis of 476 Japanese revealed a link between phage and autoimmune disease | doi: 10.1136/annrheumdis-2021-221267 | JGAD000532 |
7 | Insights from complex trait fine-mapping across diverse populations | doi: 10.1101/2021.09.03.21262975 |
hum0197.v5.gwas.v1 hum0197.v5.finemap.v1 |
8 | Genetic architecture of microRNA expression and its link to complex diseases in the Japanese population. | doi: 10.1093/hmg/ddab361 |
JGAD000621 hum0197.v6.eqtl.v1 |
制限公開データの利用者一覧
研究代表者 | 所属機関 | 研究題目 | 利用データID | 利用期間 |
---|---|---|---|---|