NBDC Research ID: hum0214.v6
最新版はこちらです
研究内容の概要
目的: 免疫細胞における遺伝子発現制御と免疫疾患に対する寄与を解明する
方法:
JGAS000220:全身性強皮症21症例、antineutrophil cytoplasmic antibody(ANCA)関連血管炎26症例、対照健常者28名の末梢血免疫細胞画分を分取し各画分から抽出したtotal RNAを用いたRNA-seqを実施した。
E-GEAD-397 / E-GEAD-398 / E-GEAD-420:全身性エリテマトーデス、筋炎、全身性強皮症、混合性結合組織病、シェーグレン症候群、関節リウマチ、ベーチェット病、成人スチル病、ANCA関連血管炎、高安動脈炎、対照健常者の全血及び末梢血免疫細胞28画分を分取し、全血より全ゲノムシーケンス、各画分サンプルを用いてRNA-seqを実施した。サンプルのフィルタリングと遺伝子発現量の標準化の上で、各免疫細胞画分でeQTL解析を実施した。
JGAS000296:全身性強皮症50症例、対照健常者48名の末梢血免疫細胞24画分を分取し、各画分サンプルを用いてRNA-seqを実施した。遺伝子発現量を定量し、サンプルのフィルタリングした。
JGAS000220(JGAD000371、JGAD000372、JGAD000373):全身性エリテマトーデス、対照健常者の末梢血免疫細胞19画分を分取し、各画分サンプルを用いてRNA-seqを実施した。末梢血免疫細胞15画分でATAC-seqを実施した。
JGAS000486(JGAD000603):全身性エリテマトーデス、対照健常者の末梢血免疫細胞27画分を分取し、各画分サンプルを用いてRNA-seqを実施した。
対象: 全身性強皮症、全身性エリテマトーデス、筋炎、全身性強皮症、混合性結合組織病、シェーグレン症候群、関節リウマチ、ベーチェット病、成人スチル病、ANCA関連血管炎、高安動脈炎、対照健常者
データID | 内容 | 制限 | 公開日 |
---|---|---|---|
JGAS000220 | NGS(RNA-seq:全身性強皮症) | 制限公開(Type I) | 2020/10/09 |
JGAS000220 | NGS(RNA-seq:ANCA関連血管炎) | 制限公開(Type I) | 2021/03/05 |
E-GEAD-397 | RNA-seqのリードカウント | 非制限公開 | 2021/04/28 |
E-GEAD-398 | Conditional eQTLサマリーデータ(有意データのみ) | 非制限公開 | 2021/04/28 |
E-GEAD-420 | Nominal eQTLデータ(全データ) | 非制限公開 | 2021/04/28 |
JGAS000296 | NGS(RNA-seq) | 制限公開(Type I) | 2022/01/21 |
JGAS000220 | NGS(RNA-seq)全身性エリテマトーデス | 制限公開(Type I) | 2022/03/09 |
JGAS000220 | NGS(ATAC-seq) | 制限公開(Type I) | 2022/03/09 |
JGAS000486 | NGS(RNA-seq)解析によるリードカウントデータ | 制限公開(Type I) | 2022/08/25 |
※リリース情報はこちら
※ 論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら。
※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。
分子データ
対象 |
全身性強皮症(ICD10:M340):21症例 対照健常者:13名 |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞19画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Fr._II_eTreg, Naive_CD8, Mem_CD8, mDC, pDC, CD16p_Mono, CD16n_Mono, NK)より抽出したtotal RNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMART-seq v4 Ultra Low Input RNA Kit |
断片化の方法 | SMART-seq v4 Ultra Low Input RNA Kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
マッピング方法 | STAR(hg38) |
フィルタリング(QC)方法 | アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。 |
遺伝子数 | 26353 |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000309 |
総データ量 | 125 MB(各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
ANCA関連血管炎(ICD10:M318):26症例 対照健常者:28名(上記13名を含む) |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞20画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Fr._II_eTreg, Naive_CD8, Mem_CD8, mDC, pDC, CD16p_Mono, CD16n_Mono, NK, Neu)より抽出したtotal RNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMART-seq v4 Ultra Low Input RNA Kit |
断片化の方法 | SMART-seq v4 Ultra Low Input RNA Kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
マッピング方法 | STAR(hg38) |
フィルタリング(QC)方法 | アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。 |
遺伝子数 | 26353 |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000310 |
総データ量 | 125 MB(各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
全身性エリテマトーデス(ICD10:M329):62症例 筋炎(ICD10:M339, M332):65症例 全身性強皮症(ICD10:M340):67症例 混合性結合組織病(ICD10:M351):19症例 シェーグレン症候群(ICD10:M350):18症例 関節リウマチ(ICD10:M0690):25症例 ベーチェット病(ICD10:M352):23症例 成人スチル病(ICD10:M0610):18症例 ANCA関連血管炎(ICD10:M318):26症例 高安動脈炎(ICD10:M314):16症例 対照健常者:92名 |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞28画分(Naive_CD4, Mem_CD4, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Th1, Th2, Th17, Tfh, NK, Naive_CD8, Mem_CD8, EM_CD8, CM_CD8, TEMRA_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono(別名CD16n_Mono), CD16p_Mono, Int_Mono, NC_Mono, mDC, pDC, LDG, Neu)より抽出したtotal RNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMART-seq v4 Ultra Low Input RNA Kit |
断片化の方法 | SMART-seq v4 Ultra Low Input RNA Kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
マッピング方法 | STAR(GRCh38) |
フィルタリング(QC)方法 | cutadapt (v1.16)およびfastx-toolkit(v0.0.14)を用いてアダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。低クオリティーの塩基が20%を超えるリードを除去した。STAR(v2.5.3)のtwo-pass modeを用いてGRCh38へのマッピングを行った(Gencode version 27アノテーション)。ユニークマップ率が90%未満(Plasmablastでは70%未満、他のB細胞サブセットでは<85%未満)、もしくはユニークマップリード数が6.00 x 10^6未満のサンプルは除去した。遺伝子発現はHTSeq(v 0.11.2)で定量した。各細胞分画で低発現遺伝子(90%を超えるサンプルで10リード未満)を除外し、edgeRのTMMノーマライゼーションを実施、ログcount per million(CPM)変換、ComBatによるバッチ除去を行った上で、同一サブセット内の遺伝子発現のSpearman相関係数を計算し、平均値が0.9未満のサンプルを除外した。 |
遺伝子数 | 53344 |
Genomic Expression Archive ID | E-GEAD-397 |
総データ量 | 1.3 GB(疾患名、phase情報、年齢、性別データおよび各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
全身性エリテマトーデス(ICD10:M329):62症例 筋炎(ICD10:M339, M332):65症例 全身性強皮症(ICD10:M340):67症例 混合性結合組織病(ICD10:M351):19症例 シェーグレン症候群(ICD10:M350):18症例 関節リウマチ(ICD10:M0690):24症例 ベーチェット病(ICD10:M352):23症例 成人スチル病(ICD10:M0610):18症例 ANCA関連血管炎(ICD10:M318):25症例 高安動脈炎(ICD10:M314):16症例 対照健常者:79名 |
規模 | eQTL |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq X Ten] |
ライブラリソース | 全血より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | TruSeq DNA PCR-Free Library prep kit |
断片化の方法 | TruSeq DNA PCR-Free Library prep kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 151 bp |
マッピング方法 | BWA-MEM(GRCh38) |
フィルタリング(QC)方法 | 全ゲノムシーケンスデータはGATK(v 4.0.6.0)best practiceに準じて解析した。検出バリアント率が99%未満のサンプルは除外した。遺伝型のインピュテーションにはBEAGLE(v 5.1)を用いた。Call rate <85%, Hardy-Weinberg平衡検定P値<1.0x10-6, マイナーアレル頻度1%未満のバリアントは除外した。 |
遺伝子数 |
E-GEAD-398:19441 E-GEAD-420:22381 |
eQTL検出方法 | 各細胞サブセットで80%を超えるサンプルで5リード未満、もしくは0.5 CPM未満の低発現遺伝子を除外した。常染色体遺伝子発現データのTMMノーマライゼーション、CPM変換、inverse normal transformによるサンプル間ノーマライゼーションを実施した。また隠れた共変量の推測のためPEERを実施した。eQTL解析の共変量として、上位2つの遺伝子主成分、サンプル回収のphase、性別、PEERによる潜在的因子を含めた。Phase 1で回収したMem CD8はPhase 2ではCM CD8とEM CD8として分割しているため、大部分の細胞の含まれるEM CD8と統合してeQTL解析を実施した。各細胞サブセットでのConditional eQTL解析では、QTLtoolsのpermutation passによる10000回のパーミュテーションを実施し、各遺伝子レベルでのFDR <0.05と対応するnominal p-value thresholdを定めた。その上で、QTL toolsのconditional passを用いてforward-backward stepwise regression eQTL analysisを実施した。Nominal eQTL解析では QTL toolsのnominal passを用いて、各遺伝子の転写開始点から1M塩基対のバリアントと遺伝子発現の関連を解析した。 |
Genomic Expression Archive ID |
E-GEAD-420(2021/6/9: Added columns for REF/ALT allele. Slope indicates the effect size of alternative alleles.) |
総データ量 |
E-GEAD-398: 3.9 GB(eQTLサマリーデータ [FDR<0.05]、txt) E-GEAD-420: 38 GB(全eQTLサマリーデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
全身性強皮症(ICD10:M340):50症例 対照健常者:48名 (対象の一部はE-GEAD-397と重複) |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞24画分(Naive_CD4, Mem_CD4, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Th1, Th2, Th17, Tfh, NK, Naive_CD8, EM_CD8, CM_CD8, TEMRA_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono, Int_Mono, NC_Mono, mDC, pDC)より抽出したtotal RNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMART-seq v4 Ultra Low Input RNA Kit |
断片化の方法 | SMART-seq v4 Ultra Low Input RNA Kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
マッピング方法 | STAR(hg38) |
フィルタリング(QC)方法 | アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。 |
遺伝子数 | 26353 |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000406 |
総データ量 | 172.8 MB(各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
JGAS000220(RNA-seq:全身性エリテマトーデス)
対象 |
全身性エリテマトーデス(ICD10:M329):107症例 対照健常者:92名 |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞19画分(Naive_CD4, Mem_CD4, Fr._II_eTreg, Th1, Th2, Th17, Tfh, NK, Naive_CD8, Mem_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CD16n_Mono, CD16p_Mono, mDC, pDC)より抽出したtotal RNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | Smart-Seq v2(test cohort)、SMART-seq v4 Ultra Low Input RNA Kit(validation cohort) |
断片化の方法 | Smart-Seq v2(test cohort)、SMART-seq v4 Ultra Low Input RNA Kit(validation cohort) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) |
76 bp(test cohort) 100 bp(validation cohort) |
マッピング方法 | STAR(GRCh38) |
フィルタリング(QC)方法 | FASTQファイルはSTAR(v2.5)によってGRCh38; GenBank assembly GCA_000001405.18にマッピングした。カウントテーブルの作成にはHTSeq-count(v0.6.1)を用いた。fastx-toolkit(v0.0.14)を用いてアダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。ミトコンドリア遺伝子発現は細胞ストレスを反映するため、ミトコンドリア遺伝子発現 <8%をカットオフに追加した。同一サブセット内の遺伝子発現の相関係数(r)を計算し、r2 < 0.8のサンプルは外れ値として除外した。 |
遺伝子数 |
26354(test cohort) 26485(validation cohort) |
Japanese Genotype-phenotype Archive Dataset ID | |
総データ量 | 250 MB(各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
全身性エリテマトーデス(ICD10:M329):8症例 対照健常者:8名 |
規模 | ATAC-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 末梢血免疫細胞15画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Naive_CD8, CD16p_Mono, CD16n_Mono, NK)より抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | Fast-ATAC-seq protocol |
断片化の方法 | Fast-ATAC-seq protocol |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 102 bp |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000373 |
総データ量 | 27 GB(tdf、bed) |
コメント(利用にあたっての制限事項) | NBDC policy |
JGAS000486(RNA-seq:全身性エリテマトーデス)
対象 |
全身性エリテマトーデス(ICD10:M329):159症例 (22症例については、経時的な解析を実施) 対照健常者:89名 |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500、NovaSeq 6000] |
ライブラリソース | 末梢血免疫細胞27画分(Naive_CD4, Mem_CD4, Th1, Th2, Th17, Tfh, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Naive_CD8, EM_CD8, CM_CD8, TEMRA_CD8, NK, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono (or CD16n_Mono), CD16p_Mono, Int_Mono, NC_Mono, mDC, pDC, Neu, LDG)より抽出したRNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | SMART-seq v4 Ultra Low Input RNA Kit |
断片化の方法 | SMART-seq v4 Ultra Low Input RNA Kit |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp (HiSeq 2500)、150 bp (NovaSeq 6000) |
マッピング方法 | STAR(GRCh38) |
フィルタリング(QC)方法 | アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。低クオリティーの塩基が20%を超えるリードを除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)が0.9未満のサンプルは除去した。同一個人のwhole genome sequencingのhetero locusに対するgenotypeの一致率が0.9未満のサンプルは除去した。 |
遺伝子数 | 26353 |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000603 |
総データ量 | 478.3 MB(各遺伝子にマップされたリードのカウントデータ、txt) |
コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 藤尾 圭志
所 属 機 関: 東京大学大学院 医学系研究科 アレルギー・リウマチ学
プロジェクト/研究グループ名: 免疫疾患の免疫細胞マルチオミクス解析
科研費/助成金(Research Project Number):
科研費・助成金名 | タイトル | 研究課題番号 |
---|---|---|
中外製薬株式会社との共同研究費 | - | - |
日本医療研究開発機構(AMED) 難治性疾患実用化研究事業 | ゲノムおよび遺伝子発現情報の統合的解析に基づく全身性エリテマトーデスの治療標的の同定とその制御法の開発 | JP17ek0109103 |
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム | 免疫担当細胞eQTLデータを用いた免疫介在性疾患ゲノム情報からの層別化および予後予測モデルの構築 | JP21tm0424221 |
日本医療研究開発機構(AMED) 健康・医療分野におけるムーンショット型研究開発等事業 | 病気につながる血管周囲の微小炎症を標的とする量子技術、ニューロモデュレーション医療による未病時治療法の開発 | JP21zf0127004 |
関連論文
タイトル | DOI | データID | |
---|---|---|---|
1 | Integrated bulk and single-cell RNA-sequencing identified disease-relevant monocytes and a gene network module underlying systemic sclerosis | doi: 10.1016/j.jaut.2020.102547 |
JGAD000309 |
2 | Identifying the most influential gene expression profile in distinguishing ANCA-associated vasculitis from healthy controls | doi: 10.1016/j.jaut.2021.102617 | JGAD000310 |
3 | Dynamic landscape of immune cell-specific gene regulation in immune-mediated diseases | doi: 10.1016/j.cell.2021.03.056 |
E-GEAD-397 E-GEAD-398 E-GEAD-420 |
4 | Dysregulation of the gene signature of effector regulatory T cells in the early phase of systemic sclerosis | doi: 10.1093/rheumatology/keac031 | JGAD000406 |
5 | Immune cell multiomics analysis reveals contribution of oxidative phosphorylation to B-cell functions and organ damage of lupus | doi: 10.1136/annrheumdis-2021-221464 |
JGAD000371 JGAD000372 JGAD000373 |
6 | Distinct transcriptome architectures underlying lupus establishment and exacerbation | doi: 10.1016/j.cell.2022.07.021 | JGAD000603 |
制限公開データの利用者一覧
研究代表者 | 所属機関 | 国・州名 | 研究題目 | 利用データID | 利用期間 |
---|---|---|---|---|---|