NBDC Research ID: hum0214.v6

最新版はこちらです

研究内容の概要

目的: 免疫細胞における遺伝子発現制御と免疫疾患に対する寄与を解明する

方法:

JGAS000220:全身性強皮症21症例、antineutrophil cytoplasmic antibody(ANCA)関連血管炎26症例、対照健常者28名の末梢血免疫細胞画分を分取し各画分から抽出したtotal RNAを用いたRNA-seqを実施した。

E-GEAD-397 / E-GEAD-398 / E-GEAD-420:全身性エリテマトーデス、筋炎、全身性強皮症、混合性結合組織病、シェーグレン症候群、関節リウマチ、ベーチェット病、成人スチル病、ANCA関連血管炎、高安動脈炎、対照健常者の全血及び末梢血免疫細胞28画分を分取し、全血より全ゲノムシーケンス、各画分サンプルを用いてRNA-seqを実施した。サンプルのフィルタリングと遺伝子発現量の標準化の上で、各免疫細胞画分でeQTL解析を実施した。

JGAS000296:全身性強皮症50症例、対照健常者48名の末梢血免疫細胞24画分を分取し、各画分サンプルを用いてRNA-seqを実施した。遺伝子発現量を定量し、サンプルのフィルタリングした。

JGAS000220(JGAD000371、JGAD000372、JGAD000373):全身性エリテマトーデス、対照健常者の末梢血免疫細胞19画分を分取し、各画分サンプルを用いてRNA-seqを実施した。末梢血免疫細胞15画分でATAC-seqを実施した。

JGAS000486(JGAD000603):全身性エリテマトーデス、対照健常者の末梢血免疫細胞27画分を分取し、各画分サンプルを用いてRNA-seqを実施した。

対象: 全身性強皮症、全身性エリテマトーデス、筋炎、全身性強皮症、混合性結合組織病、シェーグレン症候群、関節リウマチ、ベーチェット病、成人スチル病、ANCA関連血管炎、高安動脈炎、対照健常者

URL: http://ryumachi.umin.jp/

 

データID内容制限公開日
JGAS000220 NGS(RNA-seq:全身性強皮症) 制限公開(Type I) 2020/10/09
JGAS000220 NGS(RNA-seq:ANCA関連血管炎) 制限公開(Type I) 2021/03/05
E-GEAD-397 RNA-seqのリードカウント 非制限公開 2021/04/28
E-GEAD-398 Conditional eQTLサマリーデータ(有意データのみ) 非制限公開 2021/04/28
E-GEAD-420 Nominal eQTLデータ(全データ) 非制限公開 2021/04/28
JGAS000296 NGS(RNA-seq) 制限公開(Type I) 2022/01/21
JGAS000220 NGS(RNA-seq)全身性エリテマトーデス 制限公開(Type I) 2022/03/09
JGAS000220 NGS(ATAC-seq) 制限公開(Type I) 2022/03/09
JGAS000486 NGS(RNA-seq)解析によるリードカウントデータ 制限公開(Type I) 2022/08/25

※リリース情報はこちら

※ 論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

JGAS000220(RNA-seq:全身性強皮症)

対象

全身性強皮症(ICD10:M340):21症例

対照健常者:13名

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞19画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Fr._II_eTreg, Naive_CD8, Mem_CD8, mDC, pDC, CD16p_Mono, CD16n_Mono, NK)より抽出したtotal RNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMART-seq v4 Ultra Low Input RNA Kit
断片化の方法 SMART-seq v4 Ultra Low Input RNA Kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
マッピング方法 STAR(hg38)
フィルタリング(QC)方法 アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。
遺伝子数 26353
Japanese Genotype-phenotype Archive Dataset ID JGAD000309
総データ量 125 MB(各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000220(RNA-seq:ANCA関連血管炎)

対象

ANCA関連血管炎(ICD10:M318):26症例

対照健常者:28名(上記13名を含む)

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞20画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Fr._II_eTreg, Naive_CD8, Mem_CD8, mDC, pDC, CD16p_Mono, CD16n_Mono, NK, Neu)より抽出したtotal RNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMART-seq v4 Ultra Low Input RNA Kit
断片化の方法 SMART-seq v4 Ultra Low Input RNA Kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
マッピング方法 STAR(hg38)
フィルタリング(QC)方法 アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。
遺伝子数 26353
Japanese Genotype-phenotype Archive Dataset ID JGAD000310
総データ量 125 MB(各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

E-GEAD-397(RNA-seq)

対象

全身性エリテマトーデス(ICD10:M329):62症例

筋炎(ICD10:M339, M332):65症例

全身性強皮症(ICD10:M340):67症例

混合性結合組織病(ICD10:M351):19症例

シェーグレン症候群(ICD10:M350):18症例

関節リウマチ(ICD10:M0690):25症例

ベーチェット病(ICD10:M352):23症例

成人スチル病(ICD10:M0610):18症例

ANCA関連血管炎(ICD10:M318):26症例

高安動脈炎(ICD10:M314):16症例

対照健常者:92名

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞28画分(Naive_CD4, Mem_CD4, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Th1, Th2, Th17, Tfh, NK, Naive_CD8, Mem_CD8, EM_CD8, CM_CD8, TEMRA_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono(別名CD16n_Mono), CD16p_Mono, Int_Mono, NC_Mono, mDC, pDC, LDG, Neu)より抽出したtotal RNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMART-seq v4 Ultra Low Input RNA Kit
断片化の方法 SMART-seq v4 Ultra Low Input RNA Kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
マッピング方法 STAR(GRCh38)
フィルタリング(QC)方法 cutadapt (v1.16)およびfastx-toolkit(v0.0.14)を用いてアダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。低クオリティーの塩基が20%を超えるリードを除去した。STAR(v2.5.3)のtwo-pass modeを用いてGRCh38へのマッピングを行った(Gencode version 27アノテーション)。ユニークマップ率が90%未満(Plasmablastでは70%未満、他のB細胞サブセットでは<85%未満)、もしくはユニークマップリード数が6.00 x 10^6未満のサンプルは除去した。遺伝子発現はHTSeq(v 0.11.2)で定量した。各細胞分画で低発現遺伝子(90%を超えるサンプルで10リード未満)を除外し、edgeRのTMMノーマライゼーションを実施、ログcount per million(CPM)変換、ComBatによるバッチ除去を行った上で、同一サブセット内の遺伝子発現のSpearman相関係数を計算し、平均値が0.9未満のサンプルを除外した。
遺伝子数 53344
Genomic Expression Archive ID E-GEAD-397
総データ量 1.3 GB(疾患名、phase情報、年齢、性別データおよび各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

E-GEAD-398 / E-GEAD-420(eQTL)

対象

全身性エリテマトーデス(ICD10:M329):62症例

筋炎(ICD10:M339, M332):65症例

全身性強皮症(ICD10:M340):67症例

混合性結合組織病(ICD10:M351):19症例

シェーグレン症候群(ICD10:M350):18症例

関節リウマチ(ICD10:M0690):24症例

ベーチェット病(ICD10:M352):23症例

成人スチル病(ICD10:M0610):18症例

ANCA関連血管炎(ICD10:M318):25症例

高安動脈炎(ICD10:M314):16症例

対照健常者:79名

規模 eQTL
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq X Ten]
ライブラリソース 全血より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA PCR-Free Library prep kit
断片化の方法 TruSeq DNA PCR-Free Library prep kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 151 bp
マッピング方法 BWA-MEM(GRCh38)
フィルタリング(QC)方法 全ゲノムシーケンスデータはGATK(v 4.0.6.0)best practiceに準じて解析した。検出バリアント率が99%未満のサンプルは除外した。遺伝型のインピュテーションにはBEAGLE(v 5.1)を用いた。Call rate <85%, Hardy-Weinberg平衡検定P値<1.0x10-6, マイナーアレル頻度1%未満のバリアントは除外した。
遺伝子数

E-GEAD-398:19441

E-GEAD-420:22381

eQTL検出方法 各細胞サブセットで80%を超えるサンプルで5リード未満、もしくは0.5 CPM未満の低発現遺伝子を除外した。常染色体遺伝子発現データのTMMノーマライゼーション、CPM変換、inverse normal transformによるサンプル間ノーマライゼーションを実施した。また隠れた共変量の推測のためPEERを実施した。eQTL解析の共変量として、上位2つの遺伝子主成分、サンプル回収のphase、性別、PEERによる潜在的因子を含めた。Phase 1で回収したMem CD8はPhase 2ではCM CD8とEM CD8として分割しているため、大部分の細胞の含まれるEM CD8と統合してeQTL解析を実施した。各細胞サブセットでのConditional eQTL解析では、QTLtoolsのpermutation passによる10000回のパーミュテーションを実施し、各遺伝子レベルでのFDR <0.05と対応するnominal p-value thresholdを定めた。その上で、QTL toolsのconditional passを用いてforward-backward stepwise regression eQTL analysisを実施した。Nominal eQTL解析では QTL toolsのnominal passを用いて、各遺伝子の転写開始点から1M塩基対のバリアントと遺伝子発現の関連を解析した。
Genomic Expression Archive ID

E-GEAD-398

E-GEAD-420(2021/6/9: Added columns for REF/ALT allele. Slope indicates the effect size of alternative alleles.)

総データ量

E-GEAD-398: 3.9 GB(eQTLサマリーデータ [FDR<0.05]、txt)

E-GEAD-420: 38 GB(全eQTLサマリーデータ、txt)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAD000296(RNA-seq)

対象

全身性強皮症(ICD10:M340):50症例

対照健常者:48名

(対象の一部はE-GEAD-397と重複)

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞24画分(Naive_CD4, Mem_CD4, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Th1, Th2, Th17, Tfh, NK, Naive_CD8, EM_CD8, CM_CD8, TEMRA_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono, Int_Mono, NC_Mono, mDC, pDC)より抽出したtotal RNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMART-seq v4 Ultra Low Input RNA Kit
断片化の方法 SMART-seq v4 Ultra Low Input RNA Kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp
マッピング方法 STAR(hg38)
フィルタリング(QC)方法 アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。50塩基未満のリード、及び低クオリティーの塩基を多く含むリード(20%を超える塩基で、Phred quality score < 20)を除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)を計算した。Diが0.9未満のサンプルは除去した。
遺伝子数 26353
Japanese Genotype-phenotype Archive Dataset ID JGAD000406
総データ量 172.8 MB(各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000220(RNA-seq:全身性エリテマトーデス)

対象

全身性エリテマトーデス(ICD10:M329):107症例

対照健常者:92名

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞19画分(Naive_CD4, Mem_CD4, Fr._II_eTreg, Th1, Th2, Th17, Tfh, NK, Naive_CD8, Mem_CD8, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CD16n_Mono, CD16p_Mono, mDC, pDC)より抽出したtotal RNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) Smart-Seq v2(test cohort)、SMART-seq v4 Ultra Low Input RNA Kit(validation cohort)
断片化の方法 Smart-Seq v2(test cohort)、SMART-seq v4 Ultra Low Input RNA Kit(validation cohort)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー)

76 bp(test cohort)

100 bp(validation cohort)

マッピング方法 STAR(GRCh38)
フィルタリング(QC)方法 FASTQファイルはSTAR(v2.5)によってGRCh38; GenBank assembly GCA_000001405.18にマッピングした。カウントテーブルの作成にはHTSeq-count(v0.6.1)を用いた。fastx-toolkit(v0.0.14)を用いてアダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。ミトコンドリア遺伝子発現は細胞ストレスを反映するため、ミトコンドリア遺伝子発現 <8%をカットオフに追加した。同一サブセット内の遺伝子発現の相関係数(r)を計算し、r2 < 0.8のサンプルは外れ値として除外した。
遺伝子数

26354(test cohort)

26485(validation cohort)

Japanese Genotype-phenotype Archive Dataset ID

JGAD000371

JGAD000372

総データ量 250 MB(各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000220(ATAC-seq)

対象

全身性エリテマトーデス(ICD10:M329):8症例

対照健常者:8名

規模 ATAC-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血免疫細胞15画分(Naive_B, SM_B, USM_B, DN_B, Plasmablast, Th1, Th2, Th17, Tfh, Naive_CD4, Mem_CD4, Naive_CD8, CD16p_Mono, CD16n_Mono, NK)より抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) Fast-ATAC-seq protocol
断片化の方法 Fast-ATAC-seq protocol
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 102 bp
Japanese Genotype-phenotype Archive Dataset ID JGAD000373
総データ量 27 GB(tdf、bed)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000486(RNA-seq:全身性エリテマトーデス)

対象

全身性エリテマトーデス(ICD10:M329):159症例

   (22症例については、経時的な解析を実施)

対照健常者:89名

規模 RNA-seq
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500、NovaSeq 6000]
ライブラリソース 末梢血免疫細胞27画分(Naive_CD4, Mem_CD4, Th1, Th2, Th17, Tfh, Fr._I_nTreg, Fr._II_eTreg, Fr._III_T, Naive_CD8, EM_CD8, CM_CD8, TEMRA_CD8, NK, Naive_B, USM_B, SM_B, DN_B, Plasmablast, CL_Mono (or CD16n_Mono), CD16p_Mono, Int_Mono, NC_Mono, mDC, pDC, Neu, LDG)より抽出したRNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SMART-seq v4 Ultra Low Input RNA Kit
断片化の方法 SMART-seq v4 Ultra Low Input RNA Kit
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 100 bp (HiSeq 2500)、150 bp (NovaSeq 6000)
マッピング方法 STAR(GRCh38)
フィルタリング(QC)方法 アダプター配列及び3’の低クオリティー塩基をトリムした(Phred quality score < 20)。低クオリティーの塩基が20%を超えるリードを除去した。ユニークマップ率が80%未満、もしくはユニークマップリード数が5.00 x 106未満のサンプルは除去した。同一サブセット内の遺伝子発現の相関係数(Di)が0.9未満のサンプルは除去した。同一個人のwhole genome sequencingのhetero locusに対するgenotypeの一致率が0.9未満のサンプルは除去した。
遺伝子数 26353
Japanese Genotype-phenotype Archive Dataset ID JGAD000603
総データ量 478.3 MB(各遺伝子にマップされたリードのカウントデータ、txt)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 藤尾 圭志

所 属 機 関: 東京大学大学院 医学系研究科 アレルギー・リウマチ学

プロジェクト/研究グループ名: 免疫疾患の免疫細胞マルチオミクス解析

URL: http://ryumachi.umin.jp/

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
中外製薬株式会社との共同研究費 - -
日本医療研究開発機構(AMED) 難治性疾患実用化研究事業 ゲノムおよび遺伝子発現情報の統合的解析に基づく全身性エリテマトーデスの治療標的の同定とその制御法の開発 JP17ek0109103
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム 免疫担当細胞eQTLデータを用いた免疫介在性疾患ゲノム情報からの層別化および予後予測モデルの構築 JP21tm0424221
日本医療研究開発機構(AMED) 健康・医療分野におけるムーンショット型研究開発等事業 病気につながる血管周囲の微小炎症を標的とする量子技術、ニューロモデュレーション医療による未病時治療法の開発 JP21zf0127004

 

関連論文

タイトルDOIデータID
1 Integrated bulk and single-cell RNA-sequencing identified disease-relevant monocytes and a gene network module underlying systemic sclerosis doi: 10.1016/j.jaut.2020.102547

JGAD000309

E-GEAD-344

2 Identifying the most influential gene expression profile in distinguishing ANCA-associated vasculitis from healthy controls doi: 10.1016/j.jaut.2021.102617 JGAD000310
3 Dynamic landscape of immune cell-specific gene regulation in immune-mediated diseases doi: 10.1016/j.cell.2021.03.056

E-GEAD-397

E-GEAD-398

E-GEAD-420

4 Dysregulation of the gene signature of effector regulatory T cells in the early phase of systemic sclerosis doi: 10.1093/rheumatology/keac031 JGAD000406
5 Immune cell multiomics analysis reveals contribution of oxidative phosphorylation to B-cell functions and organ damage of lupus doi: 10.1136/annrheumdis-2021-221464

JGAD000371

JGAD000372

JGAD000373

6 Distinct transcriptome architectures underlying lupus establishment and exacerbation doi: 10.1016/j.cell.2022.07.021 JGAD000603

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間