NBDC Research ID: hum0103.v4
研究内容の概要
目的: 日本人の胆道がんにおけるゲノム変異を探索する
方法: 胆道がん切除切片における非腫瘍組織(正常組織)および腫瘍組織より抽出したDNA/RNAを使用したNGSライブラリーを作成後、Illumina HiSeq 2000/2500、NovaSeq 6000にて塩基配列を決定する。
対象: 胆道がん症例の腫瘍組織および非腫瘍組織のDNA/RNA、ならびに正常胆嚢の非腫瘍組織のRNA
データID | 内容 | 制限 | 公開日 |
---|---|---|---|
JGAS000109 | 制限公開(Type I) | 2018/02/27 | |
JGAS000109 にデータ追加 | NGS(WGS) | 制限公開(Type I) | 2019/06/21 |
JGAS000109 にデータ追加 | NGS(WGS)のbam/gvcfデータ | 制限公開(Type I) | 2021/07/13 |
JGAS000389 | 制限公開(Type I) | 2022/01/18 |
※リリース情報はこちら
※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。
分子データ
対象 |
胆道がん(ICD10:C22, 23, 24):14 症例 + 3 症例 腫瘍組織:23 検体 + 6 検体 非腫瘍組織:14 検体 + 3 検体 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2000/2500、NovaSeq 6000] |
ライブラリソース | 胆道がん切除切片における腫瘍組織および非腫瘍組織から抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | TruSeq DNA Sample Prep kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100 bp |
クオリティコントロール方法 |
リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。 Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。 Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。 1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。 その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。 |
重複するリードの除去 | Picard 2.10.6 |
リアライメントおよびベースクオリティのキャリブレーション | GATK 3.7 |
マッピング方法 | BWA mem 0.7.12 |
マッピングクオリティ | GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外 |
マッピングの際のリファレンス配列 | GRCh37/hg19(hs37d5) |
平均カバー率(Depth) | HiSeq 2000/2500:31.8x、NovaSeq 6000:28.0x |
変異検出方法 | GATK 3.7 HaplotypeCaller |
SNV数(QC後) |
76,768,387(常染色体) 2,898,518(X 染色体) |
INDEL数(QC後) |
10,202,908(常染色体) 410,435(X 染色体) |
Japanese Genotype-phenotype Archive Dataset ID |
JGAD000117(fastq)(EGAS00001000678 [EGAD00001000809]に含まれる) JGAD000403(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。 |
総データ量 | 2.4 TB(fastq) + 375 GB(fastq) + 1.6 TB(bam、vcf) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
胆道がん(ICD10:C22, 23, 24):81 症例 腫瘍組織:138 検体 非腫瘍組織:128 検体 胆道がん(ICD10:C221, C240, C248, C23):29 症例(3症例はWGSに含まれる) 腫瘍組織:29 検体 非腫瘍組織:29 検体 |
規模 | Exome |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2000/2500] |
ライブラリソース | 胆道がん切除切片における腫瘍組織および非腫瘍組織から抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) |
Nextera Rapid Capture kit、もしくは SureSelect Exome V5 kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 93 bp or 126 bp |
Japanese Genotype-phenotype Archive Dataset ID | |
総データ量 | 1.7+0.6 TB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
胆道がん(ICD10:C221, C240, C248, C23):17 症例 腫瘍組織:17 検体 非腫瘍組織:17 検体 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2000/2500、NovaSeq 6000] |
ライブラリソース | 胆道がん切除切片における腫瘍組織および非腫瘍組織から抽出したDNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) | TruSeq DNA Sample Prep kit |
断片化の方法 | 超音波断片化(Covaris) |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 126 bp or 151 bp |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000504 |
総データ量 | 2.0 TB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
胆道がん(ICD10:C221, C240, C248, C23):100 症例(KAPA:44 症例、TruSeq:73 症例、両方実施:17 症例) 腫瘍組織:100 検体(KAPA:44 検体、TruSeq:73 検体) 正常胆嚢:4 名 非腫瘍組織:4 検体 |
規模 | RNA-seq |
対象領域(Target Captureの場合) | - |
Platform | Illumina [HiSeq 2500] |
ライブラリソース | 胆道がん切除切片における腫瘍組織および膵がん手術症例から採取した正常胆嚢から抽出したRNA |
検体情報(購入の場合) | - |
ライブラリ作製方法(キット名) |
KAPA RNA HyperPrep Kit TruSeq Stranded mRNA Sample Prep kit |
断片化の方法 | 熱処理 |
ライブラリ構築方法 | Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 101 bp or 126 bp |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000506 |
総データ量 | 640 GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 中川 英刀
所 属 機 関: 理化学研究所 生命医科学研究センター
プロジェクト/研究グループ名:-
科研費/助成金(Research Project Number):
科研費・助成金名 | タイトル | 研究課題番号 |
---|---|---|
科学研究費助成事業 基盤研究(A) | 肝胆膵がんの多元的オミックス解析による分子機構の解明 | 18H04049 |
日本医療研究開発機構(AMED) 次世代がん医療創生研究事業(P-CREATE) | がんゲノム解析による新規免疫療法および複合免疫療法開発のためのシーズ探索 | JP20cm0106552 |
関連論文
タイトル | DOI | データID | |
---|---|---|---|
1 | Genomic characterization of biliary tract cancers identifies driver genes and predisposing mutations | doi: 10.1016/j.jhep.2018.01.009 |
JGAD000117 JGAD000118 |
2 | Molecular Classification and Tumor Microenvironment Characterization of Gallbladder Cancer by Comprehensive Genomic and Transcriptomic Analysis | doi: 10.3390/cancers13040733 |
JGAD000504 JGAD000505 JGAD000506 |
3 | Actionability evaluation of biliary tract cancer by genome transcriptome analysis and Asian cancer knowledgebase | doi: 10.18632/oncotarget.28021 |
JGAD000504 JGAD000505 JGAD000506 |
制限公開データの利用者一覧
研究代表者 | 所属機関 | 国・州名 | 研究題目 | 利用データID | 利用期間 |
---|---|---|---|---|---|
柴田 龍弘 | 国立がん研究センター研究所・がんゲノミクス分野 | JGAD000117, JGAD000118 | 2018/09/12-2022/09/30 | ||
木下 健吾 | 東北大学 東北メディカル・メガバンク機構 | 日本人全ゲノムデータベースの構築 | JGAD000117 | 2019/06/24-2022/03/31 | |
Justo Lorenzo Bermejo | Statistical Genetics Research Group, Institute of Medical Biometry, Heidelberg University Hospital | ドイツ | Genomic characterization of gallbladder tumors from patients worldwide | JGAD000118, JGAD000505 | 2022/10/13-2025/08/17 |