NBDC Research ID: hum0160.v2
研究内容の概要
目的: 日本人の食道がんにおけるゲノム変異を探索する
方法: 食道がん切除切片における非腫瘍組織(正常組織)および腫瘍組織より抽出したDNAを使用したNGSライブラリーを作成後、Illumina HiSeq 2000/2500/X Fiveにて塩基配列を決定する。
対象: 食道がん患者の非腫瘍組織および腫瘍組織のDNA
| データID | 内容 | 制限 | 公開日 |
|---|---|---|---|
| JGAS000155 | NGS(WGS) | 制限公開(Type I) | 2019/05/28 |
| JGAS000155 にデータ追加 | NGS(WGS)のbam/gvcfデータ | 制限公開(Type I) | 2021/07/13 |
※リリース情報はこちら
※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。
分子データ
| 対象 |
食道がん(ICD10:C15):20 症例 腫瘍組織:20 検体 非腫瘍組織:20 検体 |
| 規模 | WGS |
| 対象領域(Target Captureの場合) | - |
| Platform | Illumina [HiSeq 2000/2500/X Five] |
| ライブラリソース | 食道がん切除切片における非腫瘍組織および腫瘍組織から抽出したDNA |
| 検体情報(購入の場合) | - |
| ライブラリ作製方法(キット名) | TruSeq Nano DNA Low Throughput Library Prep Kit |
| 断片化の方法 | 超音波断片化(Covaris) |
| ライブラリ構築方法 | Paired-end |
| リード長(除:バーコード、アダプタ、プライマー、リンカー) | 100-150 bp |
| クオリティコントロール方法 |
リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。 Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。 Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。 1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。 その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。 |
| 重複するリードの除去 | Picard 2.10.6 |
| リアライメントおよびベースクオリティのキャリブレーション | GATK 3.7 |
| マッピング方法 | BWA mem 0.7.12 |
| マッピングクオリティ | GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外 |
| マッピングの際のリファレンス配列 | GRCh37/hg19(hs37d5) |
| 平均カバー率(Depth) | HiSeq 2000/2500/X Five:31.8x |
| 変異検出方法 | GATK 3.7 HaplotypeCaller |
| SNV数(QC後) |
76,768,387(常染色体) 2,898,518(X 染色体) |
| INDEL数(QC後) |
10,202,908(常染色体) 410,435(X 染色体) |
| Japanese Genotype-phenotype Archive Dataset ID |
JGAD000233(fastq) JGAD000405(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。 |
| 総データ量 | 3 TB(fastq) + 1.8 TB(bam、vcf) |
| コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 中川 英刀
所 属 機 関: 理化学研究所 生命医科学研究センター
プロジェクト/研究グループ名:-
科研費/助成金(Research Project Number):
| 科研費・助成金名 | タイトル | 研究課題番号 |
|---|---|---|
関連論文
| タイトル | DOI | データID | |
|---|---|---|---|
| 1 | |||
| 2 |
制限公開データの利用者一覧
| 研究代表者 | 所属機関 | 研究題目 | 利用データID | 利用期間 |
|---|---|---|---|---|
| 木下 健吾 | 東北大学 東北メディカル・メガバンク機構 | 日本人全ゲノムデータベースの構築 | JGAD000233 | 2019/06/24-2022/03/31 |
| 白石 航也 | 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 | ゲノム解析に基づく宿主並びに腫瘍における免疫応答ネットワーク機構の解明 | JGAD000233 | 2019/08/05-2023/03/31 |