NBDC Research ID: hum0174.v6

 

研究内容の概要

目的: 日本人ゲノムにおける構造変異の多様性をデータベース化する

方法: 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプルをPacBio Sequel/Sequel II、10X Chromium、およびNanopore PromethIONによりシークエンスし、構造変異の解析を行った。

対象: 日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)から分譲されたサンプル、合計10検体+11検体+177検体+141検体+30検体

 

データID内容制限公開日
JGAS000173 NGS(WGS):Sequence raw data、サンプルごとのStructural Variantsデータ 制限公開(Type I) 2020/10/06
JGAS000173(データ追加) NGS(WGS) 制限公開(Type I) 2020/11/27
JGAS000580 NGS(WGS) 制限公開(Type I) 2023/06/29
JGAS000286 NGS(WGS):Sequence raw data、サンプルごとのStructural Variantsデータ 制限公開(Type I) 2023/07/06
JGAS000505 NGS(WGS):Sequence raw data、一部サンプルごとのhaplotypeデータ 制限公開(Type I) 2023/07/10
JGAS000596 NGS(WGS) 制限公開(Type I) 2023/12/28

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

JGAS000173

対象 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:10検体
規模 WGS
対象領域(Target Captureの場合) -
Platform

1.PacBio [Sequel]

2.10x Genomics [Chromium Controller]

ライブラリソース 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル
検体情報(購入の場合)

日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)

https://bioresource.nibiohn.go.jp/psc/

ライブラリ作製方法(キット名)

1.the library prep. kit for SMRT sequencing by Pacific Biosciences

2.10X Genomics-Chromium system

断片化の方法

1.Megaruptor, g-tube

2.None

ライブラリ構築方法

1.Single-end

2.Paired-end

リード長(除:バーコード、アダプタ、プライマー、リンカー)

1.14000 bp

2.151 bp

QC方法

1.Qubit, Pulsed-field gel electrophoresis, TapeStation, Bioanalyzer

2.qPCR, Bioanalyzer

マッピング方法

1.minimap2

2.longranger by 10X Genomics

平均カバー率(Depth)

1.29x

2.19x

構造変異検出方法

1.Sniffles

2.longranger by 10X Genomics

構造多型数

1.16870/sample

2.5100/sample

Japanese Genotype-phenotype Archive Dataset ID JGAD000251
総データ量 1 TB(fastq, bam [ref: unmapped], bed, vcf [ref: hg38])
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000173(データ追加)

対象 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:11検体
規模 WGS
対象領域(Target Captureの場合) -
Platform PacBio [Sequel]
ライブラリソース 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル
検体情報(購入の場合)

日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)

https://bioresource.nibiohn.go.jp/psc/

ライブラリ作製方法(キット名) the library prep. kit for SMRT sequencing by Pacific Biosciences
断片化の方法 Megaruptor, g-tube
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 14000 bp
Japanese Genotype-phenotype Archive Dataset ID JGAD000251
総データ量 3.44 TB(bam)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000580

対象 日本人由来B細胞株・DNAバンクから分譲されたB細胞より抽出したDNAサンプル:1検体
規模 WGS
対象領域(Target Captureの場合) MHC、LRC、Chr1、SMN1/SMN2領域
Platform Nanopore [PromethION]
ライブラリソース 日本人由来B細胞株・DNAバンクから分譲されたB細胞1検体より抽出したDNAサンプル
検体情報(購入の場合)

日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)

https://bioresource.nibiohn.go.jp/psc/

ライブラリ作製方法(キット名) Ultra-Long DNA Sequencing Kit(SQK-ULK001)
断片化の方法 トランスポゼースを用いた断片化
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 56.2 Kbp〜63.8 Kbp(N50)
マッピング方法 minimap2(v2.24)with "-x map-ont"
マッピングクオリティ -
マッピングの際のリファレンス配列 T2T-CHM13v2.0
平均カバー率(Depth) 81x〜104 x(median)
Japanese Genotype-phenotype Archive Dataset ID JGAD000706
総データ量 1.4 GB(bam)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000286

対象

日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:177検体

    (CCS:112検体、CLR:65検体)

規模 WGS
対象領域(Target Captureの場合) -
Platform PacBio [Sequel、Sequel II]
ライブラリソース 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル
検体情報(購入の場合)

日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)

https://bioresource.nibiohn.go.jp/psc/

ライブラリ作製方法(キット名) the library prep. kit for SMRT sequencing by Pacific Biosciences
断片化の方法 Megaruptor, g-tube
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 14000 bp
QC方法 Qubit, Pulsed-field gel electrophoresis, TapeStation, Bioanalyzer
マッピング方法 minimap2(hg38-no_alt)
平均カバー率(Depth)

CCS:9.5 x

CLR:36 x

SNVコール DeepVariant
SNVハプロタイピング WhatsHap
構造変異検出方法 pbsv
2倍体アセンブリ HiCanu
Japanese Genotype-phenotype Archive Dataset ID JGAD000392
総データ量 31.8 TB(bam、vcf、fasta)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000505 / JGAS000596

対象 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:177 + 30 検体
規模 WGS
対象領域(Target Captureの場合) -
Platform PacBio [Sequel II]
ライブラリソース 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル
検体情報(購入の場合)

日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)

https://bioresource.nibiohn.go.jp/psc/

ライブラリ作製方法(キット名) the library prep. kit for SMRT sequencing by Pacific Biosciences
断片化の方法 Megaruptor
ライブラリ構築方法 Single-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 14,949 bp
QC方法 Qubit, NanoDrop, TapeStation, Femto Pulse, Pulsed-field gel electrophoresis
マッピング方法 minimap2(hg38-no_alt)
平均カバー率(Depth) CCS:9.06x
SNVコール DeepVariant
SNVハプロタイピング WhatsHap
構造変異検出方法 pbsv
2倍体アセンブリ HiCanu
Japanese Genotype-phenotype Archive Dataset ID

JGAD000622 (177検体)

JGAD000725 (30検体)

総データ量

JGAD000622: 7.5 TB(30検体:bam、vcf、contig_fasta、147検体:fastq)

JGAD000725: 705 GB(fastq)

コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 森下 真一

所 属 機 関: 東京大学大学院新領域創成科学研究科

プロジェクト/研究グループ名: -

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 先端ゲノム研究開発 ヒトゲノム De Novo 情報解析テクノロジーの創出 JP16km0405204
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム ヒトゲノム De Novo 情報解析テクノロジーの創出 JP21tm0424219

 

関連論文

タイトルDOIデータID
1 Rapid and ongoing evolution of repetitive sequence structures in human centromeres. doi: 10.1126/sciadv.abd9230 JGAD000251
2 JTK: targeted diploid genome assembler doi: 10.1093/bioinformatics/btad398 JGAD000706
3 A landscape of complex tandem repeats within individual human genomes doi: 10.1038/s41467-023-41262-1 JGAD000392
JGAD000622

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間
高地 雄太 東京医科歯科大学 難治疾患研究所 ゲノム機能多様性分野 日本 機能性遺伝子多型の網羅的解析を介した多因子疾患の病態解明 JGAD000251 2023/04/10-2024/03/31
岡田 随象 大阪大学大学院 医学系研究科 遺伝統計学 日本 多層的オミクス解析による疾患病態の解明 JGAD000251
JGAD000392
JGAD000622
JGAD000725
2024/03/05-2025/07/14