NBDC Research ID: hum0174.v6
研究内容の概要
目的: 日本人ゲノムにおける構造変異の多様性をデータベース化する
方法: 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプルをPacBio Sequel/Sequel II、10X Chromium、およびNanopore PromethIONによりシークエンスし、構造変異の解析を行った。
対象: 日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所)から分譲されたサンプル、合計10検体+11検体+177検体+141検体+30検体
データID | 内容 | 制限 | 公開日 |
---|---|---|---|
JGAS000173 | NGS(WGS):Sequence raw data、サンプルごとのStructural Variantsデータ | 制限公開(Type I) | 2020/10/06 |
JGAS000173(データ追加) | NGS(WGS) | 制限公開(Type I) | 2020/11/27 |
JGAS000580 | NGS(WGS) | 制限公開(Type I) | 2023/06/29 |
JGAS000286 | NGS(WGS):Sequence raw data、サンプルごとのStructural Variantsデータ | 制限公開(Type I) | 2023/07/06 |
JGAS000505 | NGS(WGS):Sequence raw data、一部サンプルごとのhaplotypeデータ | 制限公開(Type I) | 2023/07/10 |
JGAS000596 | NGS(WGS) | 制限公開(Type I) | 2023/12/28 |
※リリース情報はこちら
※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。
分子データ
対象 | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:10検体 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform |
1.PacBio [Sequel] 2.10x Genomics [Chromium Controller] |
ライブラリソース | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル |
検体情報(購入の場合) |
日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所) |
ライブラリ作製方法(キット名) |
1.the library prep. kit for SMRT sequencing by Pacific Biosciences 2.10X Genomics-Chromium system |
断片化の方法 |
1.Megaruptor, g-tube 2.None |
ライブラリ構築方法 |
1.Single-end 2.Paired-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) |
1.14000 bp 2.151 bp |
QC方法 |
1.Qubit, Pulsed-field gel electrophoresis, TapeStation, Bioanalyzer 2.qPCR, Bioanalyzer |
マッピング方法 |
1.minimap2 2.longranger by 10X Genomics |
平均カバー率(Depth) |
1.29x 2.19x |
構造変異検出方法 |
1.Sniffles 2.longranger by 10X Genomics |
構造多型数 |
1.16870/sample 2.5100/sample |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000251 |
総データ量 | 1 TB(fastq, bam [ref: unmapped], bed, vcf [ref: hg38]) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:11検体 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | PacBio [Sequel] |
ライブラリソース | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル |
検体情報(購入の場合) |
日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所) |
ライブラリ作製方法(キット名) | the library prep. kit for SMRT sequencing by Pacific Biosciences |
断片化の方法 | Megaruptor, g-tube |
ライブラリ構築方法 | Single-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 14000 bp |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000251 |
総データ量 | 3.44 TB(bam) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人由来B細胞株・DNAバンクから分譲されたB細胞より抽出したDNAサンプル:1検体 |
規模 | WGS |
対象領域(Target Captureの場合) | MHC、LRC、Chr1、SMN1/SMN2領域 |
Platform | Nanopore [PromethION] |
ライブラリソース | 日本人由来B細胞株・DNAバンクから分譲されたB細胞1検体より抽出したDNAサンプル |
検体情報(購入の場合) |
日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所) |
ライブラリ作製方法(キット名) | Ultra-Long DNA Sequencing Kit(SQK-ULK001) |
断片化の方法 | トランスポゼースを用いた断片化 |
ライブラリ構築方法 | Single-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 56.2 Kbp〜63.8 Kbp(N50) |
マッピング方法 | minimap2(v2.24)with "-x map-ont" |
マッピングクオリティ | - |
マッピングの際のリファレンス配列 | T2T-CHM13v2.0 |
平均カバー率(Depth) | 81x〜104 x(median) |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000706 |
総データ量 | 1.4 GB(bam) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 |
日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:177検体 (CCS:112検体、CLR:65検体) |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | PacBio [Sequel、Sequel II] |
ライブラリソース | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル |
検体情報(購入の場合) |
日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所) |
ライブラリ作製方法(キット名) | the library prep. kit for SMRT sequencing by Pacific Biosciences |
断片化の方法 | Megaruptor, g-tube |
ライブラリ構築方法 | Single-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 14000 bp |
QC方法 | Qubit, Pulsed-field gel electrophoresis, TapeStation, Bioanalyzer |
マッピング方法 | minimap2(hg38-no_alt) |
平均カバー率(Depth) |
CCS:9.5 x CLR:36 x |
SNVコール | DeepVariant |
SNVハプロタイピング | WhatsHap |
構造変異検出方法 | pbsv |
2倍体アセンブリ | HiCanu |
Japanese Genotype-phenotype Archive Dataset ID | JGAD000392 |
総データ量 | 31.8 TB(bam、vcf、fasta) |
コメント(利用にあたっての制限事項) | NBDC policy |
対象 | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル:177 + 30 検体 |
規模 | WGS |
対象領域(Target Captureの場合) | - |
Platform | PacBio [Sequel II] |
ライブラリソース | 日本人由来B細胞株・DNAバンクから分譲されたDNAサンプル |
検体情報(購入の場合) |
日本人由来B細胞株・DNAバンク(医薬基盤・健康・栄養研究所) |
ライブラリ作製方法(キット名) | the library prep. kit for SMRT sequencing by Pacific Biosciences |
断片化の方法 | Megaruptor |
ライブラリ構築方法 | Single-end |
リード長(除:バーコード、アダプタ、プライマー、リンカー) | 14,949 bp |
QC方法 | Qubit, NanoDrop, TapeStation, Femto Pulse, Pulsed-field gel electrophoresis |
マッピング方法 | minimap2(hg38-no_alt) |
平均カバー率(Depth) | CCS:9.06x |
SNVコール | DeepVariant |
SNVハプロタイピング | WhatsHap |
構造変異検出方法 | pbsv |
2倍体アセンブリ | HiCanu |
Japanese Genotype-phenotype Archive Dataset ID |
JGAD000622 (177検体) JGAD000725 (30検体) |
総データ量 |
JGAD000622: 7.5 TB(30検体:bam、vcf、contig_fasta、147検体:fastq) JGAD000725: 705 GB(fastq) |
コメント(利用にあたっての制限事項) | NBDC policy |
提供者情報
研究代表者: 森下 真一
所 属 機 関: 東京大学大学院新領域創成科学研究科
プロジェクト/研究グループ名: -
科研費/助成金(Research Project Number):
科研費・助成金名 | タイトル | 研究課題番号 |
---|---|---|
日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 先端ゲノム研究開発 | ヒトゲノム De Novo 情報解析テクノロジーの創出 | JP16km0405204 |
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム | ヒトゲノム De Novo 情報解析テクノロジーの創出 | JP21tm0424219 |
関連論文
タイトル | DOI | データID | |
---|---|---|---|
1 | Rapid and ongoing evolution of repetitive sequence structures in human centromeres. | doi: 10.1126/sciadv.abd9230 | JGAD000251 |
2 | JTK: targeted diploid genome assembler | doi: 10.1093/bioinformatics/btad398 | JGAD000706 |
3 | A landscape of complex tandem repeats within individual human genomes | doi: 10.1038/s41467-023-41262-1 | JGAD000392 JGAD000622 |
制限公開データの利用者一覧
研究代表者 | 所属機関 | 国・州名 | 研究題目 | 利用データID | 利用期間 |
---|---|---|---|---|---|
高地 雄太 | 東京医科歯科大学 難治疾患研究所 ゲノム機能多様性分野 | 日本 | 機能性遺伝子多型の網羅的解析を介した多因子疾患の病態解明 | JGAD000251 | 2023/04/10-2024/03/31 |
岡田 随象 | 大阪大学大学院 医学系研究科 遺伝統計学 | 日本 | 多層的オミクス解析による疾患病態の解明 | JGAD000251 JGAD000392 JGAD000622 JGAD000725 |
2024/03/05-2025/07/14 |